Arten von Tests in der Pädagogik. Testen als Methode der pädagogischen Kontrolle. Bildung ist

Derzeit gibt es ein methodisch schwaches Testangebot. Sie wird maßgeblich durch die unzureichende Entwicklung des kategorienkonzeptionellen Apparats der pädagogischen Prüfung bestimmt. Schlüsselbegriffe wie „Test“ und „Testaufgabe“ werden ständig verwechselt, die Terminologie der Testarten und Testaufgaben ist nicht spezifiziert. Darüber hinaus haben die meisten praktizierenden Lehrer keine Ahnung von so wichtigen Elementen zur Sicherung der Qualität experimenteller Arbeit wie Stichprobenrepräsentativität, Zuverlässigkeit und Validität.

Ausländische Psychologen nennen die Wissenschaft der Testtheorie Psychometrie (Psychometrika). und Lehrer - pädagogische Messung (pädagogische Messung). Da es im Russischen noch keinen gebräuchlichen Namen gibt. dann bleiben wir beim etablierten Namen dieser Wissenschaft – Testologie, die in einem pädagogischen, psychologischen oder soziologischen Kontext verwendet wird. Schon der Name „Testologie“ bezeichnet die Wissenschaft der Tests.

Pädagogische Testologie ist eine angewandte methodische Theorie der wissenschaftlichen Pädagogik, die sich mit der Entwicklung von Tests zur objektiven Überwachung der Vorbereitung von Schülern befasst.

Die Schlüsselbegriffe der Testologie sind pädagogische Aufgabe, Prüfung, Inhalt und Form der Aufgaben, Zuverlässigkeit und Validität von Messergebnissen. Darüber hinaus verwendet die Testologie Konzepte der statistischen Wissenschaft wie Stichprobenziehung und Allgemeinbevölkerung, Korrelation usw.

Der ursprüngliche Begriff der Testologie ist der Begriff der „pädagogischen Aufgabe“. Pädagogischer Auftrag- ein Mittel zur intellektuellen Entwicklung, Bildung und Ausbildung, das die Intensivierung des Lernens fördert, die Vorbereitung der Schüler erhöht und die Wirksamkeit der Lehrarbeit erhöht. Aufgaben können sowohl in Testform als auch in Nichttestform formuliert werden.

Ein weiteres wichtiges Konzept ist das Konzept des Tests. Derzeit gibt es mehrere Dutzend Definitionen des Begriffs „Test“. Für das normale Bewusstsein bedeutet „Test“ eine Übersetzung aus dem Englischen „Test“ – Probe, Test, Methode. Die Bedeutung dieses Wortes umfasst jede Methode der Überprüfung, auch die subjektive.

Wir stoßen oft auf ein vereinfachtes Verständnis dieses Begriffs als ein Aufgabensystem mit der Auswahl der richtigen Antwort aus den vorgestellten Optionen. Die Situation wird durch zahlreiche Beispiele von „Tests“ in Zeitungen und Zeitschriften sowie zahlreiche Buchveröffentlichungen unter demselben Namen verschärft. Oft handelt es sich bei solchen unterhaltsamen und sogar pädagogischen Aufgaben nicht um Tests, sondern um etwas, das ihnen nur oberflächlich ähnelt. Unterdessen sollten Unterschiede im Verständnis des Wesens von Tests in der Einstellung zu Tests selbst gesucht werden

S.L. Rubinstein gab 1938 die folgende Definition eines Tests: „Ein Test ist ein Test, der darauf abzielt, eine Person zu bewerten, den Rangplatz einer Person in einer Gruppe oder einem Team zu bestimmen und ihr Niveau festzulegen. Der Test richtet sich an die Person, das sollte er auch.“ dienen der Diagnose und Prognose.“ Sein Zeitgenosse, einer der Gründer der sowjetischen Psychotechnik S.G. Gellershtoin schrieb: „Ein Test ist ein Testexperiment, das den Charakter einer spezifischen Aufgabe hat, die eine bestimmte Aktivitätsform anregt und deren Durchführung, die einer quantitativen und qualitativen Bewertung zugänglich ist, als Symptom für die Verbesserung bestimmter Funktionen dient.“

Der Begriff „Test“ wurde in der sowjetischen psychologischen und pädagogischen Literatur bis in die 1980er Jahre verwendet. Dies bedeutete eine Aufgabe mit einer klaren und eindeutigen Version der richtigen Antwort, die sich auf bestimmte Standards konzentrierte.

Generell versteht das wissenschaftliche Denken heute den Begriff „Test“ nicht nur als Testmethode, sondern auch als wissenschaftliches und pädagogisches System. B.C. Avanesov betrachtet den Test als die Einheit einer Methode, des mit einer bestimmten Methode erzielten Ergebnisses und der Interpretation der Ergebnisse.

Der traditionelle Test ist eine standardisierte Methode zur Diagnose und Bestimmung des Vorbereitungsniveaus von Schulkindern. Bei einem solchen Test beantworten alle Probanden die gleichen Aufgaben, zur gleichen Zeit, unter den gleichen Bedingungen und mit den gleichen Regeln für die Bewertung der Antworten. Der Zweck der Verwendung dieser Tests besteht darin, das Ordnungsverhältnis zwischen den Probanden entsprechend dem während der Tests nachgewiesenen Wissensstand festzustellen und auf dieser Grundlage den Platz jedes einzelnen in einer bestimmten Gruppe getesteter Probanden zu bestimmen.

Auch der Begriff „didaktischer Test“ ist alles andere als eindeutig: Es werden die Begriffe „pädagogisch“, „Lehrer“, „Lehrtests“, „Leistungstests“, „Leistungstests“, „Wissenskontrolltests“, „Fähigkeitstests“ verwendet Synonyme: „Trainingstests“, „Kontrolltests“.

Gleichzeitig legen verschiedene Autoren ihr (nicht immer klar definiertes) Verständnis in diese Begriffe ein. Beispielsweise, so Ch. Kupisevich, „ist ein Lehrtest kein standardisierter Test, der „von Einzelpersonen erstellt werden kann, die die in ihren Schulungen erzielten Lernergebnisse überprüfen“.

CM. Vishnyakova gibt im Wörterbuch der Berufsbildung die folgende Definition von Test. Der Test ist zum einen eine Standardaufgabe, die bestimmte Anforderungen (Eindeutigkeit, Kürze und Einfachheit) erfüllt. Durch deren Umsetzung können Sie einige psychophysiologische Merkmale des Subjekts (geistige Entwicklung, Fähigkeiten) bewerten.

Feldqualitäten) sowie das Niveau seiner Kenntnisse, Fähigkeiten und Fertigkeiten. Zweitens. Der Test ist eine objektive Methode zur Überwachung der Qualität des Wissens eines Schülers, ein Werkzeug, das es ermöglicht, die Tatsache der Beherrschung zu erkennen. Drittens besteht es aus einer Kontrollaufgabe und einem Standard – einem Beispiel für die konsequente und korrekte Erledigung der Aufgabe. Die Aufgabe wird dem Probanden gestellt und der Standard wird vom Lehrer verwendet oder in ein technisches Tool eingebettet, um ihn mit der Antwort des Probanden zu vergleichen und eine Bewertung abzuleiten. Es ist zu beachten, dass diese Methode Folgendes erfordert:

  • - umfangreiche und teure methodische Unterstützung (eine Reihe von Tests für jedes Lernziel) und hochqualifizierte Testentwickler;
  • - Fragebogen für spezifische soziologische Studien;
  • - ein Informationsproblem mit einer bekannten Lösung, das dazu dienen soll, den korrekten Betrieb eines Computers zu überprüfen.

A. N. Mayorov betrachtet den Test als ein Instrument, das aus einem qualimetrisch verifizierten System von Testaufgaben, einem standardisierten Verfahren zur Durchführung und einer vorgefertigten Technologie zur Verarbeitung und Analyse der Ergebnisse besteht und dazu dient, die Qualitäten und Eigenschaften einer Person zu messen deren Änderung im Rahmen einer systematischen Ausbildung möglich ist.

B.C. Avanesov definiert pädagogische Prüfung als ein System paralleler Aufgaben mit zunehmendem Schwierigkeitsgrad und einer bestimmten Form, mit dem Sie den Grad und die Struktur der Vorbereitung der Testpersonen qualitativ und effektiv messen können.

Gleichzeitig unter System Es versteht sich, dass der Test solche Aufgaben enthält. die systembildende Eigenschaften besitzen. Dies wiederum. bedeutet die allgemeine Zugehörigkeit von Aufgaben zum gleichen Wissenssystem sowie deren Verknüpfung und Reihenfolge. Ein weiteres notwendiges Merkmal dieses Tests ist die Anordnung der Aufgaben mit zunehmendem Schwierigkeitsgrad – von der einfachsten zur schwierigsten. Mit anderen Worten: Das wesentliche formalsystembildende Merkmal des Tests ist der Unterschied der Aufgaben hinsichtlich ihres Schwierigkeitsgrades.

Index Testschwierigkeit und Testaufgaben ist sinnvoll und formell zugleich. Ein aussagekräftiger Indikator – denn bei einem guten Test kann der Schwierigkeitsgrad nur vom Inhalt und vom Grad der Vorbereitung der Testteilnehmer selbst abhängen, während bei einem schlechten Test die Ergebnisse spürbar von der Form der Aufgaben beeinflusst werden (insbesondere wenn es so ist). dem Inhalt nicht angemessen ist), schlechte Organisation der Prüfung, ggf. Betrugsmöglichkeit, Informationslecks.

Die formale Komponente des Schwierigkeitsindikators entsteht, wenn das Testen als ein Prozess der Konfrontation zwischen jeder Testperson und jeder ihr gestellten Aufgabe betrachtet wird. Es ist sinnvoll, das Ergebnis einer solchen Konfrontation zu berücksichtigen

Spezifisches Formular Testaufgaben deuten darauf hin. dass es sich bei den Testaufgaben nicht um Aufgaben handelt, sondern um Aufgaben, die in Form von Aussagen formuliert sind, ob wahr oder falsch. Solche Aufgaben werden je nach Kontext „Testaufgaben“ oder „Aufgaben in Testform“ genannt. Traditionelle Fragen sind das Gegenteil. Sie sind weder wahr noch falsch, und die Antworten darauf sind oft ausführlich und können nicht mit einem starren Standard verglichen werden. In diesem Sinne sind traditionelle Fragen und Antworten weniger Low-Tech als Testaufgaben oder Testaufgaben.

Man kann B.C. nur zustimmen. Avanesov, der darauf hinweist, dass nicht alle Inhalte in Form einer Testaufgabe dargestellt werden können. Es ist schwierig, Beweise, umfangreiche Berechnungen und ausführliche Beschreibungen in Testform auszudrücken.

Spezifischer Inhalt bedeutet, dass bei der Prüfung nicht das gesamte Studienmaterial geprüft wird, sondern nur der Teil des Lehrplans, der in den zu prüfenden Wissensinhalten der Studierenden enthalten ist. Der Rest wird nicht in die pädagogische Prüfung einbezogen. Gleichzeitig werden einige Elemente des zu prüfenden Wissens nur in der aktuellen Kontrolle verwendet, andere – in der Zwischenkontrolle, beispielsweise am Ende des akademischen Quartals. Und schließlich kommen in der Abschlusskontrolle Aufgaben zum Einsatz, deren richtige Beantwortung Kenntnisse über viele, teilweise sogar alle im Laufe des Schuljahres erlernten Themen erfordert. Besonderes Augenmerk sollte auf die Komplexität und Ausgewogenheit der Testinhalte gelegt werden. Gemäß dieser Bestimmung sollte ein zur abschließenden Wissenskontrolle entwickelter Test nicht auf dem Material eines Themas basieren, auch nicht auf dem grundlegendsten. Der Test muss auf der Grundlage der Ausgewogenheit aller Kursthemen gestaltet werden. Gleichzeitig ist es erforderlich, eine umfassende Einbeziehung sowohl theoretischer Fragestellungen und Methoden wissenschaftlichen und praktischen Handelns als auch der Fähigkeit zur effektiven Lösung grundlegender beruflicher Aufgaben in die Prüfung zu erreichen.

Gemäß dem Grundsatz der wissenschaftlichen Zuverlässigkeit umfasst die Prüfung nur die Inhalte der wissenschaftlichen Disziplin, die objektiv wahr und begründet sind. Sie sollten keine kontroversen Themen einbeziehen, also solche, für die es keine eindeutige Lösung gibt. Darüber hinaus dient der pädagogische Test der Kontrolle. Bei der Ausbildungs- und Lerndiagnostik ist es inakzeptabel, Fragen zu Noten, Motivation und Meinungen aufzunehmen.

Von der Länge her können Tests kurz (10–20 Aufgaben), mittel (40–60 Aufgaben) und lang (bis zu 500 Aufgaben) sein. Die optimale Anzahl an Aufgaben wird durch Kontrollziele bestimmt, die Praxis zeigt jedoch, dass es sich dabei um etwa 40-60 Aufgaben handelt. Gewöhnlich wird die Anzahl der Aufgaben im Test genanntTestlänge. Bisher ist es üblich, verschiedene Arten von Tests zu organisieren, die entsprechend unterschiedliche Tests erfordern. Auf diese Weise. Zusätzlich zu den oben genannten Ansätzen können Tests aus einer Reihe von Gründen klassifiziert werden.

1. Zunächst können je nach Erstellungsverfahren standardisierte und nicht standardisierte Tests unterschieden werden.

Das Verfahren und die Testbedingungen sowie die Methoden zur Verarbeitung und Interpretation der Ergebnisse werden standardisiert, was dazu führen soll, gleiche Bedingungen für die Probanden zu schaffen und zufällige Fehler und Fehler sowohl in der Phase der Durchführung als auch in der Phase der Ergebnisverarbeitung und Interpretation der Daten zu minimieren

Im Bildungsbereich gibt es eine Reihe von Problemen, die durch nicht standardisierte Tests gelöst werden können. Zu Überwachungszwecken sollte jedoch nur ein standardisiertes Prüfgerät verwendet werden.

  • 2. Basierend auf dem Grad der Homogenität der Aufgaben werden sie unterschieden homogen und heterogen Tests.
  • 3. Mittels Präsentation zuordnen leer Tests („Papier und Bleistift“).

Diese Tests lassen sich wiederum in zwei Typen unterteilen:

  • 1) verwenden Testbücher, in dem sich die Testaufgaben befinden und in dem der Proband die Ergebnisse festhält;
  • 2) verwenden Formen, in welchen Fächern die richtigen Antworten markieren bzw. eintragen (Antworten aufzeichnen). Formulare werden getrennt von Aufgaben dargestellt:

Thema, bei denen es notwendig ist, materielle Gegenstände zu manipulieren, hängt die Wirksamkeit dieser Tests von der Geschwindigkeit und Richtigkeit der Aufgaben ab;

Hardware - Tests mit Geräten zur Untersuchung der Merkmale von Aufmerksamkeit, Wahrnehmung, Gedächtnis und Denken;

praktisch, erschien vor relativ kurzer Zeit. Diese Tests ähneln der uns bekannten Laborarbeit (in Chemie, Physik, Biologie usw.). jedoch mit entsprechenden Anweisungen und Prüfgeräten versehen;

Computertests.

  • 4. Entsprechend der Entwicklungs- und Ausbildungsrichtung menschlicher Qualitäten:
    • - Intelligenztests, Offenlegung der Merkmale des letzteren;
    • - Tests der allgemeinen geistigen Fähigkeiten, der geistigen Entwicklung;
    • - spezielle Fähigkeitstests in verschiedenen Tätigkeitsfeldern;
    • - Lern-, Fortschritts- und Studienleistungstests;
    • - Tests zur Feststellung individueller Eigenschaften(Mist) Persönlichkeiten, Persönlichkeitstests(manchmal auch Temperamenttests genannt), mit deren Hilfe die Persönlichkeitsmerkmale des Probanden untersucht werden (Gedächtnis, Denken, Charakter, Emotionen usw.);
    • - Tests zur Feststellung des Bildungsniveaus(Bildung universeller menschlicher, sozialer und moralischer, allgemeiner intellektueller, allgemeiner kultureller und anderer Qualitäten);
    • - Leistungstests.

Richtig komponiert Tests von Bildungsleistungen (Lernen) bestimmte Anforderungen erfüllen müssen. Es ist ratsam, sie wie folgt durchzuführen:

  • - kurzfristig, sodass nicht viel Zeit benötigt wird;
  • - eindeutig, keine willkürliche Interpretation der Testaufgabe möglich;
  • - richtig, unter Ausschluss der Möglichkeit, mehrdeutige Antworten zu formulieren;
  • - kurz, erfordert prägnante Antworten;
  • - informativ, d.h. diejenigen, die die Möglichkeit bieten, die quantitative Bewertung der Testleistung mit ordinalen oder sogar intervallbezogenen Messskalen zu korrelieren; bequem, d.h. geeignet für die schnelle mathematische Verarbeitung von Ergebnissen;
  • - Standard, geeignet für einen breiten praktischen Einsatz - Messung des Lernniveaus einer möglichst großen Gruppe von Studierenden, die auf dem gleichen Ausbildungsniveau den gleichen Wissensumfang beherrschen.

Der Einsatz von Tests ist nur dann am effektivsten und liefert zuverlässige Schlussfolgerungen, wenn alle ausgewählten Testgruppen korrekt kombiniert werden. Daher sind Testtests immer komplex: Die Schlussfolgerungen einiger werden durch andere ergänzt und korrigiert.

Bei der Vorbereitung von Materialien für die Testkontrolle müssen Sie die folgenden Grundregeln beachten.

  • 1) Es können keine Antworten berücksichtigt werden, deren Unrichtigkeit zum Zeitpunkt der Prüfung von den Studierenden nicht begründet werden kann.
  • 2) Falsche Antworten müssen auf typischen Fehlern beruhen und plausibel sein.
  • 3) Unter allen vorgeschlagenen Antworten müssen die richtigen Antworten in zufälliger Reihenfolge angeordnet werden.
  • 4) Fragen sollten den Wortlaut des Lehrbuchs nicht wiederholen.
  • 5) Antworten auf einige Fragen sollten keine Anhaltspunkte für Antworten auf andere sein.
  • 6) Fragen sollten keine „Fallen“ enthalten.
  • 5. Durch die Art der Handlungen.

Verbal(im Zusammenhang mit der Notwendigkeit, mentale Handlungen auszuführen – verbale und logische Tests, Fragebögen zum Testen von Wissen, zum Festlegen von Mustern usw.). Diese Tests erfordern ausgeprägte Fähigkeiten und bestimmte Kenntnisse. Daher sind es in der Regel diejenigen Kinder, die in der Schule gut abschneiden, die bei diesen Tests bessere Ergebnisse erzielen.

Nonverbal(praktisch), verbunden mit der praktischen Manipulation von Objekten – Karten, Blöcken, Teilen. Nach Ansicht vieler Englischlehrer hängen nonverbale Tests weniger von den schulischen Leistungen, den Erziehungsbedingungen zu Hause und dem sozialen Status ab. Bei der Durchführung dieser Tests muss der Schüler Bilder, Diagramme, Objekte, Figuren usw. analysieren, vergleichen und daraus Schlussfolgerungen ziehen. Schüler mit hoher Intelligenz aus Familien mit niedrigem sozialen Status, die sich durch schlechtes Benehmen, häufige Disziplinverstöße etc. auszeichnen, schneiden bei nonverbalen Testaufgaben oft besser ab. .

6. Durch führende Orientierung.

Geschwindigkeitstests, Da es sich um einfache Probleme handelt, ist die Zeit für deren Lösung so begrenzt, dass kein einziger Proband Zeit hat, alle Probleme in der vorgegebenen Zeit zu lösen.

Leistungstests oder Leistung mit schwierigen Aufgaben. Die Lösungszeit dafür ist entweder überhaupt nicht oder nur sanft begrenzt. Der Erfolg und die Art und Weise der Lösung des Problems unterliegen der Bewertung. Ein Beispiel für solche Prüfungsaufgaben könnten Aufgaben für schriftliche Abschlussprüfungen eines Schulkurses sein.

Gemischte Tests die die Merkmale der beiden oben genannten vereinen. Diese Tests stellen Aufgaben unterschiedlicher Schwierigkeitsgrade dar. vom einfachsten bis zum sehr komplexen. Die Testzeit ist in diesem Fall begrenzt, reicht aber für die Mehrheit der Probanden aus, um die vorgeschlagenen Probleme zu lösen. Bewertet wird in diesem Fall sowohl die Geschwindigkeit der Aufgabenerledigung (Anzahl der erledigten Aufgaben) als auch die Richtigkeit der Lösung.

Diese Tests werden in der Praxis am häufigsten eingesetzt und umfassen die meisten Tests zu Bildungsleistungen, die zur Bedarfsüberwachung eingesetzt werden können.

7. Aufgrund der Natur der Objektivität.

Objektive Tests- Tests, deren Objektivität bei der Bewertung der Ergebnisse dadurch bestimmt wird, dass bei der Verarbeitung von Testergebnissen die Verwendung ihrer subjektiven Interpretationen durch den Tester nicht vorgesehen ist; zu dieser Gruppe von Tests gehören Tests zu schulischen Leistungen.

Projektiv Tests sind eine Reihe von Techniken, die im Rahmen des projektiven Ansatzes in der Psychologie entwickelt wurden und durch Unsicherheit gekennzeichnet sind. Mehrdeutigkeit der während des Tests verwendeten Reize. Dementsprechend ermöglicht dieser Ansatz eine große Vielfalt an Antworten und deren Interpretation.

8. Nach Orientierungsgrad.

Weitgehend ausgerichtet ermöglicht die Bewertung der Wirksamkeit des Lernprozesses anhand des Umsetzungsgrades eines seiner Hauptziele, d. h. des Grades, in dem die Studierenden das System der Kenntnisse, Fähigkeiten und Fertigkeiten während des Bildungsprozesses beherrschen.

Eng ausgerichtet zielt darauf ab, die Leistungen der Studierenden bei der Beherrschung einzelner Fächer, einzelner Themen usw. zu ermitteln.

  • 9. Je nach Verwendungszweck werden folgende Testgruppen unterschieden:
    • - Kenntnisse oder Verhalten des Schülers zu Beginn der Ausbildung ( definierender Test):
    • - Fortschritte im Lernprozess (formativer Test):
    • - Lernschwierigkeiten und ihre Ursachen während des Lernprozesses (Diagnosetest):
    • - Haupterfolge am Ende der Ausbildung ( summativer Test).

Der vorläufige Einstufungstest dient der Beurteilung der anfänglichen Fähigkeiten, ist in der Regel unkompliziert und deckt einen sehr kleinen Wissensbereich ab. Es kann ein Minimum an Grundkenntnissen zum Studienthema oder einen anderen begrenzten Satz erforderlicher Kenntnisse abdecken.

Ein formativer Test, der zur Überwachung des Lernfortschritts verwendet wird, konzentriert sich auf einen begrenzten Lernabschnitt, beispielsweise einen Abschnitt oder ein Kapitel, und versucht, alle wichtigen Ergebnisse dieses Abschnitts zu bewerten. Der Schwerpunkt liegt auf der Beurteilung des Grades der Beherrschung des Stoffs der zu bearbeitenden Aufgaben und der Rückmeldung an den Studierenden zur Korrektur einzelner Fehler.

Ein diagnostischer Test enthält eine relativ große Anzahl von Fragen, die für den jeweiligen Testbereich relevant sind. Da der Zweck des Tests darin besteht, Lernschwierigkeiten zu erkennen, liegt der Schwerpunkt auf den Antworten der Schüler auf eine bestimmte Frage oder Gruppe von Fragen, und die Gesamtpunktzahl ist zweitrangig. Dieser Test konzentriert sich in der Regel eher auf häufige Fehler, die Schüler machen, als auf den Versuch, die erwarteten Lernergebnisse umfassend zu ermitteln.

Der summative Test ist darauf ausgelegt, ein breites Spektrum an Lernergebnissen zu bewerten, die am Ende des Lernprozesses erwartet werden. Aus diesem Grund sind die Komplexität und Repräsentativität der Stichprobe wichtige Aspekte dieses Tests. dass anhand der Ergebnisse Punkte vergeben und der Grad der Zielerreichung der Schulung ermittelt werden. Um alle erwarteten Lernergebnisse angemessen zu erfassen, enthält ein summativer Test in der Regel Fragen, die einen höheren Schwierigkeitsgrad aufweisen als andere Testarten.

10. Nach Umfang der Nutzung.

Für Lehrer.

Zur Verwendung durch eine Gruppe von Lehrern oder die Verwaltung einer Bildungseinrichtung.

Zum Zweck der Auswahl und Bildung von Gruppen.

Richtige Antworten in Pädagogiktests werden mit einem „+“ gekennzeichnet.

1. Zu den Arten der Bestrafung in der Pädagogik gehören:

A) moralische und verbale Verurteilung,

b) Bußgelder und Strafen,

c) Entzug des Rechts auf Bildung.

2 - Test. Die Entwicklung der Pädagogik ist zurückzuführen auf:

a) eine Reihe wissenschaftlicher und technologischer Revolutionen im 20. Jahrhundert,

B) das bewusste Bedürfnis der Gesellschaft, die junge Generation zu bilden,

c) die Aufmerksamkeit der Elite für die Entwicklungsprobleme der unteren sozialen Schichten.

3. Pädagogik ist die Wissenschaft von

a) Erziehung eines Kindes in Bildungseinrichtungen,

B) Bildung und Erziehung einer Person, hauptsächlich im Kindes- und Jugendalter,

c) freie Persönlichkeitsbildung eines Menschen von der Geburt bis ins hohe Alter.

4. Sozialpädagogik ist eine Wissenschaft

A) über den Einfluss des sozialen Umfelds auf die Persönlichkeitsbildung eines Menschen,

b) über die Erziehung eines Kindes im Bildungssystem,

c) über die Formen der Interaktion zwischen Individuum und Gesellschaft.

5. Was ist die Weltanschauung einer Person?

A) Das System der Ansichten einer Person über die umgebende Realität – Natur und Gesellschaft.

b) Bewusstsein für das eigene „Ich“ im Prozess der sozialen Interaktion.

c) Beurteilung der Tätigkeit des Staates aus der Sicht eines Bürgers.

6. Das Fach Pädagogik ist

a) der Prozess des Unterrichtens eines Kindes in Bildungseinrichtungen,

b) der Kommunikationsprozess zwischen Lehrer und Schüler,

C) der Prozess der Bildung und Entwicklung der Persönlichkeit im Laufe ihrer Ausbildung und Erziehung.

7. Sozialisation ist

A) der Prozess des Eintritts eines Individuums in das soziale Umfeld durch die Beherrschung sozialer Normen,

b) der Prozess des Unterrichtens von Schülern in vorschulischen und schulischen Bildungseinrichtungen,

c) der Prozess der kontinuierlichen Bildung eines Individuums während seines gesamten Lebens.

8. Die Bildungsmethode ist

a) eine Methode zur Förderung der Entwicklung des Schülers durch die Vorlage eines Standards,

b) eine Methode zur Entwicklung von Kenntnissen, Fähigkeiten und Fertigkeiten, die für ein bestimmtes Alter relevant sind,

C) eine Methode zur Beeinflussung des Bewusstseins, des Willens und der Gefühle der zu erziehenden Person, um bestimmte Überzeugungen in ihr zu entwickeln.

9. Strafe ist

A) eine Methode der pädagogischen Einflussnahme, die unerwünschte Handlungen verhindert,

b) eine Methode zur Identifizierung von Persönlichkeitsfehlern,

c) die Hauptmethode der Bildung und Persönlichkeitsentwicklung.

10. Persönlichkeit wird in der Pädagogik durch die Gesamtheit ausgedrückt

a) Kenntnisse, Fähigkeiten und Fertigkeiten,

B) vom Einzelnen erworbene soziale Qualitäten,

c) biologische und soziale Merkmale.

11. Tests – Der Begriff „Pädagogik“

a) von Voltaire vorgeschlagen, eine neue Richtung der Philosophie zu benennen,

B) geht auf eine antike griechische Quelle zurück,

c) wurde im 19. Jahrhundert im Zusammenhang mit den Erfolgen der Entwicklungspsychologie anerkannt.

12. Quellen der Vorschulpädagogik als Wissenschaft sind

a) Volksmärchen und Legenden,

b) Regelungen im Bereich der Vorschulerziehung,

B) experimentelle Forschung und beste Lehrpraktiken.

13. Der Begriff „Pädagogik“ kommt von

a) lateinisch „Kind“ + „erziehen“,

b) Griechisch „Kind“ + „lehren“,

B) Griechisch „Kind“ + „führen“.

14. Das Fach Pädagogik ist

A) der Prozess der Bildung und Entwicklung der Persönlichkeit im Laufe ihrer Ausbildung und Erziehung,

b) Bildung didaktischer Werkzeuge für den Unterricht eines Kindes,

c) der rechtliche Rahmen, der die kontinuierliche Bildung des Kindes gewährleistet.

15. Bildung ist

A) ein zielgerichteter Bildungs- und Ausbildungsprozess,

b) der Prozess der Interaktion zwischen Lehrer und Schüler,

c) ein System staatlicher und kommunaler Institutionen.

16. Pädagogik als Wissenschaft

a) im antiken Griechenland in den Werken des Aristoteles entstanden,

b) im 20. Jahrhundert nach dem Erscheinen von Vygotskys Werken entstanden,

B) entstand im 17. Jahrhundert in den Werken von Comenius.

17. Didaktik ist ein Teilgebiet der Pädagogik,

a) Studium der Grundlagen der Persönlichkeitsbildung im Bildungsprozess,

B) Berücksichtigung pädagogischer Fragen,

c) Untersuchung von Bildungsfragen.

18. Staatliche Standards in der Pädagogik sind

A) offizielle, dokumentierte Anforderungen an den Inhalt des Bildungsprozesses und seine Bereitstellung,

b) die maximalen Indikatoren, die alle Studierenden anstreben sollten,

c) gesellschaftlich anerkannte Ergebnisse der Bildungsaktivitäten.

19. Das Niveau der Schulbildung in der Russischen Föderation umfasst

a) Grundschul-, Sekundar- und Oberschulbildung,

B) allgemeine Grundschulbildung, allgemeine Grundbildung und vollständige Allgemeinbildung,

c) Vorschule, Schule und Hochschulbildung.

20. Selbstbildung ist

A) der Prozess des Wissenserwerbs und der Entwicklung von Fähigkeiten, der von Schülern außerhalb des Bildungssystems in jedem Alter initiiert wird,

b) Unterrichten von Schülern zu Hause und Bestehen von Prüfungen an einer Bildungseinrichtung,

c) Vorbereitung auf die Abschlusszertifizierung außerhalb der Bildungseinrichtung.

Test Nr. 21. Pädagogisches Experiment –

a) spontane Veränderung im pädagogischen Prozess, motiviert durch Veränderungen der pädagogischen Bedingungen,

b) Erfassung von Sachverhalten im Ausbildungs- und Ausbildungsprozess,

C) kontrollierte Transformation des pädagogischen Prozesses zur Untermauerung einer wissenschaftlichen Hypothese.

22. Methoden der pädagogischen Forschung umfassen

a) Schuld und moralische Verurteilung,

b) Ermutigung und Belohnungen,

C) Studium der Lehrpraxis.

23. Der Systemaktivitätsansatz in der Pädagogik ist mit Namen verbunden

A) Wygotski, Elkonin, Dawydow,

b) Comenius, Bacon,

c) Zimnyaya, Kraevsky, Lebedev.

24. Der Begriff „Zone der nächsten Entwicklung“ wurde vorgeschlagen

A) Wygotski,

b) Zankow,

c) Elkonin.

25. Formatives Experiment in der Pädagogik

A) erfordert speziell konzipierte Aufgaben zur Prüfung der pädagogischen Hypothese,

b) unbedingt geheim vor den Studierenden durchgeführt wird,

C) gleichbedeutend mit einem natürlichen Experiment.

26. Ermittlungsexperiment in der Pädagogik

a) gleichbedeutend mit prägend,

b) auf verbindliche Änderungen der pädagogischen Bedingungen abzielen,

C) ist mit Messungen des tatsächlichen Zustands der Elemente des Bildungsprozesses verbunden.

Prüfen. 27. Es wurden erste grundlegende Studien zu den Altersmerkmalen von Kindern im Vorschul- und Grundschulalter durchgeführt

A) Piaget, Wygotski,

b) Bacon, Comenius,

c) Montessori.

28. Die theoretischen Grundlagen der Entwicklungspädagogik wurden entwickelt

a) Galperin, Talyzina,

B) Blonsky, Wygotski,

c) Elkonin, Davydov.

29. Spielaktivitäten im Grundschulalter

a) wird zum wichtigsten,

B) bleibt wichtig, aber hilfreich,

c) stoppt.

30. Persönliche Kommunikation wird zur Leitaktivität

A) im Jugendalter,

b) im Grundschulalter,

c) im Vorschulalter.

31. Formulierte zunächst die Prinzipien des Lernens

a) Aristoteles,

B) Komensky,

c) Suchomlinsky.

32. Aus dem Griechischen übersetzt bedeutet Pädagogik

A) „Ich nehme das Kind“

b) „ein Kind unterrichten“,

c) „Ich verstehe das Kind.“

33. Das System der pädagogischen Wissenschaften umfasst

A) Vorschulpädagogik,

b) Sozionik,

c) Entwicklungspsychologie.

34. Die kognitive Komponente des Selbstbewusstseins umfasst

a) Selbstbildung,

b) Selbstentwicklung,

C) das Wissen einer Person über sich selbst.

Test Nr. 35. Sozial bedingte persönliche Eigenschaften sind

a) hierarchische Beziehungen,

B) Wertverhältnisse,

c) Subjekt-Objekt-Beziehungen.

36. Die Regel von leicht nach schwer bezieht sich auf das Prinzip

A) systematisch und konsistent,

b) Logik,

c) Argumentation und Beweise.

37. Die innere Motivation einer Person zu einer bestimmten Art von Aktivität ist

B) Motiv,

c) Grund.

38. Ein zielgerichteter Prozess der Aus- und Weiterbildung im Interesse des Einzelnen ist

A) Bildung

b) Entwicklung,

Eine Reihe von Forschern weist darauf hin, dass der konzeptionelle Apparat der Theorie pädagogischer Messungen noch nicht vollständig ausgebildet ist. Insbesondere gibt es keine allgemein anerkannte Definition des Tests. Jeder Forscher spiegelt in der Definition des Tests seine eigene Sicht auf das Problem des pädagogischen Testens wider.

Es gibt viele Definitionen von TEST, die sich deutlich voneinander unterscheiden. Lassen Sie uns einige davon auflisten.

Laut dem Unified State Examination-Wörterbuch ist ein TEST ein Messverfahren, das Anweisungen und eine Reihe von Aufgaben umfasst und umfangreichen Tests und Standardisierungen unterzogen wurde.

Rubinshtein S.L. gab folgende Definition: TEST ist ein Test, der darauf abzielt, eine Person zu benoten, den Rangplatz einer Person in einer Gruppe oder einem Team zu bestimmen und ihr Niveau festzustellen.

Diese Definition wird nur unter dem Gesichtspunkt der Zielerreichung formuliert, ohne anzugeben, wie dieses Ziel erreicht wird, und vor allem definiert sie den Test nicht als Messinstrument.

K. Ingenkamp - TESTING ist eine Methode der pädagogischen Diagnostik, mit deren Hilfe eine Verhaltensprobe, die die Voraussetzungen oder Ergebnisse des Bildungsprozesses darstellt, den Grundsätzen der Vergleichbarkeit, Objektivität, Zuverlässigkeit und Gültigkeit von Messungen maximal entsprechen muss aufbereitet und interpretiert werden und für den Einsatz in der pädagogischen Praxis bereit sein.

Die Definition von K. Ingenkamp betrachtet eine Methode, kein Mittel der pädagogischen Diagnostik und charakterisiert die Testaufgaben in keiner Weise.

A. N. Mayorov gibt die folgende Definition des Tests, der 1997-1998 entwickelt wurde. von einer Autorengruppe bei der Entwicklung des Begriffsapparates der Testologie:

Ein TEST ist ein Werkzeug, das aus einem qualimetrisch verifizierten System von Testaufgaben, einem standardisierten Verfahren zur Durchführung und einer vorgefertigten Technologie zur Verarbeitung und Analyse der Ergebnisse besteht und dazu dient, die Qualität und Eigenschaften einer Person zu messen, deren Veränderung möglich ist der Prozess der systematischen Ausbildung.

V. S. Avanesov definiert den PÄDAGOGISCHEN TEST als ein System paralleler Aufgaben mit gleichmäßig steigendem Schwierigkeitsgrad und einer bestimmten Form, das es ermöglicht, das Niveau qualitativ und effektiv zu messen und die Struktur der Vorbereitung der Schüler zu bewerten.

In einem seiner neuesten Werke hat V. S. Avanesov (2005) die Formulierung etwas gemildert:

PÄDAGOGISCHER TEST ist definiert als ein System paralleler Aufgaben mit zunehmendem Schwierigkeitsgrad und einer bestimmten Form, mit dem Sie den Grad und die Struktur der Vorbereitung der Testteilnehmer qualitativ und effektiv messen können.

Ein Vergleich beider Definitionen zeigt, dass die Forderung nach einem gleichmäßigen Anstieg der Aufgabenschwierigkeit entfällt. Dies liegt daran, dass es recht einfach ist, für eine Erhöhung des Schwierigkeitsgrades von Aufgaben zu sorgen. Um dies zu erreichen, konzentriert sich der Testautor auf die unterschiedliche Komplexität der Elemente des Themenbereichs. Für jedes Element werden Aufgaben zusammengestellt und dann empirisch überprüft, dass Aufgaben unterschiedlicher Schwierigkeit tatsächlich gelöst werden. Im Test selbst werden die Aufgaben nach steigendem Schwierigkeitsgrad geordnet.



Die Forderung nach einer gleichmäßigen Steigerung des Schwierigkeitsgrades einer Aufgabe lässt sich in der Praxis nur äußerst schwer umsetzen. Obwohl ein solcher Test eine lineare Schwierigkeitsskala liefern würde, würde dies den Messfehler verringern.

Durch den Wegfall des Erfordernisses einer gleichmäßigen Erhöhung der Aufgabenschwierigkeit wird die Erstellung des Tests erheblich vereinfacht. Beachten Sie jedoch, dass sich in diesem Fall herausstellt, dass die Schwierigkeitsskala nicht linear ist und den gegebenen Schwierigkeitsbereich der Testaufgaben ungleichmäßig abdeckt. Dies verringert natürlich die Genauigkeit des pädagogischen Tests als Messinstrument.

Avanesovs Definition

Um diese Definition besser zu verstehen, ist es hilfreich, eine kurze Erläuterung der wichtigsten Begriffe zu geben.

System bedeutet, dass der Test Aufgaben enthält, die systembildende Eigenschaften haben. Hierbei ist zunächst die generelle Zugehörigkeit von Aufgaben zum gleichen Wissenssystem hervorzuheben, d.h. zu einer akademischen Disziplin, deren Zusammenhang und Ordnung. Für die Abschlusszertifizierung von Schulabsolventen ist es notwendig, integrative Aufgaben zu entwickeln, deren Inhalt das Wissenssystem abdeckt.

Spezifische Form von Testaufgaben Der Unterschied besteht darin, dass es sich bei den Testaufgaben nicht um Fragen oder Aufgaben handelt, sondern um Aufgaben, die in Form von Aussagen formuliert sind, die je nach Antwort wahr oder falsch sind. Herkömmliche Fragen hingegen sind weder wahr noch falsch, und die Antworten darauf sind oft so vage und ausführlich, dass die Feststellung ihrer Richtigkeit insgesamt einen erheblichen Aufwand an intellektueller Energie der Lehrer erfordert. In diesem Sinne sind traditionelle Fragen und Antworten Low-Tech und sollten daher nicht in den Test einbezogen werden.

Spezifischer Inhalt bedeutet, dass in der Prüfung nur solches Kontrollmaterial verwendet wird, das dem Inhalt der akademischen Disziplin entspricht; der Rest wird unter keinem Vorwand in die pädagogische Prüfung einbezogen. Beispielsweise ist die Überprüfung des intellektuellen Entwicklungsstandes Gegenstand psychologischer Tests. Testinhalte existieren, werden gespeichert und werden in einer von vier grundlegenden Elementformen übertragen. Außerhalb von Testformen existiert weder der Test noch sein Inhalt.

Ein theoretisch begründetes Kriterium zur inhaltlichen Einordnung des sogenannten Homogentests ist das Kriterium der Aufgabenschwierigkeit. Außerschulische Inhalte (zum Beispiel die Prüfung des geistigen Entwicklungsstandes) werden nicht in die pädagogische Prüfung einbezogen. Dies ist ein Thema von psychologischer Dimension.

Zunehmender Schwierigkeitsgrad Aufgaben können im übertragenen Sinne mit Barrieren auf einem Stadionlaufband verglichen werden, bei denen jede weitere höher ist als die vorherige. Nur wer besser vorbereitet ist, kann die Distanz laufen und alle Hürden erfolgreich überwinden. Da in einer pädagogischen Prüfung die Aufgaben nach dem Prinzip steigender Schwierigkeit geordnet werden, „scheitern“ manche Prüfungsteilnehmer bereits bei der einfachsten, ersten Aufgabe, während andere bei den Folgeaufgaben durchfallen. Ein Schüler mit durchschnittlicher Vorbereitung kann nur die Hälfte der Testaufgaben richtig beantworten, und schließlich sind nur die sachkundigsten Schüler in der Lage, die Aufgaben mit dem höchsten Schwierigkeitsgrad am Ende des Tests richtig zu beantworten.

Die Schwierigkeit einer Aufgabe kann auf zwei Arten bestimmt werden: a) spekulativ, basierend auf der geschätzten Anzahl und Art der mentalen Operationen, die für die erfolgreiche Erledigung von Aufgaben erforderlich sind, und b) nach empirischer Prüfung von Aufgaben durch Berechnung des Anteils falscher Antworten. Viele Jahre lang berücksichtigte die klassische Testtheorie nur empirische Schwierigkeitsmaße. In neuen Versionen psychologischer und pädagogischer Testtheorien wird der Natur der geistigen Aktivität der Schüler bei der Durchführung von Testaufgaben unterschiedlicher Art mehr Aufmerksamkeit geschenkt (1).

Dazu können wir noch ein weiteres Kriterium hinzufügen – dieses Kriterium für die logische Sicherheit einer Testaufgabe. Man kann es folgendermaßen formulieren: Eine Aufgabe ist dann definiert, wenn sie positiv oder negativ beantwortet werden kann und es einen wirksamen Prozess gibt, um eine solche Antwort zu finden.

Antwort zu einer pädagogischen Prüfungsaufgabe ist ein kurzes Urteil, das in Inhalt und Form auf den Inhalt der Aufgabe bezogen ist. Jeder Aufgabe sind richtige und falsche Antworten zugeordnet. Die Genauigkeitskriterien werden vorab von den Testautoren festgelegt. Die Wahrscheinlichkeit einer richtigen Antwort auf eine Aufgabe hängt vom Verhältnis des Wissensstands der Testperson zum Schwierigkeitsgrad der Aufgabe ab. Sofern vergleichbare Skalen vorliegen, wird diese Wahrscheinlichkeit als Wert zwischen Null und Eins ausgedrückt. Die Bewertung der Antworten nach dem Grad ihrer Richtigkeit erfolgt eher selten, bei Bedarf werden jedoch Aufgaben mit unterschiedlich korrekten Antworten erstellt. Anweisungen für Probanden können in solchen Fällen wie folgt lauten: „Kreisen Sie die Zahl (drücken Sie die Taste mit der Zahl) der richtigsten Antwort ein!“

Durch Tests werden Wissen, Fähigkeiten, Fertigkeiten und Ideen häufiger getestet als andere Zeichen. Aus pädagogischer Sicht ist es sinnvoll, zwei Hauptindikatoren für die Qualität des Wissens einzuführen – den Wissensstand und die Wissensstruktur. Zur Bewertung werden Punkte sowohl für das Wissen als auch für das Unwissen über alle erforderlichen Bestandteile des zu prüfenden Materials erfasst. Um diesen Prozess zu objektivieren, müssen alle Komponenten identisch sein. Auch die Regeln für die Benotung der Fächer sind die gleichen. Diese Bedingungen eröffnen den Weg für einen objektiven Vergleich individueller Wissens- und Nichtwissensstrukturen.

Wissensstand werden durch die Analyse der Antworten jedes Schülers auf alle Testaufgaben ermittelt. Je mehr richtige Antworten vorhanden sind, desto höher ist die individuelle Testpunktzahl der Probanden. Typischerweise wird dieses Testergebnis mit dem Konzept des „Wissensstandes“ in Verbindung gebracht und einem Klärungsverfahren unterzogen, das auf dem einen oder anderen Modell der pädagogischen Messung basiert. Der gleiche Wissensstand kann durch die Beantwortung unterschiedlicher Aufgaben erreicht werden. Beispielsweise erhielt ein Student in einem Test mit dreißig Aufgaben zehn Punkte. Diese Punkte erhält man höchstwahrscheinlich durch die richtige Beantwortung der ersten zehn relativ einfachen Aufgaben. Die in einem solchen Fall inhärente Folge von Einsen und dann Nullen kann als korrektes Wissensprofil des Schülers bezeichnet werden.

Liegt das Testergebnis unter dem geforderten Niveau (Messkriterium), dann geben die in diesem Fall demonstrierten Kenntnisse, Fähigkeiten, Fertigkeiten und Ideen Aufschluss über den Grad der Vorbereitung des Testteilnehmers auf das Unterkriterium.

In der Wissenschafts- und Kunstgeschichte gibt es viele Fälle, in denen das zum jeweiligen Zeitpunkt bestehende Kriterium der Anforderungen an Kenntnisse (oder Fertigkeiten) die öffentliche Anerkennung individueller Begabungen verhinderte. Daher kam es oft erst dann zu einer Anerkennung, wenn sich die Bewertungskriterien änderten. Meistens nach dem Tod der Autoren vieler unsterblicher Werke aus den Bereichen Wissenschaft, Musik, Malerei usw. Ein markantes Beispiel dieser Art ist die Änderung der Kriterien für die Bewertung der Werke von Van Gogh, den Werken vieler Impressionisten Künstler, Formalisten usw. Solche Tatsachen sind beispielsweise auch bekannt. Der spätere Nobelpreisträger Albert Einstein konnte im Sommer 1895 die Prüfungen am Zürcher Polytechnikum nicht bestehen und der weltberühmte Pianist S. Richter wurde zweimal wegen allgemeinen Studienversagens vom Konservatorium verwiesen.

Wissensstruktur Die Bewertung erfolgt anhand einer Abfolge richtiger und falscher Antworten auf Aufgaben mit steigendem Schwierigkeitsgrad. Die Darstellungsform der individuellen Wissens- und Unwissenheitsstruktur ist das Wissensprofil des Faches, dargestellt durch eine Folge von Einsen und Nullen, die jeder Schüler erhält.

Wissensprofil stellt einen geordneten Satz von Ergebnissen (Zeilenvektor) in einer Matrix von Testergebnissen dar. Wenn der Proband die ersten, relativ einfachen Aufgaben richtig beantwortet, können wir über die richtige Struktur des Wissens sprechen. Das Profil wird als korrekt bezeichnet, wenn in der Bewertungszeile des Probanden alle Nullen auf alle Einsen folgen.

Ergibt sich das gegenteilige Bild (der Proband antwortet bei schwierigen Aufgaben richtig und bei leichten Aufgaben falsch), dann widerspricht dies der Logik des Tests und daher kann eine solche Wissensstruktur als invertiert bezeichnet werden. Dies geschieht selten und am häufigsten aufgrund eines Verstoßes gegen die Anforderung, Aufgaben in der Reihenfolge zunehmender Schwierigkeit anzuordnen. Bei korrekter Durchführung des Tests gibt jedes Profil Auskunft über die Struktur des Wissens.

Jede Bildungseinrichtung sollte in erster Linie danach streben, korrekte individuelle Wissensstrukturen zu bilden, in denen es keine Lücken (Wissenslücken) gibt, und auf dieser Grundlage das Ausbildungsniveau zu erhöhen.

Ein Mensch kann nicht gut lernen, wenn ihm die Lücken zwischen Bekanntem und Unbekanntem zu groß sind. Der Wissensstand hängt maßgeblich von den persönlichen Anstrengungen und Fähigkeiten der Studierenden ab. Während die Struktur des Wissens von der richtigen Organisation des Bildungsprozesses, von der Individualisierung der Ausbildung, von den Fähigkeiten des Lehrers und von der Objektivität der Kontrolle abhängt. Im Allgemeinen von allem, was uns normalerweise fehlt.

Als Ergebnis der Analyse der gegebenen Testdefinitionen neigen wir zu dem Schluss, dass die folgende Definition akzeptabel sein könnte:

PÄDAGOGISCHER TEST ist ein System von Testaufgaben mit unterschiedlichem Schwierigkeitsgrad, mit dem Sie den Grad und die Struktur der Vorbereitung der Testteilnehmer qualitativ und effektiv messen können.

Diese eher prägnante und vollständige Definition basiert auf der Definition von V. S. Avanesov mit einigen Modifikationen. Schauen wir uns diese Unterschiede an.

1. Anstelle des Wortes „Aufgabe“ wurde der Begriff „Testaufgabe“ verwendet. Dadurch konnte das Erfordernis einer „bestimmten Form“ ausgeschlossen werden, da es im Begriff „Aufgabe in Testform“ und damit im Begriff „Testaufgabe“ enthalten ist.

2. Das Erfordernis der „Parallelität“ von Aufgaben wurde abgeschafft. Diese Anforderung wurde von V. S. Avanesov eingeführt, um die „Überlebensfähigkeit“ des Tests zu erhöhen und die Möglichkeit einer wiederholten Verwendung des Tests durch Variation paralleler Aufgaben darin sicherzustellen. Unter diesem Gesichtspunkt ist dies eine völlig vernünftige Anforderung. Wenn wir jedoch den Test als solchen definieren und von der „unsinkbaren“ Eigenschaft abstrahieren, die für die Praxis seiner Anwendung attraktiv ist, kann das Parallelitätserfordernis eliminiert werden.

3. Die Anforderung „zunehmender Schwierigkeitsgrad“ wurde durch die Anforderung „variabler Schwierigkeitsgrad“ ersetzt. Tatsache ist: Wenn wir Testaufgaben mit unterschiedlichem, bekanntem Schwierigkeitsgrad haben, können wir diese beim Erstellen eines Tests problemlos in beliebiger Reihenfolge anordnen, insbesondere in der Reihenfolge zunehmender Schwierigkeit.

Einige Autoren schlagen vor, die Aufgaben nach abnehmendem Schwierigkeitsgrad zu ordnen und plädieren für eine optimale Verteilung des mentalen Stresses der Testteilnehmer über die Zeit. Gegen Ende des Tests, wenn die Probanden müde sind, empfiehlt es sich, ihnen einfachere Aufgaben zu stellen.

Manchmal wird vorgeschlagen, den Testteilnehmern die Möglichkeit zu geben, eine Aufgabe auszuwählen, die ihre Fähigkeiten mit dem Aufwand vergleicht, den sie für die Durchführung des Tests benötigen. Dadurch können sie die besten Ergebnisse erzielen.

Bei Computertests wird häufig eine zufällige Reihenfolge der Aufgabenpräsentation verwendet, während der Test selbst „on the fly“ erstellt wird. Testelemente werden gemäß einem bestimmten, vom Testentwickler festgelegten Verfahren automatisch aus der Elementbank abgerufen. Wenn die Präsentationsreihenfolge für alle Fächer gleich ist, könnten sie in derselben Computerklasse an benachbarten Computern die Antworten anderer Fächer ausspionieren. Wenn Aufgaben in zufälliger Reihenfolge präsentiert werden, verringert sich die Wahrscheinlichkeit eines solchen Verstoßes gegen das Testverfahren.

Seite 19 von 25

Definition eines pädagogischen Tests

Pädagogischer Test– ein System von Aufgaben mit einer bestimmten Form, einem bestimmten Inhalt und zunehmendem Schwierigkeitsgrad – ein System, das mit dem Ziel erstellt wurde, die Struktur objektiv zu bewerten und den Vorbereitungsstand der Schüler qualitativ zu messen. Test – entsprechend der direkten Bedeutung des englischen Wortes test – jede Probe, jeder Test. In diesem Verständnis wird der Begriff „Test“ in Technik, Biologie, Medizin und Chemie verwendet. Test in der psychologischen und pädagogischen Forschung– nach Zeit und Schwierigkeit normierte Aufgabensätze, die zur vergleichenden Untersuchung von Gruppen- und Einzelmerkmalen verwendet werden.

Tests sind in der angewandten Psychologie weit verbreitet. In diesem Bereich wurden methodische Kriterien für die Konzeption, Anwendung, Verifizierung und Durchführung von Tests entwickelt. Diese Kriterien sollten mit einigen Klarstellungen als verbindlich für pädagogische Prüfungen anerkannt werden. Da der Test als Messinstrument fungiert, muss er strengen und klaren methodischen Anforderungen genügen. Ein zufällig ausgewählter Aufgabensatz kann nicht als Test bezeichnet werden.

Tests können nicht als universelles und umfassendes Instrument zur Untersuchung des Bildungsniveaus angesehen werden. Da jede Testaufgabe und der gesamte Test aus homogenen Aufgaben bestehen, geht es darum, einen begrenzten Komplex von Persönlichkeitseigenschaften zu identifizieren. Je weniger Merkmale in dem Komplex enthalten sind, desto klarer ist die mögliche Interpretation der Ergebnisse und desto besser sind die Ergebnisse Der Test erfüllt seine Funktion. Am besten ist es, wenn die Aufgabe nur ein Zeichen, eine Eigenschaft (Eigenschaft) der Persönlichkeit offenbart. Eine Aufgabe, die darauf abzielt, es sofort zu erkennen und ohne die Möglichkeit, eine Gruppe von Zeichen anschließend zu isolieren, erschwert die Interpretation. Der Erfolg oder Misserfolg des Probanden erhält keine einheitliche und eindeutige Bewertung, da er von verschiedenen Anzeichen abhängen kann. Ohne eine solche Beurteilung wird ein Lehrer nicht in der Lage sein, eine Schlussfolgerung über die Gründe zu ziehen, die das Endergebnis bestimmt haben, und es ist unwahrscheinlich, dass er klare Schlussfolgerungen formulieren und pädagogische Maßnahmen korrigieren wird.

Die Prüfmethode hat bestimmte Anwendungsgrenzen. Es gibt Merkmale der Erziehung eines Schulkindes, die so komplex und vielschichtig sind, dass sie nicht mit Testmethoden identifiziert werden können. Ein Testäquivalent dessen, was man die allgemeine Vorbereitung oder Bildung eines Schülers nennen könnte, wurde noch nicht gefunden. Viele Lehrer und Methodiker legen großen Wert auf diese Eigenschaft. Tests haben lediglich die Fähigkeit, einzelne Komponenten dieses komplexen Ganzen abzubilden.

Wir müssen auch berücksichtigen, dass Merkmale, die keinen eindeutigen Inhalt haben, überhaupt nicht Gegenstand einer Prüfung werden können. Insbesondere die Merkmale der allgemeinen Entwicklung und Bildung sind auch durch unklare Inhalte gekennzeichnet. Der Lehrer kann natürlich vorab festlegen, dass dieses Merkmal seiner Ansicht nach aus diesen und jenen einfachen und messbaren Einzelmerkmalen besteht. In diesem Fall kann die von ihm gestellte Aufgabe gelöst werden. Die Frage ist nur, ob er seine Sicht auf dieses Merkmal begründen kann.

Betrachten wir den Zusammenhang zwischen Persönlichkeitstests und anderen quantitativen Methoden. Es wäre ein Fehler, alle quantitativen Methoden zur Erforschung von Bildungsproblemen als Tests zu betrachten. Der Kern der bewertenden Klassifizierungsmethode besteht darin, dass Personen („Gutachter“, „Richter“), die mit einem bestimmten Objekt gut vertraut sind, es anhand bestimmter Standardkriterien, Skalen usw. bewerten. Durch entsprechende statistische Aufbereitung werden Einzelbewertungen in einen aggregierten quantitativen Indikator umgewandelt. Personen, die Gegenstand von Beurteilungseinstufungen sind, werden jedoch nicht nur keinen standardisierten Tests unterzogen, sondern werden in vielen Fällen auch nicht einmal über die durchgeführte Beurteilung informiert. Die Vorstellungen, auf deren Grundlage Bewerter ihre Urteile fällen, bilden sich in ihnen durch langfristige Kommunikation oder Beobachtungen im Alltag heraus.

Wie alle anderen Methoden der pädagogischen Kontrolle hat der Test bestimmte Vor- und Nachteile. Bei richtiger und geschickter Anwendung kann es dem Lehrer viele wichtige Informationen liefern, die er auf andere Weise nicht erhalten kann. Der Vorteil des Tests besteht darin, dass alle darin formulierten Aufgaben, nachdem sie zuvor gründlich durchdacht und experimentell getestet wurden, in kürzester Zeit die für den Forscher interessanten Eigenschaften des Studierenden vollständig offenbaren. Ein weiterer, noch wichtigerer Vorteil des Tests ist seine Objektivität. Es ist bekannt, dass der Lehrer unabsichtlich ein gewisses Maß an Subjektivität in die Beurteilung der Qualitäten der Schüler einbringt – in diesem Fall in die Beurteilung der Schüler selbst. Diese Schattierung des Subjektivismus wird oft damit gerechtfertigt, dass der Lehrer, der über jeden Schüler einen großen Bestand an Beobachtungen gesammelt hat, die Tatsache nicht loswerden kann, dass einige Verhaltensmerkmale seiner tiefen Überzeugung nach illegal entstanden sind das Ergebnis einer ungünstigen Kombination von Unfällen.

Ein Forscher, der zum ersten Mal Tests in seiner Arbeit einsetzt, muss die wichtigsten Probleme lösen wie: 1) die Entwicklung des Tests selbst; 2) Erreichen seiner zufriedenstellenden Zuverlässigkeit; 3) Erzielung einer zufriedenstellenden Testvalidität.

Wissenschaftlich fundierter Test ist eine Methode, die etablierte Standards für Zuverlässigkeit und Validität erfüllt. Die Anforderungen an die Überprüfung des Tests auf Zuverlässigkeit und Validität setzen einen wichtigen methodischen Gedanken um, dass nur eine wahre Methode zu wahrem Wissen führt. Somit hängt die Qualität pädagogischer Informationen von der Qualität der dafür verwendeten Instrumente ab.

Der Test kann nur dann als abgeschlossen betrachtet werden, wenn er ein zufriedenstellendes Ergebnis erhält. Zuverlässigkeit. Das Konzept der Zuverlässigkeit beim Testen hat zwei Bedeutungen. Einerseits meinen wir die Zuverlässigkeit des Tests als spezifisches Instrument. Wenn wir andererseits von Zuverlässigkeit sprechen, meinen wir die relative Unveränderlichkeit der Sache, die wir messen. Bei der Beurteilung der Zuverlässigkeit eines Tests wird davon ausgegangen, dass der Test umso zuverlässiger ist, je homogener er ist.

Gültigkeit– inwieweit der Test seinem beabsichtigten Zweck entspricht. Bei der Feststellung der Zuverlässigkeit findet der Forscher im Test selbst alles Notwendige und Ausreichende: Er vergleicht einen Teil der Aufgaben (mit geraden Zahlen) mit einem anderen (mit ungeraden Zahlen). Dies reicht jedoch nicht aus, um die Gültigkeit festzustellen. Die Gültigkeit kann nur durch den Vergleich der Testergebnisse mit einem Kriterium und einer Bewertung außerhalb des Tests abgeleitet werden. es wird üblicherweise als externes Kriterium bezeichnet.



Inhaltsverzeichnis
Pädagogische Diagnostik im Bildungsprozess.
DIDAKTISCHER PLAN
Das Konzept der pädagogischen Diagnostik
Historische Aspekte der Entstehung der Diagnostik als spezifischer Erkenntnisform
Persönlichkeit als Gegenstand pädagogischer Diagnostik
Persönlichkeitsentwicklung in verschiedenen Altersabschnitten
Grundsätze der Lehrertätigkeit im Prozess der pädagogischen Diagnostik
Diagnostische Tätigkeit eines Lehrers
Wissenschaftliche Erkenntnisse und Diagnostik
Psychodiagnostik und pädagogische Diagnostik
Das Wesen und die Funktionen der pädagogischen Diagnostik

Vorlesung 8. Pädagogische Tests, ihre Art und Zweck.

1. Normativ-orientierte und kriterienorientierte Ansätze in pädagogischen Dimensionen.

2. Testaufgaben und Testarten.

3. Klassifizierung der Arten pädagogischer Tests.

4. Konzeptioneller Apparat: Vortestaufgabe, Testaufgabe, pädagogischer Test.

1. Normativ-orientierte und kriterienorientierte Ansätze in pädagogischen Dimensionen

Allgemeine Ansätze zur Interpretation der Ergebnisse pädagogischer Messungen. Bei der pädagogischen Messung kann die Interpretation der Schülerergebnisse variieren, je nachdem, wie die Schülerergebnisse verglichen werden. Ein Ansatz vergleicht die Punktzahl jedes Schülers mit den Ergebnissen einer bestimmten Gruppe – einer Stichprobe von Schülern, die denselben Test absolviert haben –, um zu bestimmen, wo die einzelnen Punkte im Verhältnis zum Gruppendurchschnitt stehen (normbasierter Ansatz). Nach einem anderen Ansatz werden die Ergebnisse der Testpersonen in Bezug auf den in den Test einbezogenen Inhaltsbereich interpretiert und mit bestimmten Leistungskriterien versehen (kriterienorientierter Ansatz).

Beide Ansätze liefern Informationen über die Vorbereitung der Studierenden, sind jedoch unterschiedlicher Natur. Entsprechend dieser Ansätze zur Interpretation von Testergebnissen werden normativ orientierte und kriterienorientierte Tests unterschieden.

Regulierungsorientierter Ansatz und Normen. Standardisierung von Tests . Das Hauptziel normativer Tests besteht darin, Testteilnehmer anhand der Testergebnisse zu differenzieren. Bei der Interpretation der Ergebnisse kann die relative Position des Probanden anders beurteilt werden, da er im Vergleich zu einer schwächeren Gruppe besser aussieht als zu einer stärkeren Gruppe. Um die Testergebnisse richtig zu interpretieren, muss die Punktzahl jedes Schülers verglichen werden Standards für die Durchführung des Tests.

Normen sind eine Reihe von Indikatoren, die die Testergebnisse einer klar definierten Stichprobe von Testteilnehmern widerspiegeln – einer relevanten normativen Gruppe, die repräsentativ für die allgemeine Population der getesteten Studenten ist. Zu den Normen gehören in der Regel der Durchschnittswert der Testergebnisse und ein Indikator für die Streuung (Variabilität) um den Durchschnittswert aller anderen Ergebnisse, die von einer repräsentativen Stichprobe getesteter Schüler erzielt wurden (Methoden zur Berechnung des Durchschnittswerts und Variabilitätsindikatoren werden in Kapitel 9 beschrieben). Mithilfe von Standards können Sie die Position jedes Ergebnisses im Verhältnis zur durchschnittlichen Punktzahl im Test ermitteln und sehen, um wie viel das Ergebnis des Schülers über oder unter dem Durchschnitt liegt.

Der Prozess der Definition von Standards wird aufgerufen Standardisierung des Tests. Die Standardisierung erfolgt stets an einer repräsentativen Probandenstichprobe, deren Bildung ein zwingender Schritt bei der Festlegung von Testnormen ist.

Relativität von Normen und Stichprobenstandardisierung . Teststandards, die zur Interpretation der Ergebnisse aller Schüler bei jedem Test geeignet sind; existiert nicht. Der Geltungsbereich einer Norm ist auf einen bestimmten Test und eine bestimmte Gruppe von Probanden beschränkt, daher sind die Normen nicht absolut und nicht konstant. Sie spiegeln die Ergebnisse der Standardisierungsstichprobe zum Zeitpunkt der Testerstellung wider und unterliegen einer systematischen Aktualisierung und Überprüfung.

Für die Standards gelten folgende Anforderungen:

Die Standards müssen differenziert werden. Beispielsweise müssen Tests für allgemeinbildende und spezialisierte Schulen anhand unterschiedlicher Stichproben standardisiert werden, was höchstwahrscheinlich zu deutlich unterschiedlichen Normen führen wird;

Die Standards müssen die reale Bevölkerung und die aktuellen Anforderungen an die Qualität der Bildungsleistungen widerspiegeln, die sich aus der aktuellen Bildungssituation ergeben;

Normen müssen repräsentativ sein, daher werden sie stets empirisch anhand der Ergebnisse der Prüfung einer Normungsstichprobe ermittelt (bundesweit – für das Einheitliche Staatsexamen, kommunal – für die Zertifizierung von Schulen, schulintern – für die Zertifizierung von Schülern in der Schule) .

„Norm“ ist ein relativer Begriff und steht in engem Zusammenhang mit der Qualität der zur Standardisierung verwendeten Stichprobe. Die Stichprobe muss genau die Kategorie (oder Kategorien) von Personen widerspiegeln, für die der Test bestimmt ist, und sie muss groß und ausgewogen genug sein, um sicherzustellen, dass der Standardfehler so klein ist, dass er im Teststandardisierungsprozess vernachlässigbar sein kann. Daher müssen bei der Bildung einer Standardisierungsstichprobe zwei Variablen berücksichtigt werden – Volumen und Repräsentativität, die zusammen eine hohe Genauigkeit bei der Bewertung von Testleistungsstandards gewährleisten.

Stichprobenschichtung. Um eine gleichmäßige Vertretung verschiedener Studierendengruppen in der Testpopulation sicherzustellen, kommt ein spezielles Verfahren zum Einsatz – die Stratifizierung. Unter Stratifizierung versteht man die Schichtung der Stichprobe in Schichten, deren Größe proportional zur Größe der entsprechenden Populationen in der allgemeinen Studierendenpopulation sein sollte. Grundlage für die Schichtung sind in der Regel die Faktoren, die am stärksten mit der Messvariablen verbunden sind. Bei der Einheitlichen Staatsprüfung zählen zu diesen Faktoren der soziale Status der Eltern des Absolventen, die Region, in der sich die Schule befindet, ob es sich um eine ländliche oder städtische Schule handelt usw.

Das Vorhandensein vieler Schichtungsfaktoren, die Notwendigkeit, die Anteile der allgemeinen Probandenpopulation zu analysieren und Pilottests zur Festlegung von Standards durchzuführen, machen die Arbeit zur Standardisierung von Tests zu einem ziemlich teuren und zeitaufwändigen Verfahren. Der aktuelle Entwicklungsstand der Testtechnologien ermöglicht es, Tests mit vorhersehbaren Standards zu simulieren IRT , eine Datenbank kalibrierter Testobjekte und spezieller Programme zur computergestützten Generierung von Testoptionen.

Begleitende Informationen zu standardisierten Tests . Der standardisierte Test muss Folgendes umfassen:

Testleistungsstandards, die anhand einer Standardisierungsprobe ermittelt werden;

Die Größe der Standardisierungsstichprobe, die Grundlage für ihre Schichtung und der Zeitraum ihrer Verwendung;

Rohtestergebnisse für die Standardisierungsprobe.

Ein Vergleich von Normen für verschiedene Tests ist nur möglich, wenn Gründe für die Behauptung der Angemessenheit von Standardisierungsproben vorliegen.

Kriterienbasierter Ansatz in pädagogischen Dimensionen . Bei einem kriterienbasierten Ansatz zur pädagogischen Messung werden die Ergebnisse der Studierenden in Bezug auf den Inhaltsbereich oder die für die akademische Leistung festgelegten Anforderungen interpretiert. Bei dichotome Beurteilung(„1“ oder „0“) der Ergebnisse der Erledigung einzelner Aufgaben wird die Punktzahl jedes Schülers berechnet, indem der Prozentsatz der richtig erledigten Aufgaben ins Verhältnis zur Gesamtzahl der Prüfungsaufgaben umgerechnet wird. Im Fall von polytome Beurteilungen Das Verhältnis der Rohpunktzahl des Schülers bei den Aufgaben zur maximal möglichen Punktzahl im Test wird in einen Prozentsatz umgewandelt. Der für jeden Schüler ermittelte Prozentsatz wird mit Leistungsstandards verglichen – Kriterien, die von Experten festgelegt und während des Testaufbauprozesses empirisch validiert wurden.

Mit einem kriterienorientierten Ansatz, basierend auf Testergebnissen, können Sie:

- Ermitteln Sie beherrschte und nicht beherrschte Kenntnisse, Fähigkeiten und Fertigkeiten und erstellen Sie für jeden Schüler einen individuellen Bildungsweg.

Ordnen Sie die Testteilnehmer nach Abschlussprozentsatz und erstellen Sie Bewertungsskalen.

Teilen Sie die Fächer anhand eines Kriteriumspunkts in zwei Gruppen oder anhand mehrerer Kriteriumspunkte in mehrere Gruppen ein und geben Sie beispielsweise Schulnoten an – „zwei“, „drei“, „vier“, „fünf“.

Nachteile des kriterienorientierten Ansatzes. Der auf Kriterien basierende Ansatz weist Nachteile auf, die mit der Notwendigkeit verbunden sind, den Inhalt, der als 100 % angenommen wird, in einem Test vollständig abzudecken. Kriterienbasierte Zertifizierungstests fallen oft sehr lang aus – von 150 bis 300 Aufgaben, die selbst im Gymnasium mit einer einmaligen Präsentation einfach nicht zu bewältigen sind. Daher kommt bei der Zertifizierung häufig adaptives Testen zum Einsatz, das durch die Optimierung der Schwierigkeit der Aufgaben eine deutliche Verkürzung der Testdauer ermöglicht. Sie nutzen auch eine Reduzierung des Testinhalts durch Minimierung der Bewertungsziele. Zu diesem Zweck werden häufig kriterienorientierte Tests zur Prüfung einer oder zweier Fähigkeiten oder Fertigkeiten eingesetzt, bei der Abdeckung heterogenerer Inhalte werden normativ orientierte Tests gewählt.

Auch kriterienbasierte Tests haben einen eher begrenzten Anwendungsbereich. Sie eignen sich dort, wo es möglich ist, Kenntnisse, Fähigkeiten und Fertigkeiten in einem bestimmten Inhaltsbereich klar zu definieren und deren Ober- und Untergrenzen festzulegen, um die Kriterien für die Durchführung von Tests korrekt zu bestimmen. In komplexeren und weniger strukturierten Wissensgebieten zur Lösung kreativer Probleme ist es oft unmöglich, die Obergrenze zu bestimmen.

Manchmal lässt sich ein Schüler bei der Ausführung solcher Aufgaben von Wissen leiten, aber häufiger entscheiden Einfallsreichtum und Vermutungen über alles. Daher sollte man bei der Erstellung von Tests zur Überwachung der Leistung kreativer Aufgaben einem normativ orientierten Ansatz den Vorzug geben oder versuchen, beide Ansätze in einem Test zu kombinieren.

Unterschiede zwischen normorientierten und kriterienorientierten Ansätzen. Normativ orientierte und kriterienorientierte Tests unterscheiden sich im Erstellungszweck, in der Methodik zur Auswahl der Inhalte, in der Art der Verteilung empirischer Ergebnisse, in der Prüfung, in den Methoden ihrer Verarbeitung, in den Qualitätskriterien von Tests und Testaufgaben und vor allem in die Interpretation der Ergebnisse der Probanden, die den Test abgeschlossen haben.

Bei kriterienbasierten Tests zur Zertifizierung sind die Aufgaben recht einfach, da Lehrer immer versuchen, den Prozentsatz der „Zweier“ einzuplanen und die Anzahl der nicht zertifizierten Schüler zu begrenzen. Wenn beispielsweise „Zweier“ 10 % nicht überschreiten sollen und das Kriterium für die Aussortierung erfolgloser Studierender auf 70 % festgelegt werden soll (jeder, der weniger als 70 % der Prüfungsaufgaben erledigt hat, erhält eine „Zwei“), dann erfolgt der Test muss mindestens 70 % leichte Aufgaben umfassen, die von 90 % der getesteten Studierenden gelöst werden können (Abb. 9). Normativ orientierte Tests sind in der Regel deutlich schwieriger. Sie umfassen 50 bis 70 % der Aufgaben mittleren Schwierigkeitsgrades, d.h. diejenigen, die nur die Hälfte der getesteten Studierenden richtig lösen konnte (Abb. 10).

Reis. 9. Aufgabenverteilung nach Schwierigkeitsgrad in einem normativen Test

Reis. 10. Aufgabenverteilung nach Schwierigkeitsgrad in einem kriterienbezogenen Test

Da die Verteilungen der Rohwerte einer repräsentativen Probandenstichprobe bei normativen und kriterienorientierten Tests in der Regel unterschiedliche Formen aufweisen (Abb. 11), ist es erforderlich, unterschiedliche Methoden zur Beurteilung der Reliabilität und Validität anzuwenden der Ergebnisse pädagogischer Messungen, Skalierungs- und Ausrichtungstechniken.

Reis. 11. Typische Verteilung der Testergebnisse für eine repräsentative Stichprobe

Studentenproben

Die wichtigsten Unterschiede zwischen normativen und kriterienorientierten Tests sind in der Tabelle dargestellt. 1.

Tabelle 1

Unterschiede zwischen normbezogenen und kriterienbezogenen Tests

Eigenschaften

Regulierungsorientierte Tests

Kriterienbasierte Tests

Typische durchschnittliche Anzahl von Schülern, die fast alle Prüfungsaufgaben richtig lösen

Bereich zum Vergleich der Schülerergebnisse

Ergebnisse anderer Studenten

Umfang der Prüfungsziele

Breit, deckt ab viele Ziele und Arten von Lernaktivitäten

Eng, deckt in der Regel mehrere Kontrollziele ab

Repräsentativität der thematischen Inhaltsabdeckung

Mäßig, fragmentiert – meist sind nicht alle Abschnitte enthalten

Normalerweise groß alles einbeziehen, was zu 100 % operationalisiert und angenommen werden kann

Streuung der Schülerergebnisse (Score-Variabilität)

Hoch, da der Hauptzweck des Tests darin besteht, die Testteilnehmer zu differenzieren Ausbildungsstand

Niedrig, innerhalb der Ergebnisse der Gruppe von Studenten, die übertroffen haben entsprechend seinen Ergebnissen Kriteriumspunktzahl, nahezu keine Variabilität

Auswahl der Aufgaben nach Schwierigkeitsgrad

Die Verteilung der Schwierigkeitsgrade ist nahezu normal. Hauptsächlich Manche Aufgaben haben einen Schwierigkeitsgrad von 40-60 %

Die Verteilung ist schief. Der Hauptteil der Aufgaben hat einen Schwierigkeitsgrad von 80-90 %

Für einen Lehrer ist die Situation am informativsten, wenn sich beide Ansätze ergänzen. Deshalb einige Tests werden mit der Erwartung konzipiert, dass die Leistung der Schüler sowohl mit Normen als auch mit Testinhalten in Zusammenhang gebracht werden kann. Ein Beispiel sind Kontroll- und Messmaterialien (CMM) des Einheitlichen Staatsexamens.

2. Testaufgaben und Testarten

Allgemeine Klassifizierung der durch Tests gelösten Probleme . Entsprechend den Kontrollarten während der Prüfung können wir unterscheiden:

Ziele am Einstieg in die Ausbildung (Eingabekontrolle);

Aktuelle Aufgaben (aktuelle Kontrolle);

Aufgaben, die dem Ende eines bestimmten Zeitraums des Bildungsprozesses entsprechen (Endkontrolle).

Prüfung in der Eingangskontrolle . Der Beginn der Ausbildung entspricht einem Aufnahmetest, der es uns ermöglicht, den Grad der Beherrschung der Grundkenntnisse, Fähigkeiten und Fertigkeiten zu ermitteln, die für den Beginn der Ausbildung erforderlich sind, und den Grad der Beherrschung neuer Materialien zu bestimmen, bevor sie im Klassenzimmer erlernt werden . Die letzte Situation scheint für die Schule nicht typisch zu sein, es genügt jedoch, sich an das klassische Beispiel zu erinnern, wenn Kinder, die gut lesen, in die erste Klasse kommen und sich im Unterricht zu langweilen beginnen.

Wareneingangsprüfungen, üblicherweise genannt Vortests(Vorversuche) werden in zwei Typen unterteilt. Vortests erster Art ermöglichen es uns, die Bereitschaft zu erkennen, neues Wissen im Klassenzimmer zu erlernen. Sie werden im Rahmen eines kriterienorientierten Ansatzes entwickelt und enthalten Aufgaben zur Prüfung der grundlegenden Kenntnisse, Fähigkeiten und Fertigkeiten, die zur Beherrschung neuer Materialien erforderlich sind. Grundsätzlich sind diese Vortests für die schwächsten Schüler gedacht, die sich an der Grenze zwischen eindeutig vorbereitet und eindeutig nicht bereit befinden, mit dem Erlernen neuen Materials zu beginnen. Basierend auf den Ergebnissen des Vortests werden die Testteilnehmer in zwei Gruppen eingeteilt, von denen eine diejenigen umfasst, die weitermachen können, und die andere diejenigen, die zusätzliche Arbeit und Ratschläge von einem Lehrer benötigen.

Vortests der zweiten Art werden im Rahmen eines normativ orientierten Ansatzes entwickelt. Sie decken die geplanten Ergebnisse der bevorstehenden Schulung ab und basieren vollständig auf neuem Material. Basierend auf den Ergebnissen des Vortests trifft der Lehrer eine Entscheidung, die es ihm ermöglicht, Elemente der Individualisierung in den Massenbildungsprozess einzuführen. Wenn ein Schüler Vorkenntnisse über neues Material gezeigt hat, muss sein Lehrplan umstrukturiert und auf einem höheren Niveau begonnen werden, damit das Lehrmaterial für ihn einen echten Neuheitscharakter hat. Manchmal übernimmt der Abschlusstest die Rolle des Eingangsvortests, der zur späteren Beurteilung der Ergebnisse der Beherrschung neuer Stoffe nach Abschluss des Studiums dient.

In Abb. Abbildung 12 zeigt mögliche Funktionen von Inputtests im Bildungsprozess.

Reis. 12. Vereinfachtes Modell der Eingabetestfunktionen im Bildungsbereich

Prozess, korreliert mit den Aufgaben des Lehrers.

Prüfung in Stromregelung . Für die laufende Überwachung werden Korrektur- und Diagnosetests entwickelt. Korrekturtests sind in der Regel kriterienorientiert: Wenn der Prozentsatz der Fehler eines Schülers die Kriteriumspunktzahl übersteigt, muss sein Wissen korrigiert werden. Mit Hilfe von Korrekturtests können Sie Schwächen in der Vorbereitung der Studierenden aufdecken und Bereiche individueller Unterstützung bei der Beherrschung neuer Stoffe identifizieren.

Korrekturtests sind nicht mit Mitteln zur laufenden Wissenskontrolle von Studierenden zu verwechseln, liegen aber zumindest im Hinblick auf die Anwendungszwecke einigermaßen nahe beieinander. Es bestehen jedoch erhebliche technologische und inhaltliche Unterschiede zwischen dem ersten und dem zweiten Mittel. Herkömmliche Mittel zur Stromkontrolle sind weniger effektiv und konzentrieren sich hauptsächlich auf die Prüfung und systematische Bewertung des Wissens der Schüler anhand kleiner Einheiten von Lehrmaterial. Korrekturtests sollen Wissenslücken in einer Gruppe von Bildungseinheiten identifizieren, die den Inhalt mehrerer Themen oder sogar Abschnitte umfassen. Sie enthalten in der Regel Aufgaben, die in steigendem Schwierigkeitsgrad angeordnet sind, um erste Probleme bei der Bewältigung des Lehrstoffs zu erkennen.

Wenn die Schwierigkeiten des Schülers bei der Lösung von Aufgaben systematisch sind, kann der Lehrer auf Hilfe zurückgreifen Diagnosetest. Das Hauptziel der Diagnostik – die Ursachen von Wissenslücken der Studierenden zu ermitteln – wird durch eine spezielle Auswahl der Aufgabeninhalte in Prüfungen erreicht. In der Regel handelt es sich dabei um inhaltlich leicht variierende Aufgaben, die je nach Darstellungsform darauf ausgelegt sind, die einzelnen Bearbeitungsschritte der einzelnen Aufgaben des Korrekturtests nachzuvollziehen. Detaillierte Detaillierung ermöglicht es uns, die Ursachen für anhaltende Fehler von Schülern zu identifizieren, die Art der auftretenden Schwierigkeiten zu präzisieren und Rückschlüsse auf die Unreife bestimmter pädagogischer Fähigkeiten zu ziehen.

Eine Multiple-Choice-Aufgabe aus einem Mathe-Nachhilfetest für die Grundschule könnte beispielsweise so aussehen:

2+6:3 8:4=

A.2

B. 3

B.1

G 4

Maximale Anzahl von DiagnosejobsDer Test wird durch die Anzahl der Aktionen bei der Durchführung einer korrigierenden Testaufgabe bestimmt. Für den betreffenden numerischen Ausdruck können Sie beispielsweise vier Aufgaben anbieten, wenn der Lehrer die Kenntnisse des Schülers über das Verfahren nicht testen möchte:

1) 6:3= A. 3 B. 2 C. 4

2) 8:4= A. 2 B. 4 C. 1

3) 2+6:3= A. 5 B. 6 C. 4

4) 2+6:3-8:4 = A. 3 B. 2 C. 0

Die Auswahl der Aufgaben für den Diagnosetest erfolgt individualisiert, abhängig von den Aufgaben was jeder Schüler im Nachhilfetest falsch gemacht hat. Besonders effektiv sind Korrektur- und Diagnoseverfahren mit computergestützter Erstellung und Präsentation von Tests in Kombination mit Schulungsmodulen für jede Einheit ungelernten Lehrmaterials. In diesem Fall erfolgt die Korrektur sofort, da der Computer nach dem Erkennen der nächsten Lücke und der Feststellung der Ursache selbst das Schulungsmodul auswählt und es sofort an den Studierenden ausgibt.

Ein vereinfachtes Modell der aktuellen Testfunktionen ist in Abb. dargestellt. 13.

Reis. 1Z. Modell von Testfunktionen in der Stromsteuerung

Abschließende Prüfung. Das Hauptziel der Abschlussprüfung ist eine objektive Bewertung der Lernergebnisse, die sich an den Merkmalen der Beherrschung der Studieninhalte (kriterienorientierte Tests) bzw. an der Differenzierung der Studierenden (normativ orientierte Tests) orientiert. In Abb. Abbildung 14 zeigt ein Modell der endgültigen Testfunktionen.

Reis. 14. Modell der endgültigen Testfunktionen

Abschlusstests unterliegen in der Regel einer Standardisierung, da sie am häufigsten für Verwaltungsentscheidungen im Bildungswesen verwendet werden. Wenn die Durchführung von Aufnahme- und laufenden Tests die Aufgabe des Lehrers ist, werden Abschlusstests häufig von externen Strukturen durchgeführt und haben den Charakter von unabhängige Kontrollen. Ein Beispiel für unabhängige Abschlussprüfungen in Russland ist das Einheitliche Staatsexamen, die Prüfung für die Schulzertifizierung usw. Innerhalb einer Schule können Abschlusstests bei der Versetzung von Schülern von Klasse zu Klasse, bei der Auswahl schwächerer Schüler für die Einweisung in Justizvollzugsklassen usw. eingesetzt werden.

3. Klassifizierung der Arten pädagogischer Tests

Grundlegende Ansätze zur Testklassifizierung. In der in- und ausländischen Literatur gibt es unterschiedliche Ansätze zur Klassifizierung pädagogischer Tests, die sich in den Merkmalen unterscheiden, die der Typenabgrenzung zugrunde liegen. Entsprechend dem Ansatz zur Dateninterpretation gibt es normativ orientiert Und kriterienbezogene Tests.

Entsprechend der Dimension des Konstrukts werden pädagogische Tests unterteilt in homogen(nur eine Variable messend und daher inhaltlich homogen) und heterogen (mehr als eine Variable messend – der Fall eines mehrdimensionalen Konstrukts) Tests. Heterogene Tests sind multidisziplinär und interdisziplinär. Multidisziplinäre Tests bestehen aus homogenen Teiltests in einzelnen Disziplinen. Die Ergebnisse der Schüler bei Untertests werden kombiniert, um die Endergebnisse für den gesamten multidisziplinären Test zu berechnen. Zur Bewältigung interdisziplinärer Prüfungsaufgaben ist der Einsatz generalisierter, interdisziplinärer, integrativer Kenntnisse und Fähigkeiten erforderlich. Interdisziplinäre Tests sind immer mehrdimensional; ihre Entwicklung erfordert den Rückgriff auf faktorielle Methoden der Datenanalyse, mathematische und statistische Methoden der mehrdimensionalen Skalierung usw.

Basierend auf der Art der gemessenen Variablen werden sie unterschieden Tests zum Testen von Wissen, pädagogischen, praktischen Fähigkeiten und Auch Kompetenztests. Manchmal werden sie in eine separate Gruppe eingeteilt Geschwindigkeitstests, Es wird ein strenges Zeitlimit für die Erledigung jeder Aufgabe verlangt und es wird immer eine übermäßige Anzahl an Aufgaben enthalten, die es nicht ermöglicht, den gesamten Test abzuschließen. Je nach Präsentationsform gibt es leer Und Computer, mündlich Und schriftliche Prüfungen.

Die allgemeinste Klassifizierung von Tests im Bildungsprozess ermöglicht es uns, sie in zwei ungleiche Gruppen einzuteilen: standartisierte Tests, Compliance-Standards haben und nicht standardisierte Tests Davon gibt es noch viel mehr, da jeder Lehrer sie für den Einsatz im alltäglichen Bildungsprozess vorbereitet. Nicht standardisierte Tests werden oft als Lehrertests oder Autorentests bezeichnet.

Einteilung nach Steuerungsarten, deren Funktionen und der Art der zu lösenden Aufgaben. Wenn wir als Abgrenzungszeichen die Arten der Kontrolle und die Art der vom Lehrer mithilfe von Tests gelösten Aufgaben auswählen, erhalten wir eine in Abb. dargestellte Klassifizierung der Arten pädagogischer Tests. 15.

Reis. 15. Klassifizierung pädagogischer Tests

Die Analyse der Klassifizierungstabelle ermöglicht es uns, vier Arten pädagogischer Tests als grundlegend zu identifizieren, unter denen die abschließenden normativen Tests hinsichtlich ihres Einsatzbereichs die größte Bedeutung haben.

Der zunehmende Einfluss von Tests auf Managemententscheidungen auf der Grundlage von Daten aus der Überwachung und Analyse der Bildungsqualität hat in vielen Ländern dazu geführt 21. Jahrhundert . zur Entstehung einer neuen Art von Tests für Verwaltungs- und Managementzwecke (in der englischen Literatur - High-Stakes-Tests ). Daten aus Verwaltungs- und Managementtests sind eine wichtige Informationsquelle für die Analyse der Folgen von Bildungsreformen und Bildungsinnovationen, für die Durchführung vergleichender Studien zur Qualität der Vorbereitung von Absolventen aus verschiedenen Regionen Russlands, für die Zertifizierung von Bildungseinrichtungen und für die Bewertung der Wirksamkeit ihrer Aktivitäten.

4. Grundlegende Definitionen des Begriffsapparats

Konzeptioneller Apparat zur Entwicklung und Verwendung von Tests. Die Notwendigkeit, einen klaren konzeptionellen Rahmen für die Entwicklung von Tests zu schaffen, ist praktizierenden Lehrern nicht immer klar. Dies lässt sich teilweise durch die scheinbare Einfachheit der Konzepte selbst erklären, da oft jede Reihe von Aufgaben in Testform mit einem Test im Kopf des Lehrers verbunden ist. Solche Pseudotests werden häufig in Spezialsammlungen veröffentlicht. Sie können in der Routineüberwachung eingesetzt werden, nicht jedoch in der Arbeit von Zertifizierungsstellen.

Die Inkonsistenz von Pseudotests mit wissenschaftlich fundierten Qualitätskriterien kann zu einem erheblichen Fehlanteil bei der Beurteilung der Schülervorbereitung führen, der zu falschen Rückschlüssen auf die Leistungsfähigkeit einzelner Lehrkräfte oder Lehrteams führt. Daher ist ein konzeptioneller Apparat notwendig, da er dazu dient, Tests von dem zu trennen, was oft als solche angesehen wird.

Aufgabe vor dem Test . Die Definition eines Vortestgegenstands ist grundlegend und enthält spezifische Anforderungen, um ihn von einem herkömmlichen Testgegenstand zu unterscheiden. Eine Vorprüfungsaufgabe ist eine Einheit von Prüfungsmaterialien, deren Inhalt, logischer Aufbau und Darstellungsform einer Reihe von Anforderungen gerecht wird und durch standardisierte Prüfungsregeln eine eindeutige Beurteilung der Leistungsergebnisse gewährleistet.

In Vorprüfungsaufgaben werden die wesentlichsten unterstützenden Elemente der Fachinhalte geprüft. In jeder Vortestaufgabe wird ermittelt, was eindeutig als richtige Antwort mit dem geplanten Vollständigkeitsgrad angesehen wird.

Anforderungen an die Form der Vorprüfungsaufgaben , kann in spezielle, die die Besonderheiten der Form widerspiegeln, und allgemeine, die in Bezug auf die gewählte Form invariant sind, unterteilt werden. Gemäß den allgemeinen Anforderungen muss die Aufgabe über eine bestimmte Seriennummer, Standardanweisungen für die Umsetzung, eine angemessene Form, einen Standard für die richtige Antwort, standardisierte Regeln für die Bewertung der Ergebnisse ihrer Umsetzung usw. verfügen usw. . (Siehe Vorlesung 10). Es gibt zahlreiche spezielle Anforderungen an die Form, die teilweise in Vorlesung 10 vorgestellt werden, die sich den Formen von Vorprüfungsaufgaben widmet.

Die Vorteile von Pre-Test-Aufgaben im Vergleich zu herkömmlichen Kontrollaufgaben werden durch eine extreme Standardisierung in der Darstellung und Bewertung ihrer Ergebnisse gewährleistet, was insgesamt die Objektivität der Testergebnisse der Studierenden erhöht.

Prüfen . Vortestaufgaben müssen einer obligatorischen empirischen Prüfung unterzogen werden, nach deren Ergebnissen ein Teil davon in Testaufgaben umgewandelt und der verbleibende Teil aus dem ursprünglichen Satz von Testaufgaben entfernt wird. Eine Vortestaufgabe wird zu einer Testaufgabe, wenn quantitative Bewertungen ihrer Eigenschaften bestimmte Kriterien erfüllen, die darauf abzielen, die inhaltliche, formale und systembildende Qualität von Vortestaufgaben empirisch zu überprüfen.

In der Regel sind mindestens zwei bis drei Tests erforderlich, auf deren Grundlage Inhalt, Form, Schwierigkeitsgrad der Aufgabe, ihre Gültigkeit und statistische Eigenschaften, die die Qualität ihrer Arbeit charakterisieren, sowie andere Testaufgaben korrigiert werden. Die Untersuchung der systembildenden Eigenschaften der Testaufgabe erfolgt auf Basis einer Analyse der deskriptiven Statistik sowie Methoden der Korrelations-, Faktoren- und latenten Strukturanalyse. Die Interpretation von Analyseergebnissen ist immer eine komplexe analytische Arbeit, deren Ergebnisse von vielen Bedingungen abhängen, einschließlich der Art des zu erstellenden Tests. Statistische Merkmale von Testaufgaben und Anforderungen an deren Qualität werden in Vorlesung 12 besprochen .

Es sind vor allem die Abschlusstests, die für Managemententscheidungen im Bildungswesen verwendet werden, die langwierige Prüfungen und Korrekturen erfordern. Bei der Entwicklung von Lehrertests zur laufenden Überwachung sind beispielsweise keine Korrelations- und Faktorenanalysen erforderlich, aber auch deskriptive Statistiken, die es ermöglichen, gültige Aufgaben mit akzeptablem Schwierigkeitsgrad einfach auszuwählen, sind sehr nützlich.

Pädagogischer Test. Im Gegensatz zu den ersten beiden Definitionen, die hinsichtlich der Testzwecke und der zu lösenden Aufgaben unveränderlich sind, sollte sich die Definition eines pädagogischen Tests auf eine bestimmte Art von Test konzentrieren. Insbesondere handelt es sich bei dem abschließenden normativ orientierten Test um ein System von Testaufgaben, die innerhalb einer bestimmten Präsentationsstrategie angeordnet sind und solche Merkmale aufweisen, die eine hohe Differenzierung, Genauigkeit und Validität der Beurteilung der Qualität von Bildungsleistungen gewährleisten.

Aus dieser Definition ergeben sich zwei wichtige Schlussfolgerungen. Erstens: Es gibt und kann überhaupt keine qualitativ hochwertigen Tests geben, da die Beurteilung der differenzierenden Wirkung des Tests, der Genauigkeit von Messungen (Reliabilität) und ihrer Angemessenheit an die gesetzten Ziele (Validität) nicht nur von den Eigenschaften von abhängt von den Testaufgaben, sondern auch von den Merkmalen der zu testenden Studierendenpopulation. Zweitens: Um die Qualität eines Tests beurteilen zu können, sind empirische Testdaten notwendig, die aus einer repräsentativen Stichprobe von Studierenden gewonnen werden. Die Arbeit an der Testkorrektur festigt das System der Testaufgaben – die interne Verbindung und Integrität, die Integrativität des Systems nimmt sukzessive zu und es erfolgt ein Übergang von einer Reihe von Vortestaufgaben zu einem professionell entwickelten Test.

Der abschließende kriterienorientierte Test ist ein System von Testaufgaben, die innerhalb einer bestimmten Präsentationsstrategie angeordnet sind und solche Merkmale aufweisen, die eine valide, aussagekräftige Interpretation von Bildungsleistungen in Bezug auf festgelegte, statistisch abgesicherte Leistungskriterien ermöglichen. Die Definition spezifiziert nicht den grundlegenden Inhaltsbereich, der beim Dolmetschen verwendet wird, was die Verwendung für verschiedene Arten von kriterienorientierten Tests ermöglicht.