Positivistische Vermessung des Unterrichts – eine Kritik

Die Vorstellung, Unterricht müsse primär aufgrund von ausgewerteten Daten evaluiert und optimiert werden, ist nicht erst in letzter Zeit aufgekommen. Sie gehört zur Geschichte eines positivistischen Wissenschaftsverständnisses, das davon ausgeht, mit Messungen Erkenntnisse gewinnen zu können, um dann gesellschaftliche Prozesse daran auszurichten – z.B. Schule und Unterricht.

In den letzten Monaten mehren sich Stimmen, die eine Art Revival dieses Wissenschaftsverständnisses fordern. Exemplarisch dafür ist für mich der Psychologe Benedikt Wisniewski, der auf Twitter und in Podcasts Lehrpersonen psychologisches Grundlagenwissen vermittelt – immer mit dem Anspruch, eine datenbezogene Vorstellung von Psychologie sei geeignet, Lernprozesse zu verstehen und dem Design von Lernumgebungen eine Orientierung zu geben. (Die Orientierung an gemessenen Daten wird oft »empirisch« genannt, obwohl dieser Begriff unscharf ist und in Diskussionen oft dazu führt, dass Missverständnisse entstehen.)

Der Erziehungswissenschaftler David Scheer hat die zentrale Vorstellung der datenbezogenen Erkenntnisgewinnung bei der Evaluation von Unterricht auf eine einfache Formel gebracht:

Löst Maßnahme/Methode X das Problem Y?

David Scheer, Twitter

Denken wir z.B. darüber nach, wie gut Schüler*innen in der Schweiz lesen können, dann können wir das messen. Z.B. mit dem Pisa-Test. Wir erhalten dann beispielsweise diese Tabelle aus dem Pisa Bericht 2018.

Nun können Maßnahmen eingeleitet werden, um z.B. den Anteil leseschwacher Jugendlicher zu senken oder den Anteil lesestarker Jugendlicher zu erhöhen – indem z.B. der finnische respektive der kanadische Leseunterricht imitiert wird. Bei der nächsten Pisa-Untersuchung (die schon erfolgt, aber noch nicht ausgewertet ist), kann dann überprüft werden, ob die Maßnahmen erfolgreich waren oder nicht.

Wo liegt nun das Problem mit dieser Sichtweise bzw. diesem Vorgehen?

  1. Wenn wir davon ausgehen, dass Messungen präzise erfolgen (was nicht immer der Fall ist), dann fokussieren sie auf diejenigen Anteile von Prozessen, die sich (leicht) messen lassen. Im vorliegenden Fall kann aus den gemessenen Daten nicht abgeleitet werden, wie gern Jugendliche lesen, wie gut sie darin sind, audiovisuelle Texte zu verstehen, wie gut sie Informationen aus mündlichen Gesprächen verarbeiten können etc. Die Messung ignoriert viele Aspekte, auch weil sie teilweise schwerer zu messen sind (oder es gar nicht möglich ist, relevante Daten zu erheben).
  2. Messungen schaffen Fehlanreize. Wenn es darum geht, ein Problem tatsächlich zu lösen, dann führt die Messung dieser Problemlösung zu vielen Aktivitäten, die nur der Anschein erwecken, das Problem sei gelöst. In der Schule ist das z.B. das Teaching-to-the-Test-Phänomen.
  3. Unterricht ist sinnstiftende Beziehungsarbeit. Effiziente Maßnahmen – die sich bei Messungen bewährt haben – können sowohl den Sinn wie auch die Beziehungen stören. Lehrpersonen müssen hier Abwägungen treffen. Vielleicht ist das Selbstvertrauen des leseschwachen Viertels in einer Klasse gerade wichtiger als ihre Lesekompetenz.
  4. Wissenschaft umfasst viele Methoden, auch schon nur in der Beobachtung und Auswertung von Unterricht. Die Erhebung und Verarbeitung von Daten ist eine von vielen Methoden. Sie zur primären Methoden zu erklären, ist falsch und anmaßend. Es ist eine naturwissenschaftliche Methode, deren Übertragung auf gesellschaftliche Prozesse wissenschaftshistorisch nur bedingt erfolgreich war. Das hängt mit den oben erwähnten Punkten zusammen.
  5. Daten werden in größeren Kontexten interpretiert, aber in kleinen Kontexten erhoben. Ein schönes Beispiel ist eine Studie von Steinig und Betzel, die untersucht hat, wie gut Grundschüler*innen schreiben. Dazu wurden Texte von 1972, 2002 und 2012 verglichen. In der Interpretation wird deutlich, dass sich in den 40 Jahren Medien und Schreibprozesse so stark verändert haben, dass ein Vergleich gar nicht möglich ist. Schreibkompetenz hat sich gewandelt. Schon nur die Versuchsanordnung ist eine ganz andere: Kam in den 1970er-Jahren eine externe Fachperson in den Unterricht, haben Schüler*innen die Situation anders interpretiert als 2012. Die größeren Kontexte müssen mitgedacht werden – sie können nicht durch Messungen ermittelt werden. (Ein ähnliches Problem taucht auf, wenn große Meta-Studien wie die Hattie-Studie zu sehr abstraken Erkenntnissen führen, die dann auf konkrete Situationen angewandt werden. Dabei werden Daten aus chinesischen Grundschulen plötzlich auf Schweizer Gymnasien übertragen, womit sie nichts zu tun haben.)

Denken wir also über Unterricht nach, dann sind Erkenntnisse aus Daten ein wichtiges Element. Dieses Element muss berücksichtigt werden – aber eingebettet in alle anderen Formen des wissenschaftlichen und praktischen Nachdenkens über Unterricht. Und es muss kritisch reflektiert werden: Nicht abgewertet, nicht ausgeblendet, sondern im Sinne einer rationalen Prüfung, ob diese Erkenntnisse wirklich dabei helfen, ein vorliegendes Problem zu bearbeiten.

Wer ein dogmatisches Loblied auf Datenauswertung singt und dabei alle, die eine ganzheitliche Perspektive vertreten, abwertet, leistet der Wissenschaft einen Bärendienst. Nicht nur, weil dabei ein seltsames und falsches Bild von Wissenschaft entsteht, sondern weil eine Front eröffnet wird, die unnötig ist: Lehrpersonen und an Didaktik interessierte Menschen lehnen datengestützte Erkenntnisse nicht ab. Aber sie müssen in ihrer vielfältigen Tätigkeit darüber diskutieren können.

Edit: 1. bei der Liste der Kriterien am 27. Oktober präzisiert, vgl. hier.

1 Kommentar

  1. Jan Rihak sagt:

    Danke Philipp – aus meiner Sicht sind das alles valide Punkte. Was waere aus Deiner Sicht eine moeglichst gute Annaeherung an einen (umfassenderen) Kriteriensatz (allgemeiner Art, ggf. weniger messtheoretische Kriterien), ob guter Unterricht stattfindet und Lernende sich positiv weiterentwickeln? Was sind aus Deiner Sicht die Zieldimensionen, nach denen man Erfolg messen will und sich ggf. verbessern kann?
    Ich bin grundsaetzlich bei Dir (for whatever it’s worth) – die Diskussion sollte gefuehrt werden, und man sollte diese dann wohl auch iterieren koennen und weiterentwickeln. Aber wo wuerdest Du starten?

Kommentar verfassen

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden..