Automatische Texte mit GPT-3: Das Ende der Aufsatzdidaktik

Gestern habe ich beschrieben, wie auch unsichere Schreibende mit DeepL stilistisch und formal einwandfreie Texte erzeugen können. Heute zeige ich, wie mit GPT-3 ganze Texte erzeugt werden können.

GPT-3 ist ein Programm, das Texte schreibt. Anders als schematische Vorläufer arbeitet GPT-3 mit so vielen Parametern und unter Rückgriff auf so viele Daten, dass die Ergebnisse von einer bestechenden Qualität sind. (Ich habe Schreibalgorithmen in diesem Beitrag etwas genauer verglichen.)

Bis vor zwei Wochen war der Zugriff auf GPT-3 eingeschränkt verfügbar. Aktuell können unter https://beta.openai.com/signup Konten erstellt werden. Die Software ist für Profis gemacht. Der Playground lädt zum Spielen ein, um wirklich sicher damit arbeiten zu können, braucht es aber eine gewisse Einarbeitungszeit.

Letztlich ist es aber möglich, GPT-3 im Hintergrund von einfacheren Seiten laufen zu lassen – also etwa einer Schulaufsatz-Seite, bei der die Themen der Lehrperson eingegeben werden können – und dann ein fertiger Aufsatz gemäß den Vorgaben entsteht.

Ich habe ein Beispiel erstellt:

GPT-3 stellt eine Revolution für den Deutschunterricht und die Schreibdidaktik dar. Der Algorithmus erlaubt Schüler*innen, Aufsätze automatisch generieren zu lassen. Dazu reicht es, die ersten Sätze zu formulieren – den Rest übernimmt ein hochkomplexes Programm.
Das Programm analysiert die eingetippten Sätze, um den Rest des Textes zu ergänzen. Dabei werden die Sätze immer komplexer, je mehr der Text entsteht. Die Schüler*innen werden dadurch zum Schreiben motiviert und erhalten automatisch eine Note für die Leistung. Die Programmierer*innen der App kritisieren, dass der Computer nur einen Teil der Leistung und Fähigkeiten des Schreibenden abbilden kann. Im Vergleich zu einem menschlichen Kommilitonen würde der Computer also eine schlechtere Note bekommen.

Ich habe hier die nicht-kursiv gesetzten Sätze geschrieben und dann einfach ergänzen lassen. GPT-3 übernimmt meine Form zu gendern ohne Probleme. Thematisch geht es plötzlich um Noten, was wohl durch »Aufsätze« und »Schreibdidaktik« naheliegend erscheint, mir jedoch in diesem Text kein Anliegen war. Inhaltlich muss man GPT-3 immer mal wieder auf die Sprünge helfen, die Formulierungen sind jedoch einwandfrei.

In der Schule werden diese Algorithmen wohl noch eine Weile bekämpft – genauso wie Gemeinschaftlichkeit und Kommunikation. Letztlich werden diese drei Merkmale der Kultur der Digitalität aber nicht verhindert werden können – die Energie, die in diesen Kampf fließt, ist verschwendet. Wer Jugendliche umfassend bilden will, stellt ihnen diese Möglichkeiten zur Verfügung und schafft Settings, in denen ein reflektierter, kritischer und bewusster Einsatz von Technologie möglich ist.

DeepL als Korrekturwerkzeug im Erstsprachenunterricht

Manchmal gibt es – nicht nur im Kontext der Digitalität – Ideen, die so naheliegend und überzeugend sind, dass es eine Weile dauert, bis man sie entdeckt.

DeepL ist als Übersetzungstool so gut geworden, dass es im Fremdsprachenunterricht mittlerweile wenig Sinn ergibt, Schüler*innen Texte übersetzen zu lassen – wenn man dabei erwartet, dass sie das ohne DeepL machen. Diese Erfahrungen führen dazu, dass sie das Tool zunehmend auch im Erstsprachenunterricht einsetzen:

(Ich habe Schüler*innen gefragt: Ja, einige machen das.)

Das Vorgehen ist schnell beschrieben:

  1. Text schreiben
  2. Text mit DeepL auf Englisch übersetzen lassen.
  3. Text aus Englisch zurück nach Deutsch übersetzen lassen.
  4. Das Resultat noch mal durchlesen und dort korrigieren, wo der Sinn entstellt worden ist.

Funktioniert das gut? Grundsätzlich ja.
Ich habe das am Beispiel eines echten Textes einer Schülerin ausprobiert und kommentiere einige Aspekte unten. Die beiden Texte kann man hier lesen: https://www.craft.do/s/euA1OjEeHbIJoz

(1) Formales

Der Originaltext enthält einige Fehler:

Aus diesem Grund sollte man sich immer kleine Ziele setzen und sich stätig verbessern, Anstelle von grossen Anstiegen, gefolgt von kleinen Niederschlägen.

Im Deepl-Text ist das nicht der Fall, der Text ist fehlerlos, insbesondere auch bei der Kommasetzung:

Deshalb sollte man sich immer wieder kleine Ziele setzen und sich ständig verbessern, statt dass auf große Höhen kleine Tiefen folgen.

(2) Stilistisches

Die gerade zitierte Passage zeigt auch, dass ungenaue Wortwahl von DeepL präzisiert und verbessert wird: Aus »Anstiegen« wird »Höhen«, aus »Niederschlägen« wird »Tiefen« – so stimmt das sprachliche Bild. Genauso wird das Wort »stetig« zu »ständig«: Ein hier passendereres Adjektiv.

(3) Satzbau

Meistens kommt Motivationslosigkeit durch Stress. Viele kennen das bestimmt, an Zeiten an welchen es eigentlich absolut nicht in den Zeitplan passt, kann man am besten Einschlafen. 

DeepL korrigiert diesen Satz so, dass weniger Nebensätze nötig sind, die syntaktisch genau passen (ein Konjunktionalsatz, ein Temporalsatz).

Motivationsmangel wird meist durch Stress verursacht. Viele Menschen wissen, dass man am besten dann einschläft, wenn es eigentlich nicht in den Zeitplan passt.

(4) Das Problem der Zitate

Die Schülerin zitiert in ihrem Text »Machen« von Krogerus/Tschäppeler:

Auch zu wenige Erfolgserlebnisse führen zu Motivationslosigkeit «Wer früher schon Erfolg hatte, erwartet eher, dass es wieder klappt.» (Buch; Machen S. 74) heisst auch umgekehrt: wer viele Niederlangen erlebt hat erwartet von einem selbst nichts grosses und holt nicht das Beste aus einem raus. 

Die DeepL-Methode verändert das Zitat leicht:

Zu wenige Erfolgserlebnisse führen auch zu Motivationsmangel: „Wer schon einmal Erfolg hatte, erwartet eher, dass es wieder klappt.“ (Buch; Machen S. 74) bedeutet auch umgekehrt: Wer viele Niederlagen erlebt hat, erwartet nichts Großes von sich und holt nicht das Beste aus sich heraus.

Fazit: Didaktische Fragen

Wer einen Text schreiben muss und bei Kommasetzung und stilistischen Aspekten unsicher ist, hat mit DeepL ein hervorragendes, kostenloses Werkzeug, um diese Probleme zu beheben. Die Vorstellung, bei der Rückübersetzung entstehe eine ungenauer, unbrauchbarer Text, ist obsolet.

DeepL verschwindet nicht mehr – die Argumentation, Schüler*innen müssten auch schreiben können, wenn sie nicht aufs Internet zugreifen können, bezieht sich auf eine überholte Prüfungskultur. Niemand muss heute schreiben, ohne aufs Internet zugreifen zu können.

Gleichwohl ist es schreibdidaktisch keine Lösung, diese DeepL-Methode von Anfang an einzusetzen. Die Grundlagen von Wortwahl und Satzbau müssen in Übungen sichergestellt werden, ein Gefühl für das Funktionieren von Sprache muss unabhängig von diesem Verfahren entstehen.

Aber die Feinheiten der Kommasetzung und die Korrektur längerer Texte: Die kann DeepL problemlos übernehmen.

Wie verhindert man, dass Schüler*innen schlechte Inhalte aus dem Internet kopieren?

Arbeiten Schüler*innen im und mit dem Internet an Schulaufgaben, passiert oft etwas Unerwünschtes: Sie suchen nach Inhalten, finden nicht ganz passende und übernehmen sie unkritisch. Teilweise verschleiern sie danach ihre Spuren, indem sie einige Sätze umstellen.

Das Ergebnis sieht dann ungefähr so aus (»Min Vortrag« = mein Vortrag):

Als Lehrperson kann ich darauf frustriert reagieren, mich darüber beklagen, wie wenig kompetent und kritisch Schüler*innen mit Netzinhalten umgehen – oder ihnen verbieten, auf bestimmte Medien zuzugreifen.

Ich kann aber auch überlegen, was die Ursachen für das Problem sind:

  1. Die Schüler*innen haben diese Verfahren gelernt.
    Sie haben schon funktioniert – d.h. sie erwarten, dass eine Lehrperson unter Umständen gar nicht merkt, wie sie gearbeitet haben.
  2. Die Verfahren sind effizient,
    d.h. sie sind für Schüler*innen die schnellste Lösung für das anstehende Problem.
  3. Die Handlungsmöglichkeiten der Schüler*innen im Netz sind beschränkt.
    Suchen und kopieren sind Verfahren, die alle schnell können. Sich kritisch mit Texten und Quellen auseinanderzusetzen, erfordert Arbeitstechniken, über die Schüler*innen möglicherweise noch nicht verfügen.

Wenn ich nun verhindern möchte, dass Schüler*innen weiterhin so arbeiten (und etwa Texte mit DeepL übersetzen oder Copy-Paste-Strategien anwenden), dann muss ich Schüler*innen zeigen, wie andere Verfahren funktionieren und Probleme bearbeiten, zu welchen diese passen.

Es kann beispielsweise sinnvoll sein, Schüler*innen lediglich einen guten Text suchen zu lassen – und nicht von ihnen zu verlangen, ihn zu paraphrasieren. Eine Verdichtung hilft ebenfalls: Schüler*innen nur einen Satz schreiben lassen, der alles Wesentliche beinhaltet. Dafür brauchen sie Recherche, können aber kaum etwas davon direkt übernehmen.

Allgemeiner versuche ich, agile Situationen zu schaffen, in denen Schüler*innen zwar auf Netztexte und Netzwissen zurückgreifen müssen, es aber nicht einfach nur kopieren, sondern reflektieren, anpassen, nutzen müssen. Zum Beispiel, indem sie einander gegenseitig etwas erklären sollen, was sie nachgeschlagen haben.

Wichtig scheint mir aus Sicht der Lehrpersonen, nicht mit etablierten Formaten weiterzuarbeiten, die sich in einer Kultur der Digitalität gewandelt haben.

Also keine Aufsätze schreiben lassen, sondern interaktionsorientierte Netztexte. Keine Vorträge halten lassen, sondern Debatten führen.

Das ist nicht absolut gemeint, sondern als Tendenz: Sich bewusst machen, dass unsere Aufgabestellungen mit bestimmten Verhaltensweisen verbunden sind. Schüler*innen sind nicht dumm oder unfähig – sie erscheinen so aus bestimmten Perspektiven. Wenn wir den Eindruck haben, sie machten etwas falsch, müssen wir uns fragen, ob wir an unserem Unterricht etwas ändern könnten.

Wie entsteht Spannung – Einblick in dialogischen & postdigitalen Deutschunterricht

Die Klassen, die ich als Deutschlehrer unterrichte, arbeiten mit eigenen Laptops in einer Microsoft-365-Umgebung. Diese Voraussetzung nutze ich für dialogische, postdigitale Settings – d.h.

  1. Ich vermittle nicht Wissen, sondern schaffe Settings, in denen Schüler*innen im Austausch mit Vorarbeiten, der Klasse und mit mir Wissen erwerben können.
  2. Digitalität ist der permanente Modus unserer Arbeit, nicht ihr Fokus. Wir arbeiten – und nutzen dazu selbstverständlich auch digitale Medien.

Wie das konkret aussieht, möchte ich kurz an einem aktuellen Beispiel beschreiben.

1 – Lektüre

Ich lese mit der Klasse »Die Nacht so groß wie wir« von Sarah Jäger. Der aktuelle Roman folgt fünf Jugendlichen, die sich gegenseitig herausfordern und ihre Freundschaft auf eine Probe stellen.

Das Buch hat die Klasse in einer Hardcover-Ausgabe angeschafft, ich verwende für die Vorbereitung und die Suche im Unterricht auch eine E-Book-Ausgabe.

2 – Arbeitsumgebung

Materialien und Arbeitsaufträge sammle ich auf einer Seite im Netz, die ich der Klasse auch via Teams zur Verfügung stelle. Ich mache das so, damit das Material frei verfügbar ist. Für die Schüler*inne ist das kein zusätzlicher Speicherort, weil in Teams eingebundene Seiten aussehen, als seien sie Teil der Plattform.

3 – Der dialogische Auftrag

Die Klasse liest den Roman sehr unterschiedlich: Einige sind begeistert, andere gelangweilt. Dieses Ergebnis einer Diskussion hat mich zum Auftrag geführt, die Schüler*innen darüber nachdenken zu lassen, was eine Erzählung spannend macht. (Das ist eine klassische Fragestellung der dialogischen Didaktik, die Urs Ruf intensiv bearbeitet hat.)

Die Aufträge bearbeiten die Schüler*innen in Teams, ich gebe ihnen dazu auch Feedback.

4 – Sammlung der Kernideen und Auseinandersetzung damit

In einem Craft-Dokument habe ich die Kernideen der Klasse gesammelt und ihr zugänglich gemacht. So sind aus der Klasse »Theorien zur Spannung« entstanden, welche die Schüler*innen dann auch kommentiert und gewichtet haben.

In einem zweiten Schritt habe ich dann Theorien gelöscht und zusammengefasst, wenn das die Diskussion in der Klasse nahegelegt hat.

So hat die Klasse in der Auseinandersetzung mit der Lektüre und ihrer Rezeption literaturwissenschaftliche Einsichten gewonnen, die ich nicht vermittelt habe.

5 – Anwendung

Als Vergleich zur deutschen Erzählung schauen und besprechen wir den US-Film »Booksmart«, der eine ähnliche Ausgangslage thematisiert.

Die Theorien der Spannung werden dabei angewendet und modifiziert.

6 – Weg vom Stoff, hin zum Lernen

Was Spannung oder Suspense ist, kann ich einer Klasse in fünf Minuten mitteilen. Dann haben wir das durchgenommen und können weitergehen.

Diese Art der Didaktik, die Stoff abarbeitet, ist für mich nicht geeignet, bleibende Lernerfahrungen zu machen. Schüler*innen haben überzeugend argumentiert, weshalb derselbe Text sehr spannend oder total langweilig ist. Sie merken, dass sich Lesehaltungen unterscheiden, dass Urteile begründet sein können, auch wenn sie nicht der eigenen Sicht entsprechen.

Sie lernen, wie man literaturwissenschaftlich argumentiert und die Argumente überprüft, revidiert und systematisiert. Wir entdecken Fachbegriffe und verwenden sie. Dazu nutzen wir immer digitale Medien, Recherche, Darstellungen: Dabei gelingt fachliches und überfachliches Lernen.

Unterricht ohne Aufgaben – Herausforderungen und Trainings

Ist Unterricht ohne Aufgaben denkbar? Diese Frage möchte ich im Folgenden kurz diskutieren – und skizzieren, welchen Wert das Nachdenken über dieses Problem hat.

Aufgaben bzw. eine an Schulen verbreitete Aufgabenkultur ist ein Problem für Schul- und Unterrichtsentwicklung: Aufgaben sind oft Teile von Prüfungen, die ohne Einbezug von Lernkontext, Lebenswelt, Persönlichkeit und Lernprozess Antworten abfragen, die in Musterlösungen festgelegt sind. Diese Aufgaben prägen dann implizit oder explizit die Lernkultur von Schulen, die Schüler*innen befähigen soll, Prüfungsaufgaben zu lösen.

Image

Jürgen Oelkers führt diese Konzeption von Unterricht auf Gilbert Ryle zurück, der Lernen als eine Folge des Lehrens versteht:

Unterricht besteht entsprechend aus einer Serie von Aufgaben und dazu passenden Leistungen, wobei ein Zeitmass mitgedacht wird, etwa eine Schulwoche oder ein Semester. Der Einsatz von Lernzeit wird gesteuert durch Aufgaben, die den Lernenden gestellt werden, wobei auch Lehrende Aufgaben zu bewältigen haben, solche nämlich, die der Vorbereitung und Durchführung des Unterrichts dienen – Hausaufgaben für Lehrer also.

Jürgen Oelkers (2017): Von Emile bis Peergroup

Reformpädagogische Ansätze haben den Fokus vom Lehren hin zum Lernen verschoben. Entsprechend fand in den letzten 20 Jahren in den Fachdidaktiken eine intensive Auseinandersetzung mit Aufgabenkulturen statt, wie sie z.B. bei Criblez nachvollzogen werden kann.

Was sind Aufgaben?

Criblez spricht davon, Aufgaben seien die »kleinste Einheit« von Unterricht und Kompetenzorientierung, die »unterste Ebene«. Josef Leisen bezeichnet Aufgaben als »didaktische Alleskönner« und unterscheidet folgende Typen:

In einer breiten Definition lassen sich Aufgaben folglich als alles definieren, was Lernaktivitäten auslöst (Leisen: »Es gibt kein Lernen und kein Lehren ohne Aufgaben.«). Dann ist klar: Diese Auslöser sind die Basis von Unterricht, ohne sie gibt es kein Lernen. Die Frage nach dem Verzicht wäre eine sinnlose.

Deshalb wähle ich eine etwas engere Definition:

Aufgaben werden allgemein als Aufforderung oder Angebot zum Denken und Handeln verstanden, wobei sie Ziele und Inhalte des Unterrichts auf einer didaktischen Mikroebene konkretisieren.

Kleinknecht (2019)

Ich verstehe also Aufgaben als Handlung von Lehrenden, die

  1. Schüler*innen zu einer bestimmten Aktivität auffordern.
  2. Implizit oder explizit inhaltliche wie auch formale Normen zu dieser Aktivität enthalten.

Konzepte wie »Lernaufgaben« weichen den Punkt 2. auf – sie sind aber begrifflich und konzeptionell immer noch sehr stark mit der von Oelkers dargestellten Ideologie verbunden, dass Lehrende Aufgaben vorbereiten, besprechen und beurteilen. Mehr noch: Aufgaben implizieren, dass Lehrende Lernenden Wissen vorenthalten. (Das wirkt dann ganz massiv auf die Prüfungskultur zurück, die insbesondere auch Hochschulen prägt und in ihrer Entwicklung hemmt.)

Was bringt der Verzicht auf Aufgaben – und wie muss man sich das vorstellen?

Beutel und Xylander schreiben, Schulen brauchten Konzepte, die »in einer von großer Ungewissheit geprägten Lebenswirklichkeit aktuelle Schlüsselprobleme der globalisierten Welt als Lernanlässe aufnehmen. […] Dieser Lernbegriff muss zugleich die Fragen der Kinder und Jugendlichen in den Mittelpunkt rücken.« (S. 27f.)

Der Fokus auf die Eigentätigkeit von Lernenden und auf Lernanlässe, die sich an wesentlichen Problemen orientieren, ist eine der zentralen Begründungen, weshalb Unterricht von mehr oder weniger normierten Aufgaben abrücken soll.

Die andere liegt in der zeitgemäßen Wissenskultur: Wissen ist übers Netz zugänglich. Aufgaben, die darauf basieren, Wissen erst verzögert oder strukturiert zugänglich zu machen, stehen auf tönernen Füßen, sobald Schüler*innen mit Smartphones oder anderen Geräten im Netz arbeiten. Dann richtet sich enorm viel Energie im Unterricht darauf, zu verhindern, dass Lernende so arbeiten können, wie sie eigentlich arbeiten sollten: vernetzt.

Was passiert, wenn sich Schulen und Unterricht von Aufgaben in einem engen Sinn lösen? Sie fokussieren sie auf eine Kombination von Herausforderungen und Training.

Herausforderungen erwähnt Renate Girmes in ihrer Konzeption von Aufgaben – einer Konzeption, die davon ausgeht, dass Lernende sich Aufgaben stellen und sich auf Aufgaben beziehen, die sich ihnen stellen (danke für den Hinweis, Andreas Körber):

Individuelle Herausforderung bewirken Aufgaben: Aufgaben, die sie sich
stellen und die sich ihnen stellen. Also geht es in Bildungsprozessen im
mehrfachen Wortsinn darum, sich Aufgaben zu stellen. Was sind Aufgaben?
Aufgaben sind gegenstandsbezogen und der Ausdruck für eine Lücke zwischen dem, was ist und dem, was sein könnte, zwischen Bedingungen und Orientierungen; wird die Lücke empfunden bewirkt das bei den Aufgabenbearbeitern, dass sie das an Wissen und an Können, was ihnen zur Lösung der gesehenen Aufgabe nützlich sein könnte, auf ihre Aufgabe beziehen und dass sie das, was zur Lösung fehlt, zu finden oder zu entwickeln versuchen. Weil das so ist, sage ich: Alles Wissen und Können der Welt, nimmt Bezug auf Aufgaben.

Renate Girmes (2014): ,Allgemeine Didaktik‘ als Theorie der sich stellenden Aufgaben, S. 20

Ich würde hier nicht mehr von Aufgaben sprechen, sondern von Problemen: Lernende arbeiten an Herausforderungen und Problemen, die sich ihnen stellen. Das ist aber nicht zentral: Entscheidend ist, wer Lernaktivitäten auswählt, anregt, beurteilt, in Sinnzusammenhänge einordnet – nämlich die Lernenden selbst.

Die Lehrenden schaffen Arrangements, in denen das Lernende mit hoher Qualität und Verbindlichkeit tun können. Und bieten Trainings für das an, was Girmes »Lücke« nennt: Wiederholungen basaler Aktivitäten, die dabei verbessert werden. Ganz analog zu Training im Sport.

Schulen, die Trainings anbieten und Lernende an Herausforderungen arbeiten lassen, arbeiten nachhaltiger. Sie werden sofort von Noten und Beurteilungen abrücken, werden Selektion und Vergleichbarkeit hinterfragen und problematische (Macht-)Strukturen abbauen. Aufgaben sind auf mehreren Ebenen ein Problem – es ist Zeit, an Alternativen zu denken.

Dieser Beitrag wurde durch diese Diskussion auf Twitter möglich. Danke allen für die Anregungen.

Quelle

Mein Abschied von der Textverarbeitung

Am Wochenende habe ich Craft kennengelernt – ein Tool, das für mich all das kombiniert, was ich für die Publikation von Texten und Materialien brauche.

Craft bedeutet für mich der Abschied von Textverarbeitungsprogrammen. Ich habe jahrelang gebraucht, um Textverarbeitung und Layout zu verstehen. Im Umgang mit Word bin ich recht kompetent, ich kann vieles automatisieren, einstellen, so einrichten, dass das rauskommt, was ich möchte. Gleichwohl ist Word zu kompliziert – zu viele Menus, zu viele Einstellungen, zu viele Möglichkeiten.

Aber auch zu wenig: Word ist nicht richtig kollaborativ. Will ich einen Link erstellen, um anderen Word-Dokumente zur Verfügung zu stellen, muss ich erst was hochladen, was freischalten, jemanden einladen, ein Konto überprüfen etc. Word-Dokumente sind irgendwie bei mir, nicht im Netz.

Der Abschied von Word hat sich angekündigt: Ich habe lange mit LaTeX gearbeitet für große Dokumente (zu mühsam, wenn man mal wieder was vergisst), habe dann viel mit GoogleDocs geschrieben (mache ich heute immer noch), mit dem iA-Writer zu konzentrieren versucht, eine Weile lang Projekte mit Scrivener organisiert und zuletzt viele Text direkt mit HackMD geschrieben, damit ich sie leicht mit anderen teilen kann.

Craft kombiniert nun für mich alles:

  1. Das Tool ist übersichtlich und intuitiv.
  2. Die Texte sind auf all meinen Geräten sofort synchronisiert.
  3. Ich kann sie mit einem Link sofort als schöne Website teilen.
  4. Ich kann leicht Bilder, Tabellen etc. einfügen.
  5. Das Layout ist schöner, als wenn ich selber was bastle.
  6. Eine sinnvolle Kommentarfunktion ermöglicht zusammenarbeit.

(Ich kriege kein Geld von Craft, die Vollversion kostet rund 50 Geld pro Jahr.)

Extrinsische Motivation gibt es nicht – weshalb sich Menschen nur selber motivieren können

Lehrende stehen oft Klassen gegenüber, die sich für Unterrichtsaktivitäten nicht gut motivieren können. Sie haben keine Lust, das zu tun, was in der Unterrichtsplanung für sie vorgesehen wurde. Die Lehrperson ist (oder fühlt sich) aber verpflichtet, dennoch mit den Schüler*innen diese Aktivitäten durchzuführen. Was passiert?

Die Lehrperson sucht nach Anreizen, welche die Schüler*innen »extrinsisch motivieren« sollen. Zum Beispiel sprechen sie von Prüfungen, bei denen die Unterrichtsaktivitäten wichtig sind. Oder sie stellen Belohnungen in Aussicht oder drohen Strafen an, wenn die Klasse sich wie erwünscht verhält.

(Gestern habe ich Coach Carter gesehen, ein Film über einen Basketballtrainer, dessen Spieler Linienläufe oder Liegestütz machen müssen, wenn sie sich nicht so verhalten, wie er das möchte.)

Coach Carter | Netflix
Coach Carter, Screenshot

Die Anreize, welche Lehrende einsetzen, legitimieren sie meist dadurch, dass sie Schüler*innen so motivieren. Sie setzen sie unter Druck, aber nur deshalb, damit die Kinder oder Jugendlichen dann das tun, was sie tun sollten, was für sie gut ist.

Im Hintergrund steht oft die Theorie der selbstregulierten Motivation, wie sie Deci und Ryan formuliert haben (1993):

Extrinsisch motivierte Verhaltensweisen können durch die Prozesse der Internalisation und Integration in selbstbestimmte Handlungen überführt wer den. […] Wir sind der Auffassung, dass der Mensch die natürliche Tendenz hat, Regulationsmechanismen der sozialen Umwelt zu internalisieren, um sich mit anderen Personen verbunden zu fühlen und Mitglied der sozialen Umwelt zu werden. Durch die Integration dieser sozial vermittelten Verhaltensweisen in das individuelle Selbst schafft die Person zugleich die Möglichkeit, das eigene Handeln als selbstbestimmt zu erfahren. Im Bemühen, sich mit anderen Personen verbunden zu fühlen und gleichzeitig die eigenen Handlungen autonom zu bestimmen, übernimmt und integriert die Person also Ziele und Verhaltensnormen in das eigene Selbstkonzept.

Die Selbstbestimmungstheorie der Motivation, S. 227

Was als »extrinsische Motivation« bestimmt wird, ist so ein Trick, mit dem Menschen Druck (oder Anreizen) begegnen: Wenn sie sich nicht dagegen wehren können, tun sie so, als wäre das Erfüllen externer Vorgaben etwas, was sie selber wollen. Sie tun das, so Deci und Ryan, um sich anderen anzupassen. Wenn also Lehrende ganze Klassen davon überzeugen können, dass sie im Unterricht Dinge tun müssen, die sie zunächst gar nicht wollen, dann beginnen die Schüler*innen diese Aktivitäten irgendwann doch als selbstbestimmt zu interpretieren.

Das ist aber keine Motivation, die darin besteht, eine eigene Aktivität zu wollen – es ist der Trugschluss, eine ungewollte Aktivität sei doch irgendwie gewollt. »Extrinsische Motivation« ist eine unfaire Abkürzung, eine Rechtfertigung von Druck auf Menschen zu ihrem eigenen Wohl.

Was wäre die Alternative? Mit Schüler*innen daran zu arbeiten, Freude an Lernaktivitäten zu finden, ohne sie unter Druck zu setzen. Ihnen zu helfen, Vorstellungen zu entwickeln, wie sie sich entfalten können, was ihnen Freude bereitet und ihnen guttut. Ihnen in attraktiven Lernumgebungen den Raum zu geben, ihrer Motivation nachzugehen. Kinder und Jugendliche können sich selber motivieren – und sie können nicht über Anreize motiviert werden.

Wie sich digitale Gespräche wandeln – und wie sie sich automatisieren werden

»Schreibst du mit ihm?« – Das Verb »schreiben« kann erst seit ein paar Jahren analog wie sprechen verwendet werden. Das ist ein Reflex des interaktionsorientierten Schreibens auf digitalen Plattformen: Seit Menschen chatten, erleben sie schreiben als eine gemeinsame Aktivität, die sie mit jemandem zusammen ausführen. Deshalb ist es sinnvoll, von digitalen Gesprächen zu sprechen.

Das bedeutet, dass diese Formen des Schreibens stark mit sozialen Normen und mit Erwartungen verbunden sind. Was jemand in einem Chat schreibt, ist ein Geflecht von Fragen und Antworten, von Aktionen und Reaktionen eingebunden, die – im Vergleich mit dem Briefverkehr – sehr schnell sichtbar sind. Die Darstellung und das Repertoire dieser Aktionen und Reaktionen wird durch die Möglichkeiten, welche Plattformen zur Verfügung stellen, beeinflusst.

Im Folgenden skizziere ich ein paar wesentliche Umbrüche und Entwicklungen – und werfe einen Blick in die Zukunft.

(1) Längenbeschränkungen und Aufteilung

Die ersten SMS-Systeme waren kostenpflichtig: Jede Nachricht führte zu einer Gebühr, die Länge der Nachrichten war beschränkt. So fassten sich die Menschen kurz und verwendeten oft innovative Abkürzungen (oder zeigten einander, dass die Kosten für die Kommunikation sich lohnen). Längere Beiträge mussten unterteilt werden.

Die Enden (und Anfänge) von einzelnen Nachrichten erhielten so eine syntaktische Funktion, sie sind ein zusätzlicher, stärkerer Marker für Interpunktion. Das dürfte der Hauptgrund sein, weshalb Nachrichten heute auf Deutsch kaum mit Punkten abgeschlossen werden (weil das Ende der Nachricht schon stark gekennzeichnet ist).

(2) Lesebestätigungen

2011 haben die ersten Messaging-Systeme eine Funktion eingeführt, die erlaubt, nachzuvollziehen, ob die andere Person die Nachricht erhalten und/oder gelesen hat.

Dadurch entsteht ein genaueres Verständnis der Reaktion der anderen Person, insbesondere bei ausbleibenden Antworten. Nicht zurückzuschreiben bedeutet abhängig vom Lesestatus etwas anderes:
a) nicht antworten, die Nachricht aber gelesen haben
b) nicht antworten, die Nachricht aber erhalten haben
c) nicht antworten, die Nachricht nicht erhalten haben.

Sofort haben Ratgeber die Runde gemacht, die erklären, wie sich diese Funktion ausschalten lässt. Verständlicherweise fühlten sich Menschen überwacht, nachdem sie zuvor als einzige wussten, ob sie Nachrichten gelesen hatten oder nicht. Gleichzeitig war aber auch das Ausschalten markiert, es konnte als Verstoß gegen eine Norm, als Misstrauen gelesen waren.

Das Beispiel zeigt, dass veränderte technologische Bedingungen von Messaging:

  1. Schriftliche Kommunikation oft näher an die mündliche Gesprächssituation heranführen (ich merke in einem Gespräch, ob andere Personen mich gehört haben; schweigen ist immer kontextbezogen bedeutsam).
  2. Zwar individuell in Einstellungen angepasst werden können, auf der Ebene der kommunikativen Normen aber nicht rückgängig gemacht werden können. Wer so kommuniziert, wie das technisch vor einem Entwicklungsschritt die Norm war, wird unter Umständen seltsam/altbacken/inkompetent/unprofessionell etc. wahrgenommen.
»blue checkmarks« in WhatsApp

(3) Emojis, Bilder, Sticker

Kommunikation wird visuell. Verbale Sprache ist – wiederum wie in der mündlichen Gesprächssituation – eine von mehreren Möglichkeiten der Verständigung.

Die visuelle Kommunikation an sich ist wiederum einem permanenten Wandel unterzogen. Emojis sind heute etwa ein Zeichen von Boomer-Kommunikation, die Jugendliche »cringe« finden.

(4) Gruppenchats

Die Möglichkeit, mehrere Menschen zu Gruppen hinzuzufügen, steigert die Komplexität von Normen. Wer eine Nachricht schickt, muss abwägen, ob sie in einen Gruppen- oder einen Einzelchat gehört. Das Eröffnen und Bespielen von Gruppen folgt wiederum sozialen Regeln: Welcher Gesprächsanlass rechtfertigt es, einen Gruppenchat zu erstellen oder darin eine Nachricht zu schicken? Wie sollte man auf Gruppennachrichten reagieren?

Die Plattformen haben für einige der Probleme wiederum neue technische Möglichkeiten geschaffen: Beispielsweise gibt es heute Broadcasting-Gruppen, in denen nur Admins schreiben, aber viele Menschen mitlesen können.

(5) Sprachnachrichten

Die Tatsache, dass schriftliche Kommunikation immer Normen und sozialen Bewertungen unterliegt (die Kompetenzen von Menschen werden anhand ihrer Rechtschreibung und der Coolness ihrer Sticker eingeschätzt etc.), sowie der handwerkliche Aspekt des Tippens (auf Smartphones) machen es attraktiv, gesprochene Sprache aufzuzeichnen und zu verschicken.

Sprachnachrichten machen aus Chats asynchrone Telefonanrufe, die aber kombiniert mit visuellen und schriftlichen zu einer symmedialen Gesprächskultur führen.

Gleichzeitig verändern Sprachnachrichten die Affordanz von Chats nachhaltig – sie erfordern das Tragen von Kopfhörern, damit sie so abgespielt werden können, dass in der Öffentlichkeit oder an Arbeitsplätzen niemand gestört wird. Das stört Menschen, die gewohnt waren, Chats nebenher lesen und bearbeiten zu können, etwa während Meetings oder anderen Arbeitsformen. Anderen erleichtert es die Teilnahme an Chats, weil sie nur langsam tippen konnten oder Gedanken schriftlich nur wenig wirksam kommunizieren können.

(6) Reaktionen und aktives Zuhören

Eine nächste Evolution besteht in der Funktion, auf Chatnachrichten reagieren zu können. Das ermöglicht eine Erweiterung des aktiven Zuhörens in Chats: Für Adressat*innen wird es leichter zu zeigen, dass sie eine Nachricht wahrgenommen haben, gerade auch in sozialen Kontexten, in denen es nicht mehr zu sagen gibt, ein (positives) Signal, dass eine Nachricht angekommen ist, aber sinnvoll ist.

Das ist der aktuelle Stand – was folgt, sind weitere absehbare Entwicklungen.

(7) Text-to-Speech und Speech-to-Text

Heute ist es bereits recht einfach, Text in gesprochene Sprache umzuwandeln – und Sprachnachrichten in Text. Wo heute noch Tools oder Programme eingesetzt werden, dürften in Zukunft Chat-Apps entsprechende Funktionen integriert anbieten: Es wird also möglich, Input und Output wahlweise gesprochen oder geschrieben zu erhalten (und ihn auch direkt in andere Sprachen zu übersetzen). Das führt sicher teilweise zu Unsicherheiten und Ungenauigkeiten, insgesamt dürfte es aber die Teilhabe an Kommunikation aber erleichtern.

(8) Automatisierung mit KI-Vorschlägen

Eine weitere Funktionalität bietet Microsoft Teams bereits an: Vorschläge der KI, wie man antworten könnte. Diese Vorschläge werden schnell besser, wenn sie personalisiert werden: Wertet eine App Muster aus, wie ich in der Vergangenheit kommuniziert habe, so kann sie mir Textbausteine anbieten, die genau meinem Gesprächsverhalten entsprechen.

sie Chat in Microsoft Teams, 2021

(Der Screenshot zeigt eine Doppelung – offenbar denkt auch iOS, das Betriebssystem meines Mobiltelefons, dass »danke« eine gute Antwort sein könnte und schlägt sie mir als Wort vor.)

Ähnlich wie bei Autos werden wir Chats in Zukunft halb-automatisch führen: Gestützt mit Vorschlägen, Übersetzungshilfen und Umwandlungswerkzeugen werden wir mit weniger kognitivem Aufwand kommunizieren. Allerdings teilweise auch mit Maschinen schreiben, zumindest teilweise… 

Sind digitale Plattformen für Kinder gefährlich?

Dieser Austausch mit dem Leiter des Instituts für Cyberkriminologie an der Hochschule der Polizei des Landes Brandenburg bringt mich dazu, die im Titel gestellte Frage genauer zu beantworten.

Zunächst müssen Elemente der Frage geklärt werden:

  1. »Sind«
    Gemeint ist: Der verantwortungsbewusste, altersgemäße Einsatz, begleitet durch kompetente Eltern. Also diejenigen Kinder, deren Eltern sich überhaupt informieren, wie gefährlich oder nicht gefährlich etwas ist – und die etwas so einsetzen, dass es möglichst nicht gefährlich ist (also den Kindern beim Radfahren einen Helm anziehen).
  2. »digitale Plattformen« 
    Gemeint ist für mich damit jede Netzaktivität, bei der User-Profile Inhalte und Nachrichten austauschen. Online-Games sind genauso digitale Plattformen wie Social-Media-Dienste etc.
  3. »für Kinder«
    6-12-Jährige
  4. »gefährlich«
    Das Risiko für eine psychische/physische Verletzung ist pro Stunde Nutzung deutlich größer als beim Radfahren mit Helm oder anderen Aktivitäten, die Eltern für unbedenklich halten.

2019 verunglückten in Deutschland 13’250 Kinder von 6-12 Jahren im Straßenverkehr. Gehen wir davon aus, dass Kinder in diesem Alter pro Tag 60 Minuten im Straßenverkehr verbringen (2007 waren die Zahlen deutlich höher), dann bedeutet das bei rund 4.6 Millionen Kindern in dieser Altersgruppe 0.79 Verletzungen pro Million Stunden. Bei einer Dunkelziffer von deutlich über 50% können wir von 1.5 Verletzungen pro Million Stunden ausgehen.

Jugendliche verbringen in der Schweiz nach eigenen Angaben an Wochentagen mehr als zwei, an Wochenende mehr als drei Stunden im Internet (Quelle: JAMES-Studie 2020). Für die folgenden Berechnungen gehen wir bei Kindern von 6-12 Jahren von einer Nutzungsdauer von knapp 20 Minuten pro Tag aus, die auf digitale Plattformen entfallen.

2020 endeten in der Schweiz 283 »Cyber Sexualdelikte« und 844 Delikte im Bereich »Rufschädigung und unlauteres Verhalten« mit einer Verurteilung – insgesamt waren in knapp 1000 Fällen unter 20-Jährige betroffen. Angenommen, der Anteil der 6-12-Jährigen besteht dabei aus rund 140 Fällen.

Verteilung der geschädigten Personen nach Alter und Bereich der digitalen Kriminalität

Rund 520’000 Kinder verbringen in der Schweiz nach diesen Annahmen pro Jahr 100 Stunden auf digitalen Plattformen: Das ergibt 52 Millionen Stunden. Darauf entfallen 140 Verletzungen. Gehen wir hier von einer Dunkelziffer von 75% aus, dann kommen wir auf 11.5 Verletzungen pro Million Stunden.

Hier stecken viele Annahmen drin – keine der Fragen kann genau beantwortet werden. Die Abschätzung zeigt aber, dass die Nutzung digitaler Plattformen pro Stunde Aktivität für Kinder gefährlicher ist als Straßenverkehr. Was völlig fehlt ist der Aspekt der Begleitung: Betreffen die Delikte bzw. Unfälle Kinder, die sorgfältig begleitet werden oder nicht? Das lässt sich statistisch aufgrund der mir verfügbaren Daten nicht erheben.

Wie Noten subjektive Eindrücke »objektivieren« – und weshalb das ein Problem ist

Denken wir im Alltag über Kompetenz nach, dann schätzen wir sie aufgrund unserer Wahrnehmung ein. Wir werden zum Essen eingeladen und beurteilen danach, wie gut der Gastgeber kochen kann: Aufgrund einer Mahlzeit. Wir sehen ein Fußballspiel und beobachten, wie die eingewechselte Außenverteidigerin einen Ball verfehlt und fällen ein Urteil über ihre Fähigkeit, Fußball spielen.

Unsere Eindrücke sind subjektiv, sie sind selektiv, sie sind ungenau. Das ist nicht weiter schlimm, weil unsere Meinung, ob jemand gut kochen oder Fußball spielen kann, weitgehend belanglos ist.

Auch in der Schule basieren Bewertungen auf Wahrnehmungen, die denselben Verzerrungen unterliegen: Wir lesen einen Aufsatz, der etwas ins uns anspricht oder uns nervt. Wir schätzen die mündliche Mitarbeit eines Schülers ein, der freundlich, konstruktiv und dessen Hand immer oben ist. Wir korrigieren die Lösungen von unter Zeitdruck gelöster Mathematikaufgaben und versuchen, die dahinterliegenden Überlegungen zu rekonstruieren.

Da die Eindrücke subjektiv sind, die Bewertung aber so erscheinen sollte, als wäre sie nicht subjektiv, gibt es eine Reihe von Tricks: Kriterienraster, Punkteskalen und Noten sind Methoden der »Objektivierung«, wie das Studierende in einem meiner Seminare kürzlich genannt haben.

»I give the teddy bear two and a half stars.« So endet jede Folge von John Greens Anthropocene Reviewed Podcast, aus dem er kürzlich ein Buch gemacht hat. Green verwendet eine 5-Stern-Skala ironisch:

The five-star scale doesn’t really exist for humans; it exists for data aggregation systems, which is why it did not become standard until the internet era.

The Anthropocene Reviewed, Introduction

Er verweist darauf – das ein Leitmotiv seines Projekts – auf den Widerspruch zwischen dem menschlichen Bedürfnis, alles zu bewerten, und der Unmöglichkeit, das objektiv zu tun. Was Green über den Teddybär sagt oder schreibt, hat nichts mit 2.5 Sternen zu tun, es ist keine Bewertung in diesem engen, verrechenbaren Sinn. Der Velociraptor oder die Klimaanlage, die von ihm 3 Sterne erhalten, sind nicht »besser« als der Teddybär.

Die ironische Bewertung von Green macht deutlich, wie absurd der Vorgang der »Objektivierung« in Schulen ist. Als Lehrer nehme ich etwas wahr, was Schüler*innen tun. Ich kann ihnen eine Rückmeldung auf eine Leistung geben, einen Hinweis, wie sie sich entwickeln könnten, ich kann sie korrigieren. Sobald ich aber vorgebe, ich könnte auf einer Skala messen, wie gut ihre Leistung ist, wird das Verfahren absurd. Warum eigentlich?

  1. Weil wir nichts messen, sondern mehr oder weniger willkürlich zuerst Punkte und dann Noten geben.
  2. Weil wir die Punkte und Noten so geben, dass eine Art Normalverteilung rauskommt, obwohl niemand genau weiß, weshalb Noten normalverteilt sein sollten.
  3. Weil es keine objektive Datengrundlage gibt, sondern nur subjektive Eindrücke, die dann so dargestellt werden, als seien sie nicht subjektiv.
  4. Weil Noten soziale Vergleiche, individuelle Entwicklungen und kriteriale Normen auf eine Weise vermischen, die ihnen jede Aussagekraft nimmt.

Subjektive Rückmeldungen wären ehrlicher und wirksamer. Noten sollten durch Gespräche über Leistungen und Feedback ersetzt werden. So steht das auch in unserem Buch, das bald erscheint.

Die Vorstellung, mündliche Mitarbeit oder kreative Leistungen könnten schlechter benotet werden als die Bearbeitung von Geografie- oder Physik-Aufgaben, hängt nur mit Techniken der Objektivierung zusammen: Da Geografie und Physik mit klassischen Aufgaben geprüft wird, gilt es als akzeptiert, dass diese Aufgaben Kompetenz messen könnten. Das ist nicht der Fall: Die Aufgaben sind ja wiederum willkürlich, sie prüfen kontextbezogen Teilkompetenzen, die aufgrund von dem, was in einer Prüfungssituation aufgeschrieben wird, beurteilt werden. Eine Prüfung schreiben, sie zu korrigieren und dann eine Note zu setzen ist genauso subjektiv, wie eine Zeichnung mit einer Note zu bewerten. Es wirkt nur anders.