Für die diesjährigen schriftlichen Maturprüfungen im Fach Deutsch haben die beteiligten Lehrpersonen ein Verfahren entwickelt, das Schreibzeit ohne KI-Zugriff mit der Möglichkeit kombiniert, den eigenen Text mit Internet- und KI-Zugang zu erweitern und zu verbessern.
Die Grundidee habe ich hier schon einmal beschrieben, heute möchte ich eine Auswertung vornehmen. Sie erfolgt ausgehend von meinen Erfahrungen mit einer Klasse sowie auf der Basis von Gesprächen mit internen und externen Kolleg:innen. Im Beitrag gehe ich auf Einsichten ein, die ich insbesondere im Gespräch mit Annamarie Cantieni, Andrea Schmid, Carmen Aus der Au, Joel Strassberg und Eva-Maria Burri gewonnen habe. Auch mit einigen Expert:innen von anderen Schulen habe ich über das Format geredet. Zudem habe ich mich mit einigen Schüler:innen über ihre Schreiberfahrungen ausgetauscht und die KI-Protokolle genau studiert. Was ich hier aber schreibe, ist meine Sicht auf den Prozess – meine Kolleg:innen und die Expert:innen würden einzelne oder einige der Punkte sicher anders einschätzen, als ich das tue. Die Gespräche sind auch nicht abgeschlossen – wir starten gerade in die Vorbereitungen der Prüfungen vom nächsten Jahr.

Das Ergebnis
Das Format ist aus meiner Sicht ein Erfolg: Entstanden sind persönliche, eigenständige Texte, die sprachlich präzise und gut lesbar sind – zumindest, wenn man Text B betrachtet. Das hat auch mit der Themenauswahl zu tun, in meiner Klasse wurde besonders das auf dem folgenden Filmausschnitt beruhende Thema häufig gewählt – es hat den Schüler:innen erlaubt, gesellschaftspolitische Überlegungen, die im Rahmen der Erbschaftssteuer-Initiative entstanden sind, mit einer persönlichen Reflexion zu koppeln.
In einer Analyse der historischen und aktuellen Praxis rund um Maturaufsätze habe ich folgenden Wunsch formuliert: Eine «persönliche Reflexion über das, was jungen Menschen am Schluss ihrer gymnasialen Lernzeit wichtig ist». Das ist in 90% der Texte, die ich gelesen habe, gelungen. Fast alle Schüler:innen haben vier Stunden lang intensiv geschrieben und sich mit den Fragestellungen vertieft auseinandergesetzt.
Die entscheidende Möglichkeit, die sich aus dem Format ergibt, ist die Korrektur der eigenen Texte. Schüler:innen haben im Text B in fast allen Fällen die drei Punkte verbessert, die ich in einer Rückmeldung zuerst kritisiert hätte. Das betrifft alle Ebenen der Schreibarbeit: Formulierungen, Struktur, inhaltliche Ungenauigkeiten, Argumente, blinde Flecken, Querverweise, Inkonsistenzen.
Problematisch sind die formal und sprachlich teilweise unbeholfenen Texte im Teil A – sowie die wenigen Schüler:innen, die sich ihren Text von der KI haben abschwächen und neutralisieren lassen.
Das Problem des Fremdwissens
Die Aufgabe zu Text B haben wir im Laufe des Entwicklungsprozesses abgeschwächt: Zunächst wollten wir noch einmal einen themenspezifischen Prompt vorgeben, der eine konkrete Überarbeitung und Erweiterung des Textes erfordert hätte. Viele Schüler:innen waren damit überfordert, einige haben den Zusatzauftrag übersehen oder ignoriert. Deshalb haben wir hier eine einfachere Lösung gesucht und allen Schüler:innen denselben Auftrag gegeben:
- Ergänzen Sie den Text A mit Fremdwissen, also z.B. Hintergrundinformationen, Daten oder Zitaten. Verwenden Sie dafür qualitativ hochwertige Quellen. (Aus KI-Tools kopierte Textblöcke sind keine hochwertigen Quellen.)
- Überarbeiten Sie den Text formal und stilistisch.
Das hinzugefügte Fremdwissen ist in den guten Fällen Wissen, das die Schüler:innen im Text A schon umrissen oder erahnt haben. Es sind Inhalte, die den Schreibenden gefehlt haben, auf die sie zugegriffen hätten, wenn sie bei Text A die Möglichkeit dazu gehabt hätten.
In den schlechteren Fällen sind es künstlich wirkende, meist unzulänglich integrierte Zitate oder Verweise. Schüler:innen kennen den relevanten Kontext kaum und übernehmen KI-Vorschläge unkritisch. Plötzlich schreiben sie über Bourdieu oder Kant – ohne dass sie verstanden hätten, worum es in den Vorlagen geht und was Verweise darauf leisten könnten.
Hier müssen wir bei der nächsten Durchführung eine bessere Vorbereitung leisten, damit Schüler:innen stärker das schon vorbereitete Vorwissen einbauen und auf die künstlichen Referenzen verzichten.
Drei Typen von Schüler:innen
Die Schüler:innen verhalten sich der Aufgabe gegenüber unterschiedlich. Ich würde drei Typen unterscheiden (diese Typen werden sich verändern, da die 2026 geprüften Schüler:innen noch eine recht analoge Schreibsozialisation durchlaufen haben und erst in den letzten Jahren KI-Tools genutzt haben).
Typ 1: Die Eigenständigen
Schüler:innen von Typ A können gut schreiben. Sie haben Vertrauen in ihre Fähigkeiten und kennen Prozesse, mit denen sie ausgehend von Vorgaben einen wirkungsvollen Text erstellen können. Sie überarbeiten und korrigieren eigene Texte.
KI brauchen sie dazu nur selten und eher ungern. Dem Typ A wäre es lieber, der Aufsatz könnte ohne KI geschrieben werden, weil dann ihre Fähigkeiten, stilistisch und orthografisch sicher zu schreiben, im Vergleich mehr Gewicht erhielte. Typ A ist vorsichtig beim Einsatz von KI und ändert wenig an den eigenen Texten.
Typ 2: Die Routinierten
Typ B – zu dem ich meiner Klasse die meisten Lernenden zählen würde – kennt das Verfahren aus der eigenen Praxis. Schüler:innen dieses Typs können eigene Texte verfassen, sie wissen aber, dass diese bei Fehlern und Unsicherheiten besser werden, wenn eine KI-Überarbeitung erfolgt. Deshalb kennen sie sich auch mit den Möglichkeiten von KI-Tools aus.
Für Typ B passt dieses Format genau, es entspricht ungefähr den Prozessen, welche diese Schüler:innen auch ausserhalb der Maturprüfung anwenden würden.
Typ 3: Die KI-Affinen
Diese Schüler:innen geben KI-Protokolle ab, in denen sichtbar wird, dass sie schon in der Vorbereitung KI-Projekte aufgesetzt haben, welche sie bei den anfallenden Aufgaben unterstützen können. Sie nutzen oft überlegte Prompts (insbesondere Rollen-Prompts) und lassen sich von KI-Tools durch den ganzen Schreibprozess coachen. Die so entstandenen Texte B sind stark vom KI-Einsatz geprägt und fundamental überarbeitet – während die Texte A, die KI-Affine schreiben, teilweise wenig mehr als ins Unreine geschriebene Notizen sind. Bei diesen Schüler:innen ist etwas unklar, ob sie sich durch den geschickten Einsatz von KI einen Vorteil verschaffen, der anderen nicht zugänglich ist – oder ob sie letztlich einfach zeigen, was theoretisch leistbar wäre, auch wenn nicht alle diesen Aufwand betreiben wollen.
Vibe Writing: KI-Kompetenzen und KI-Schreiben
Deutschlehrer:innen verstehen recht gut, was Schreibkompetenzen sind und wie sie diagnostiziert werden können. Bei KI-Kompetenzen fällt uns das teilweise schwer: Was ist ein kompetenter Einsatz von LLM-Tools und was ist ein unbeholfener, problematischer?
Um das an einem Beispiel festzumachen: Einige Schüler:innen benutzen KIs für Texte so, wie sie andere für Bilder benutzen. Sie schreiben nicht selber, sondern geben einer Maschine Anweisungen, wie sie einen Text gestalten soll. Der Prozess besteht aus einer Abfolge von Prompts, das von der KI ausgegebene Ergebnis ist der fertige Text.
Betrachtet man diese Praxis, so könnte man kritisch sagen, dass Schüler:innen nicht mehr selber schreiben. Sie betreiben Vibe Writing – ganz ähnlich, wie Menschen beim Vibe Coding nicht selber programmieren. Andererseits könnte man alle die Zwischenschrite und einzelnen Prompts auch als Praxis verstehen, die dem Schreiben gleicht. In diese Anweisungen fliesst viel Wissen über Texte ein. Wer nicht versteht, was gute von weniger guten Texten unterscheidet, kann auch einer KI keine diesbezüglichen Anweisungen geben. Zudem ist es für viele Schüler:innen schlicht nicht sinnvoll, selber zu formulieren: Sie sind zu langsam, zu unsicher und machen zu viele Fehler. Ohne den Taschenrechner-Vergleich überstrapazieren zu wollen: Wer sicher und schnell rechnen will, macht das oft besser nicht im Kopf.
Dieser Umgang mit KI-Tools führt zu einem Kompetenzkatalog, den wir entwickeln müssen, wenn diese Art des Schreibens weiter eine so grosse Bedeutung hat, wie das heute der Fall ist. Entsprechend brauchen Schüler:innen Anleitungen, intelligente Übungsgelegenheiten, Feedback. Die KI-Nutzung darf – wie das beim Maturaufsatz nach Uetiker Modell der Fall ist – nicht verboten und tabuisiert werden, sondern soll verbindlicher Teil von Schreibaufgaben sein. (Der Einblick in die KI-Protokolle der Schüler:innen ist für mich enorm aufschlussreich.)
Grundsätzliche Überlegungen
Von Kolleg:innen habe ich als Rückmeldung auf den ersten Post Fragen und Thesen erhalten, welche die Prüfungs- und Schreibpraxis rund um den Maturaufsatz generell betreffen. Dazu einige knappe Bemerkungen:
- Der Grundwiderspruch zwischen Prüfungslogik und Praxislogik
Das stärkste Argument für das Modell – «Schreiben soll so geprüft werden, wie Fachpersonen schreiben» – ist gleichzeitig ein strukturelles Problem. Professionelles Schreiben ist kollaborativ, iterativ, zeitlich offen. Eine Maturprüfung ist individuell, zeitlich begrenzt, bewertungsorientiert. Während wir mit der KI-Nutzung einen Aspekt der Praxis übernehmen, bleiben die restlichen Einschränkungen der Prüfungssituation bestehen. Das Modell ist weder ganz Prüfung noch ganz Praxis. Entscheidend ist für eine gute Prüfung nicht unbedingt die Frage, wie Menschen in der Praxis schreiben. Die zentralen Fragen lauten vielmehr:
a) In welchem Setting schaffen es junge Erwachsene, vier Stunden Schreibarbeit als sinnvoll und produktiv zu erleben und dabei einen lesenswerten Text zu verfassen?
(Im Gegensatz zu traditionellen Formaten will beim Uetiker Modell praktisch niemand den Text früher abgeben.)
b) Welche Schreibaufgaben erlauben eine Beurteilung von Kompetenzen, die für ein Studium relevant sind?
Diese Fragen lassen sich nicht abschliessend beantworten. Es dürfte sinnvoll sein, das Format iterativ anzupassen und abzuwarten, wie sich z.B. akademische Schreibprozesse in den nächsten Jahren verändern. - Lohnt sich der Aufwand?
Die meisten Prüfungsformate haben Schwächen. Meist werden bestimmte Kompetenzen gut sichtbar, andere nicht. Lohnt es sich bei dieser Ausgangslage wirklich:
a) dieses Format didaktisch einzuführen
b) alle relevanten Kompetenzen zu trainieren
c) ein kompliziertes technisches Setup vorzunehmen und
d) zwei Texte und ein KI-Protokoll zu beurteilen,
wenn man auch einfach einen Text schreiben lassen könnte, wie das an vielen Schulen der Fall ist?
Ich persönlich denke ja. Das Uetiker Format hat weniger Schwächen, es ermöglicht deutlich mehr Schüler:innen, das zu zeigen, was sie können. Die Expert:innen schätzen den Aufwand ebenfalls als hoch ein, konnten jedoch teilweise auch optimieren und den Blick auf das Wesentliche lenken. - Postartifizielle Texte werden nicht mehr zu eigenen
Hannes Bajohr meint mit dem Begriff postartifiziell Texte, von denen wir annehmen, sie seien von Menschen unter Zuhilfenahme von KI-Tools verfasst worden. Diese sind nicht komplett künstlich, aber auch nicht ohne Hilfsmittel entstanden.
Das Uetiker Modell verlangt mit Text A einen Text ohne Hilfsmittel und bei Text B einen postartifiziellen. Es markiert damit also einen Übergang, der zur Norm geworden ist: Fast alle professionellen Texte sind heute postartifiziell. Auch wenn Chat-Protokolle viel zeigen, sind die Texte im Teil B nicht mehr nur die eigenen der Schüler:innen. KI-Anteile lassen sich nicht mehr von dem trennen, was Schüler:innen selber geschrieben haben. - Die Standardisierungsgefahr
Gibt es in Teil B also nur geglättete Texte mit KI-Sound, in dem die Schreibstimme der Schüler:innen verloren geht? Diese Gefahr besteht durchaus. Durch eine Bewertung, die besonders auf die Transformationsleistung achtet, kann dem etwas entgegengewirkt werden – aber nur teilweise. Nur Schüler:innen, die bewusst eine Stimme entwickelt haben, werden dem Vibe Writing widerstehen können. Es ist eine enorm hohe Kompetenzstufe, das eigene Schreiben gegen die KI-Glättungen verteidigen zu können. - Die Bewertung
Während ich und einige Kolleg:innen mit diesem Kompetenzraster beurteilt haben, waren die Korrigierenden (und auch die Expert:innen) frei darin, wie sie zu einer Note kamen. Aus einer traditionellen Bewertungssicht entstand eine Art Bedürfnis, die zwei Texte separat zu beurteilen und dann zu verrechnen – also beispielsweise jeden Text zu 50% in die Bewertung einzubeziehen. Geht man so vor, dann führt das bei Schüler:innen von Typ 1 – also bei denjenigen, die ohne KI gut schreiben können – zu tendenziell zu tiefen Noten. Andererseits entsteht ein gewisses Unbehagen, wenn Schüler:innen von Typ 3 bei Text A kaum lesbare Sätze schreiben – und damit gute Noten erhalten. Hier bleiben wir im Austausch. Im Gespräch mit den Expert:innen konnten wir faire Bewertungen finden. Das geht auch deshalb, weil die Maturnoten recht grob sind – es gibt nur halbe Noten.
Fazit: Ein Format für die Zukunft
Das Uetiker Modell ist nicht von bestimmten technischen Voraussetzungen abhängig. Es lässt sich auf verschiedene Arten umsetzen (Text A könnte auch auf Papier geschrieben werden, im zweiten Teil könnten nur bestimmte KI-Anwendungen zugelassen werden etc.). Es handelt sich um ein robustes Verfahren, das relevante Kompetenzen in den Vordergrund stellt.
Die erste Durchführung hat gezeigt, dass es funktioniert und zu einem hohen Engagement bei den Schüler:innen führt. Während die beiden naheliegenden Alternativen des KI-Verbots und der totalen Öffnung beide massive Schwächen haben, gibt es beim Uetiker Modell zwei kleinere Probleme: Erstens der hohe Aufwand bei der Vorbereitung und Durchführung; zweitens die etwas unklare Bewertung der beiden Texte.
Bei der Umkehrung, die Kyra Holzwarth ausgearbeitet hat, bereiten sich Schüler:innen mit KI auf eine Schreibaufgabe vor, dürfen dann aber beim Verfassen nicht mehr auf Tools zugreifen. Diese Beschränkung macht es den vielen Schüler:innen von Typ B und Typ C unmöglich, den besten Text zu schreiben, den sie schreiben könnten. Das spricht für das Uetiker Modell.
Aus diesen Gründen denke ich, dass dieses zeitgemässe Setting auch über die Kantonsschule Uetikon hinaus Verbreitung finden sollte. Es ist robust, mit vertretbarem Aufwand an allen Schulen umzusetzen und von den Ergebnissen her überzeugend.