#KIKompetenzen Teil 2: Anfragen verfeinern

Die Verfügbarkeit von verschiedenen KI-Tools erfordert eine Vielzahl von Kompetenzen, sowohl bei Schüler*innen wie auch bei Lehrpersonen. In einer Serie von Blogposts und Videos erörtere und beleuchte ich diese Kompetenzen.

  1. Wie mit einem Kind sprechen (das eine Maschine ist)
  2. Anfragen verfeinern
  3. Nutzung transparent nachweisen
  4. Die KI trainieren
  5. Problem von mehreren Seiten (Sprachen etc.) angehen 
  6. Communities nutzen
  7. Es gibt nicht nur eine KI

Midjourney

In dieser Folge arbeite ich mit Midjourney, einem Programm, das Bilder erzeugt. Zugang erhält man über midjourney.com. Die Verwendung von Midjourney erfolgt über das Chat-Tool Discord, wo Midjourney einen Bot anbietet, der auf Anfragen reagiert. Für ChatGPT gibt es hier sehr hilfreiche Hinweise zu Prompts:

Der Aufbau von Prompts

Prompts sind die Eingaben, mit denen KI-Tools arbeiten. In letzter Zeit sind viele Tools in der Lage, natürlichsprachige Prompts zu verstehen: Das bedeutet, ich kann einer KI einen schriftlichen Auftrag geben, der gleich lautet, wie ich ihn einem Menschen geben würde.

Das Programm übersetzt ihn dann in maschinenlesbare Angaben. Diese bestehen grob aus Mustern, Befehlen und Gewichtungen. Ein Beispiel:

Dieses Bild hat ein leeres alt-Attribut; sein Dateiname ist bildschirmfoto-2022-12-20-um-15.36.46.png

»/imagine prompt« ist hier die Einleitung, die dem Programm sagt, dass jetzt eine Eingabe kommt. Der Prompt lautet dann: »messi as a minion«.

  1. Das Muster hier wäre »x as y«. Hier kann eine KI analysieren, wie ähnliche Muster bearbeitet werden – und diese Muster nutzen, um den Prompt zu bearbeiten.
  2. Einen konkreten Befehl gibt es hier noch nicht, ich könnte z.B. ergänzen mit »–ar 16:9« was dann der Befehl ist, ein Bild in der »Aspect Ratio« 16:9 zu erzeugen.
  3. Gewichtung bedeutet, dass »Messi« und »Minion« entweder gleich starkes Gewicht haben (dann entsteht eine Figur, die gleich stark nach Messi wie nach einem Minion aussieht), oder halt unterschiedliches (z.B. könnte »Messi« wichtiger sein, weil er am Anfang steht, oder »Minion«, weil hier das Aussehen beschrieben wird.

Die Interpretation von Prompts

Wenn Laien KI-Tools nutzen, dann können sie nicht genau abschätzen, wie das Tool ihre Eingaben verarbeitet. D.h. es ist nicht immer klar, welche Muster, Befehle und Gewichtungen in Prompts enthalten sind.

Um das herauszufinden, müssen wir mit den Tools spielen. Hier sieht man das Ergebnis einer ersten Anfrage.

Dieses Bild hat ein leeres alt-Attribut; sein Dateiname ist bildschirmfoto-2022-12-22-um-14.50.17.png

Midjourney bietet mir direkt 9 Optionen an: Ich kann mit dem Knopf rechts die Anfrage noch mal laufen lassen (KI-Tool geben praktisch nie dasselbe Ergebnis aus, wenn man denselben Prompt verwendet). Mit den U- oder V-Buttons kann ich entweder bessere Auflösungen oder Varianten einzelner Bilder generieren lassen. V4 hat zu diesem Ergebnis geführt:

Dieses Bild hat ein leeres alt-Attribut; sein Dateiname ist bildschirmfoto-2022-12-23-um-10.07.31.png

U4 hingegen zu dem – man sieht, dass noch mal weitere Optionen angeboten werden:

Dieses Bild hat ein leeres alt-Attribut; sein Dateiname ist bildschirmfoto-2022-12-23-um-10.08.03.png

Auch wenn KI-Tools nicht signalisieren, dass Anfragen (und damit auch Ergebnisse) verfeinert werden können, so ist das grundsätzlich immer möglich.

Befehle kennen lernen

Für Midjourney gibt es Seiten, die Prompts für User generieren, z.B. promptomania.com/midjourney-prompt-builder. Diese Tools helfen dabei, die korrekten Befehle zu verwenden, damit Midjourney möglichst genau das tut, was ich erwarte. Im Beispiel sieht man, dass ich genau das eingeben sollte, was im weißen Fenster steht – wenn ich diese Art von Kamera, Modellierung und einen Bart möchte.

Dieses Bild hat ein leeres alt-Attribut; sein Dateiname ist bildschirmfoto-2022-12-23-um-10.23.33.png

Viele KI reagieren auf präzise Befehle aus einer Liste, weil sie letztlich einfach Programme ablaufen lassen. Diese Befehle müssen kompetente Nutzer*innen aber kennen. Hier hilft es, Listen nachzuschlagen oder Prompt-Generatoren zu verwenden. Teilweise können unterschiedliche KI-Tools auch genutzt werden, um Prompts für andere Tools zu verfassen, wie das z.B. auch in diesem Thread vorgeführt wird.

2 Kommentare

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden..