Das würde ich gerne mal in Informatik machen

Eine Sicher­heits­fir­ma ver­kauft für ein Bio­la­bor ein Zugangs­kon­troll­sys­tem mit fol­gen­den Eigenschaften:

  1. Zugangs­kon­trol­le erfolgt über Karten
  2. Die Kar­ten wei­sen zwei unab­hän­gi­ge Sys­te­me auf: Einen Magnet­strei­fen und einen aus­le­se­ge­si­cher­ten Mikrochip
  3. Fällt der Mikro­chip aus, ist ein Zugang durch den Magnet­strei­fen immer noch mög­lich, wenn das Lese­ge­rät die­sen mit unter­stützt (fall­back)
  4. Zugang wird gewährt, wenn die Kar­te vor­han­den ist und ein sechs­stel­li­ger Code aus­schließ­lich bestehend aus Zah­len kor­rekt ein­ge­tippt wird
  5. Es gibt einen streng gehei­men, mathe­ma­ti­schen Algo­rith­mus, der den jewei­li­gen Code auf der Kar­te in einer Zei­chen­ket­te so ver­schlüs­selt, dass sich durch kein denk­ba­res Ver­fah­ren aus eben­die­ser Zei­chen­ket­te wie­der der Ori­gi­nal­code errech­nen lässt. Nur die­se Zei­chen­ket­te ist auf der Kar­te tat­säch­lich gespeichert.
  6. Jede Kar­te ent­hält eine ein­deu­ti­ge und ein­ma­li­ge Registrierungsnummer.
  7. Es gibt einen zen­tra­len Rech­ner, auf dem der Ver­schlüs­se­lungs­al­go­rith­mus streng gesi­chert gespei­chert ist und der mit allen Lese­ge­rä­ten ver­bun­den ist.
  8. Auf dem Rech­ner befin­det sich zusätz­lich eine Daten­bank mit allen gül­ti­gen Regis­trie­rungs­num­mern der Zugangskarten.

Beim Zutritt eines Mit­ar­bei­ters zum Bio­la­bor geschieht nun Fol­gen­des: Die Kar­te wird in das Lese­ge­rät gesteckt. Das Lese­ge­rät nimmt über eine gesi­cher­te, stark ver­schlüs­sel­te Ver­bin­dung Kon­takt zum Zen­tral­rech­ner auf und sen­det dabei die Regis­trie­rungs­num­mer der Kar­te. Wenn die­se Regis­trie­rungs­num­mer gül­tig ist, erhält das Lese­ge­rät den Befehl, den Besit­zer der Kar­te nach dem Code zu fra­gen, andern­falls wird die Kar­te ein­ge­zo­gen und ein stil­ler Alarm aus­ge­löst. Der Besit­zer gibt nun den Code ein, der über die ver­schlüs­sel­te Ver­bin­dung an den Zen­tral­rech­ner geschickt wird. Die­ser berech­net mit sei­nem Algo­rith­mus nun die ver­schlüs­sel­te Zei­chen­ket­te und sen­det sie an das Lese­ge­rät zurück. Die­ses ver­gleicht nun die vom Zen­tral­rech­ner gesen­de­te Zei­chen­ket­te mit der auf der Kar­te gespei­cher­ten. Stim­men bei­de über­ein, wird Zutritt gewährt, andern­falls die erneu­te Ein­ga­be gefor­dert. Es sind maxi­mal drei Ein­ga­ben mög­lich, bevor die Kar­te gesperrt, ein­ge­zo­gen und eben­falls ein stil­ler Alarm aus­ge­löst wird.

Auf­ga­be 1:

  1. Eine Kar­te wird gestoh­len und der Magnet­strei­fen kom­plett auf eine Blan­ko­kar­te kopiert. Ist das ein Sicher­heits­pro­blem bei dem Kon­zept der Zugangs­kon­trol­le? Erläu­tern Sie Ihr Ergebnis!

Auf­ga­be 2:

  1. Es bricht jemand in den Zen­tral­rech­ner ein und erhält Zugriff auf den gehei­men Algo­rith­mus. Zusätz­lich kommt er in den Besitz einer Kar­te, deren Magnet­strei­fen er kopie­ren kann. Erklä­ren Sie, war­um das ein gra­vie­ren­des Sicher­heits­pro­blem ist.
  2. Schla­gen Sie geeig­ne­te Ände­run­gen am Sicher­heits­sys­tem vor, um in die­sem Fall dem Bio­la­bor Zeit zu ver­schaf­fen, die Lücke über­haupt erst zu ent­de­cken. Sie kön­nen an jeder Stel­le des Sys­tems anset­zen und auch meh­re­re Mög­lich­kei­ten kom­bi­nie­ren. Begrün­den Sie Ihre Verbesserungsvorschläge.

Auf­ga­be 3:

  1. Bei einer bestimm­ten Char­ge an Mikro­chips auf den Kar­ten tritt ein Soft­ware­feh­ler auf, der den Zutritt trotz kor­rek­ter Cod­e­inga­be ver­wehrt und die Kar­te ein­zieht. Der Her­stel­ler deak­ti­viert als Sofort­maß­nah­me die Ein­heit auf den Lese­ge­rä­ten, die den Mikro­chip aus­liest und behaup­tet, dass dies kein Pro­blem sei. Neh­men Sie Stel­lung zu die­ser Aussage.

Auf­ga­be 4:

  1. Nach Recher­chen von Daten­spe­zia­lis­ten stellt sich her­aus, dass nicht nur ein Code nach Berech­nung durch den Algo­rith­mus zur kor­rek­ten Zei­chen­ket­te führt, son­dern bis zu neun die glei­che Zei­chen­ket­te erge­ben. Zusätz­lich wird bekannt, dass man durch Abkle­ben des Chips die Anzahl der Ver­su­che ver­dop­peln kann, weil das Sys­tem des Magnet­strei­fens unab­hän­gig von dem des Chips arbei­tet. Der Daten­spe­zia­list schlägt Alarm – die Sicher­heit des Sys­tems sei dadurch mas­siv beein­träch­tigt. Die Sicher­heits­fir­ma wie­gelt ab – das sei kein Pro­blem. Neh­men sie kri­tisch Stel­lung zu bei­den Positionen!

Sie dür­fen für die Lösung der Auf­ga­ben das Inter­net frei ver­wen­den, so lan­ge Sie die ver­wen­de­ten Quel­len ange­ben. Je sau­be­rer Ihre Vor­schlä­ge doku­men­tiert und begrün­det sind, des­to bes­ser. Ach­ten Sie zusätz­lich dar­auf, Ihre Ant­wor­ten auf die jewei­li­ge Fra­ge zuzuschneiden.

Was müssen wir zukünftig wissen und können?

Es geht hoch her in Bil­dungs­dis­kus­sio­nen. Ein Mathe­ma­tik­pro­fes­sor aus NRW äußert sich kri­tisch zum Stand der aktu­el­len Mathe­ma­tik­di­dak­tik. Bil­dungs­t­wit­ter geht steil nach eher kon­ser­va­ti­ven Äuße­run­gen einer ehe­ma­li­gen Lehr­kraft zu neu­en Prü­fungs­for­ma­ten. Im Kern geht es um die Fra­ge, was ein Indi­vi­du­um in einer Welt der Digi­ta­li­tät indi­vi­du­ell beherr­schen muss und was über Kom­pe­ten­zen in einer digi­ta­li­sier­ten Welt durch digi­ta­le Tech­no­lo­gie (die meist nur ein Por­tal in einen vir­tu­el­len gesell­schaft­li­chen Raum bie­tet) mehr oder min­der mit­tel­bar erschlos­sen wer­den kann.

  • Man muss nicht mehr pro­gram­mie­ren kön­nen. Das wer­den Maschi­nen bald bes­ser und auto­ma­ti­siert machen.“
  • Man muss bestimm­te krea­ti­ve Pro­duk­te bzw. Vor­stu­fen davon nicht selbst erstel­len kön­nen. Nur die wenigs­ten Men­schen kön­nen mit den Leis­tun­gen von KI-Sys­te­men konkurrieren.“
  • Man muss Tech­nol­gie nicht ver­ste­hen. Die kom­pe­ten­te Benut­zung ist ausreichend.“

Vie­le Annah­men über die Zukunft sind Annah­men. Wir wis­sen nichts dar­über, was gesell­schaft­lich und poli­tisch gesche­hen wird, ob sich z.B. Demo­kra­tien mit ihren recht lang­wie­ri­gen poli­ti­schen Pro­zes­sen gegen auto­kra­ti­sche Staat­for­men vor allem wirt­schaft­lich behaup­ten wer­den, die eben durch ihre auto­kra­ti­schen Struk­tu­ren Pro­ble­men wie denen in Kon­text des Kli­ma­wan­dels viel effek­ti­ver ent­ge­gen­tre­ten kön­nen. Wir wis­sen selbst in Demo­kra­tien nicht, wel­che Effek­te durch z.B. Lob­by­is­mus lang­fris­tig die Gesell­schaft bestim­men werden.

Das mit den „Kom­pe­ten­zen von mor­gen“ ist ein wun­der Punkt in plau­si­bel klin­gen­den Model­len wie VUCA, BANI, die sich an Beschrei­bun­gen ver­su­chen, aus deren Buz­zwords sich aber kei­nes­falls kon­kre­te­re Hand­lun­gen ablei­ten lassen.

Damit rei­hen sich die­se Model­le wie vie­le ande­re struk­tu­rell in den Rei­gen von z.B. Sprach­mo­del­len ein, die Gegen­wart repro­du­zie­ren, kei­nes­falls aber dar­über hin­aus­ge­hen (kön­nen).

Weil alles so unbe­stimmt ist, scheint der Griff nach der guten, alten Zeit schlüs­sig: Das hat funk­tio­niert. Das ist die Grund­la­ge unse­rer immer noch sehr star­ken deut­schen Wirt­schaft, Anstren­gungs­be­reit­schaft, Ler­nen, sich mehr oder min­der lie­be­voll lei­ten las­sen. Und bei­de Lager rhe­to­ri­sie­ren unter dem Deck­man­tel der Sach­lich­keit mehr oder min­der pola­ri­sie­rend auf­ein­an­der ein.

Struk­tu­rell erin­nert mich das an sehr alte Kon­zep­te und Per­spek­ti­ven auf die Welt: Die Mate­ria­lis­ten mit ihrem eher kul­tur­pes­si­mis­ti­schen Ansatz und die Idea­lis­ten mit ihrem Glau­ben an die Ent­wick­lungs­fä­hig­keit des Menschen.

Autopoesis des Individuums ist eine (idealistische) Utopie

Eine bestimm­te Art des Ler­nens fin­det bei mir über Sinn­stif­tung statt: Wenn ich ein Ziel habe – etwa für eine Grup­pe Gitar­re spie­len zu kön­nen – dann wer­de ich natür­lich das Gitar­re­spie­len je nach Bega­bung viel schnel­ler ler­nen als wenn ich von mei­nen Eltern dazu gezwun­gen wer­den, Gitar­re zu spie­len. Letz­te­res schließt aber nicht per se aus, dass ich es in mei­nem Leben irgend­wann bereu­en könn­te, nicht doch das Gitar­ren­spie­len erlernt zu haben, weil ich eben noch nicht weiß, wie mein Leben ver­lau­fen wird. Ande­re – wie in dem Bei­spiel mei­ne Eltern – haben auf­grund ihrer Lebens­er­fah­rung eine Vor­stel­lung, wie es ver­lau­fen könn­te – die habe ich selbst zu die­sem Zeit­punkt viel­leicht nicht.

Wohl­wol­lend und bezo­gen auf Schu­le sind nun Cur­ri­cu­la („Lehr­plä­ne“) schlicht nach Vor­stel­lun­gen von dem auf­ge­baut, was ein auch immer gear­te­tes Kol­lek­tiv von Men­schen denkt, was im Leben von jun­gen Men­schen eine Rol­le spie­len könn­te – aber eben nicht muss. Und der Streit dar­über, was das genau ist, fin­det auf meh­re­ren Ebe­nen statt.

  • In wel­chem Maß soll­te Sinn­stif­tung beim Lern­pro­zess die allei­ni­ge Rol­le spielen?
  • In wel­chem Maß sind kom­plett indi­vi­dua­li­sier­te Lern­pro­zes­se mit wel­chem Sys­tem wie abbildbar?
  • In wel­chem Ver­hält­nis ste­hen Meta­kon­zep­te wie z.B. die Kom­pe­tenz­ori­en­tie­rung zu den für ihren Erwerb not­wen­di­gen Vor­aus­set­zun­gen wie Wis­sen oder Kennt­nis­se von Informationen?

Kom­pe­tenz­ler wer­den ant­wor­ten, dass Kom­pe­ten­zen sich ja immer an einem kon­kre­ten Sach­ge­gen­stand ent­wi­ckeln – ich stel­le ver­mehrt fest, dass ich von immer mehr Dumm­heit umge­ben bin – poli­tisch erle­ben wir das gera­de ganz hübsch mit dem Auf­stieg rech­ter Par­tei­en – über­all auf der Welt. Die loka­le Wirt­schaft klagt, dass Aus­zu­bil­den­de immer weni­ger wis­sen und kön­nen, was für den jewei­li­gen Beruf rele­vant ist. In mei­nem Stu­di­um neh­me ich gar nicht so wenig Men­schen wahr, die Ler­nen als sehr kon­sum­ori­en­tiert wahr­neh­men – es muss ihnen „gemacht wer­den“. Das Netz quillt über von Inhal­ten, die aus einer huma­nis­ti­schen Per­spek­ti­ve zumin­dest bemer­kens­wert sind: Por­no­gra­fie, Selbst­dar­stel­lung, Beau­ty­wahn, die x‑te durch­aus gesund­heits­ge­fähr­den­de Tik­Tok-Chall­enge, Kom­mu­ni­ka­ti­on auf opti­mier­ba­rem Niveau. Rein quan­ti­ta­tiv schei­nen mir die Schät­ze und Sup­port­sys­te­me dage­gen „leicht“ unter­re­prä­sen­tiert zu sein.

Trotz­dem wer­den vie­le Ver­fech­ter „neu­er Lern- und Schul­kon­zep­te“ nicht müde, die Vor­tei­le und Mög­lich­kei­ten, die das Inter­net bie­tet, immer wie­der ins Feld zu füh­ren. Kri­tik dar­an wird gar nicht so sel­ten als Kul­tur­pes­sim­i­mus abgetan.

Auto­poe­sis im Sin­ne einer huma­nis­ti­schen Denk­wei­se benö­tigt Vor­aus­set­zun­gen, die es im Rah­men von Bil­dungs­pro­zes­sen oft erst zu ent­wi­ckeln gilt. Die Vor­aus­set­zun­gen dafür sind in einer Gesell­schaft, die mate­ri­ell im Gro­ßen und Gan­zen sehr gut ver­sorgt ist, gar nicht immer „von sich aus“ gege­ben. Ich hal­te die­ses Kon­zept daher zuneh­mend für ein äußerst optimistisches.

Das Modalverb aus dem Titel dieses Artikels

Der Titel die­ses Arti­kels ent­hält das Modal­verb „müs­sen“. Dem Wesen nach ist das schon ziem­lich auto­kra­tisch. Es könn­te sein, dass etwas gemusst wird, was u.U. im ers­ten Moment gar kei­ne Freu­de macht und des­sen Sinn sich dem Indi­vi­du­um auch nicht sofort erschließt. Klar kann ich Kon­ver­sa­ti­on n einer Fremd­spra­che mitt­ler­wei­le ohne Fremd­spra­chen­kennt­nis­se betrei­ben. Und klar wird sich die­se Tech­no­lo­gie bald sehr weit ent­wi­ckelt haben – viel weni­ger Mühe und wesent­lich spaß­be­ton­ter als z.B. Voka­beln zu ler­nen. Das mit den Fremd­spra­chen ist nur ein Bei­spiel. Als ange­hen­der Infor­ma­tik­leh­rer den­ke ich da an Kon­zep­te wie das Binär­sys­tem oder Sor­tier­al­go­rith­men – braucht man nicht, nur wird man sein Leben lang von Tech­no­lo­gie umge­ben sein, die dar­auf auf­bau­en­de Kon­zep­te nutzt. Das Nicht­wis­sen kann gut gehen, muss es aber nicht.

Mein Plä­doy­er ist daher eines für mehr Sanft­mut mit Men­schen, die das „Müs­sen“ in den Mit­tel­punkt ihres Han­delns als z.B. Lehr­per­son stel­len. Auch sie könn­ten selbst in einer stark ver­än­der­ten Welt in Tei­len immer nicht rich­tig liegen.

 

Als fertig ausgebildete Lehrkraft selbst Prüfungen ablegen

Einleitung

Ich ver­su­che mich gera­de an einem beruf­be­glei­ten­den Stu­di­um zur offi­zi­el­len Erlan­gung der Lehr­be­fä­hi­gung für das Fach Infor­ma­tik – genau­er: Wenn das klappt, kann ich im Fach Infor­ma­tik das Abitur abneh­men. Ich gehe dazu den sehr stei­ni­gen Weg eines regu­lä­ren Dritt­fach­stu­di­ums. Das kos­tet an der Uni­ver­si­tät Olden­burg um die 550,- Euro Gebüh­ren je Semes­ter und es sind 95 Kre­dit­points zu erwirtschaften.

Der Dienst­herr bie­tet ein kos­ten­lo­ses Auf­bau­stu­di­um im Umfang von 60 Kre­dit­points an, das aber hin­sicht­lich der Anzahl der zur Ver­fü­gung ste­hen­den Plät­ze begrenzt ist und sehr, sehr viel inhalt­lich und von der Zeit­struk­tur her vor­gibt. Das regu­lä­re Dritt­fach­stu­di­um ist da viel frei­er – man kann eini­ges nach sei­nen Inter­es­sen wäh­len. Für bei­de Vari­an­ten gibt es kei­ne Ent­las­tung in irgend­wel­cher Form und bis­her kam ich nicht in der Ver­le­gen­heit, mei­ne Schu­le um irgend­ein Ent­ge­gen­kom­men in Form von Frei­stel­lun­gen für Klau­su­ren / Prü­fun­gen usw. bit­ten zu müs­sen, obwohl die SL das mit Kuss­hand ermög­li­chen wür­de: Infor­ma­tik ist ein abso­lu­tes Man­gel­fach in Nie­der­sach­sen und wird i.d.R. fach­fremd unter­rich­tet – was ich auch bis Klas­se 11 schon mehr­fach gemacht habe.

Das Stu­di­um in der von mir gewähl­ten Form bie­tet kei­ner­lei for­ma­le Vor­tei­le (im Gegen­teil: Man hät­te in Ernst­fall eine drit­te Fach­schaft mit­zu­be­spie­len, deut­lich mehr Kon­fe­renz­be­tei­li­gung usw.), ist Mehr­auf­wand, kos­tet pri­va­tes Geld und der Dienst­herr pro­fi­tiert jetzt schon qua­si dop­pelt, da ein Semes­ter­ti­cket für ganz Nie­der­sach­sen inklu­diert ist und ich damit kei­ner­lei Fahrt­kos­ten für die Medi­en­be­ra­tung mit den übli­chen „Anträ­gen des maxi­ma­len Miss­trau­ens“ abrech­nen muss (bei mei­nem Schul­trä­ger lie­gen ein Fahr­ten­buch sowie ein Tank­stel­lenkar­te im Dienstauto, das ich mit­be­nut­zen darf).

War­um die­ser Auf­wand? Ich mache das pri­mär für mich und mei­ne eige­ne fach­li­che Wei­ter­ent­wick­lung (mich inter­es­siert der Scheiß ein­fach total) und möche selbst ent­schei­den kön­nen, ob und wie ich das been­de und ob und wie ich das in mein dienst­li­ches Ver­hält­nis über­haupt ein­brin­ge. Ohne vor­lie­gen­de Beschei­ni­gung gibt es das Stu­di­um für den Dienst­herrn ja schließ­lich offi­zi­ell nicht – also auch kei­ner­lei Rech­te (eigent­lich ist das so ein Macht­um­kehr­ding – aber das wäre eine ande­re Geschichte).

Die Schüler:innen pro­fi­tie­ren – so den­ke ich – schon jetzt durch mei­ne deut­lich erwei­ter­te fach­li­che Per­spek­ti­ve auch im offi­zi­ell fach­frem­den Unter­richt. Die 1100,- Euro pro Jahr sind durch ande­re, offi­zi­ell als Neben­tä­tig­keit ange­zeig­te Arran­ge­ments außer­halb des Diens­tes bis­her gut gegenfinanziert.

 

Prüfungen an der Universität

So ein Stu­di­um bringt es mit sich, dass man Prü­fun­gen an der Uni­ver­si­tät able­gen muss. Im Bache­lor-/Mas­ter­sys­tem ist das kumu­la­tiv, d.h. besucht Ver­an­stal­tun­gen, für die Leis­tungs­nach­wei­se zu erbrin­gen sind – durch­lebt habe ich schon Port­fo­lio, münd­li­che Prü­fung und Klau­su­ren. Dafür wer­den mir Kre­dit­points gut­ge­schrie­ben. Wenn der Zäh­ler auf 95 steht, dann habe ich mei­ne Lehr­be­fä­hi­gung, bzw. könn­te sie mir aus­stel­len las­sen. Absol­vie­ren muss ich nur den fach­li­chen und didak­ti­schen Teil für das Fach Infor­ma­tik am Gym­na­si­um – kei­ne Bache­lor- oder Mas­ter­ar­beit. Sehr vie­le Ver­an­stal­tun­gen besucht man als „Lehr­amt­ler“ gemein­sam mit den Vollinformatikern.

Münd­lich gelingt mir das bis­her sehr gut, schrift­lich kom­me ich bis­her nicht über ein „bestan­den“ (4.0) hin­aus. Damit bin ich als alter Kna­cker eigent­lich soli­des Mit­tel­feld: 30% fal­len durch, 30% lie­gen zwi­schen 4.0 und 3.7 und 40% machen das bes­ser (so Pi mal Daumen).

 

Klausuren als geschlossene Formate

Ich habe drei Klau­su­ren geschrieben:

  • Betriebs­sys­te­me (hier ein Ein­blick) – war ein Mas­ter­mo­dul und grö­ßen­wahn­sin­nig – aber: bestanden!
  • PDA (Pro­gram­me, Daten­struk­tu­ren und Algo­rith­men) – z.B. Daten­ty­pen, Kon­troll- und Daten­struk­tu­ren, Sor­tier­al­go­rith­men, Berech­nung von Auf­wän­den etc. (bestan­den!)
  • OMP (Objekt­ori­en­tier­te Model­lie­rung und Pro­gram­mie­rung) – z.B. Klas­sen, Objek­te, Inter­faces, Streams, Lamb­da-Audrü­cke, Lösungs­stra­te­gien, Heu­ris­ti­ken, unter­schied­li­che Pro­gram­mier­an­sät­ze (Logi­k­ori­en­tie­rung, funktionale/regelbasierte Pro­gram­mie­rung) etc. (am ver­gan­ge­nen Diens­tag geschrieben)

Geschlos­se­ne For­ma­te wie Klau­su­ren sind ja gera­de in der Twit­ter­bubble sehr ver­pönt und voll nicht zum Nach­weis von Kom­pe­ten­zen für das 21. Cen­tu­ry geeig­net. Spoi­ler: Nunja.

Alle drei Klau­su­ren waren in mei­nen Augen sehr, sehr gut gestellt und bestan­den fast nur aus Trans­fer­leis­tun­gen. Ohne Vogel­per­spek­ti­ve und Kon­zept­ver­ständ­nis waren sie defi­ni­tiv nicht zu bestehen – und gera­de in der Infor­ma­tik will man zuneh­mend Leu­te mit die­ser Per­spek­ti­ve, damit nicht voll­kom­men idio­ti­sche und über­hol­te infor­ma­ti­sche Ansät­ze wie „Mas­ter­keys“ (eigent­lich Sin­gle­ton Pat­tern, „God“-Class) gefah­ren wer­den (wobei man fai­rer­wei­se sagen muss, dass es gera­de bei Secu­ri­ty kom­pli­ziert ist – Stich­wort: Geheim­diens­te, Gesetz­ge­bung, poli­ti­sche Inter­es­sen, Strafverfolgung).

 

Kontext der geschlossenen Formate

Natür­lich kommt es immer auch auf den Kon­text an, in dem die Klau­su­ren ste­hen. Alle Dozent:innen haben Ange­bo­te gemacht: Es gab Auf­ga­ben zum Vor­le­sungs­stoff, die in Grup­pen bear­bei­tet wer­den konn­ten. Für die­se Auf­ga­ben gibt es Punk­te, die einem selbst eine Ein­ord­nung ermög­li­chen, wo man steht – sie wur­den also kor­ri­giert und kom­men­tiert. Teil­wei­se kann man mit den Auf­ga­ben „Bonus­punk­te“ für die Klau­sur erwirt­schaf­ten. In Tuto­ri­en konn­te man Fra­gen stel­len, eige­ne Lösun­gen vor­stel­len oder sich auch Din­ge noch ein­mal erklä­ren las­sen. Bei den Ver­an­stal­tun­gen ohne Bonus­punk­te gab es ein Ran­king – jede Grup­pe hat­te einen Fan­ta­sie­na­men, der dann in einer Art Liga erschien, so dass man sich inner­halb der Ver­an­stal­tung leis­tungs­mä­ßig ver­or­ten konnte.

Ich hat­te bei einer Übungs­grup­pe Glück: Fast immer hat­ten wir alle alle Auf­ga­ben bear­bei­tet, konn­ten so über unter­schied­li­che Ansät­ze dis­ku­tie­ren und ent­schei­den, was wir abge­ben. Aller­dings waren wir alle in der Situa­ti­on, berufs­be­glei­tend zu studieren.

Ich hat­te bei einer Übungs­grup­pe Pech: Ich war er ein­zi­ge, der über­haupt Auf­ga­ben bear­bei­tet und dann die Bonus­punk­te für die bei­den ande­ren mit erwirt­schaf­tet hat­te. Die­se Sache muss­te ich dann auch auf­grund von Über­las­tung abbre­chen – da war mir eine Par­al­lel­ver­an­stal­tung wichtiger.

Die Tuto­ri­en waren für mich größ­ten­teils ernüch­ternd: Es saßen moti­vier­te Tutor:innen dort, didak­tisch zwar uner­fah­ren, aber sehr offen und die Haupt­er­war­tung der meis­ten Kommiliton:innen schien dar­in zu bestehen, die Vor­le­se­sungs­in­hal­te noch ein­mal doziert zu bekom­men. Kaum „fal­sche Lösun­gen“ wur­den dis­ku­tiert, kaum eige­ne Lösun­gen vor­ge­stellt – das Lern­an­ge­bot wur­de mei­ner Ansicht nach kaum, eher gar nicht genutzt. Unse­re Übungs­grup­pe war qua­si die ein­zi­ge mit akti­ven Bei­trä­gen – irgend­wann kam ich mir doof und stre­ber­haft vor. Da muss ich noch Wege finden …

Gene­rell fin­de ich aller­dings, dass die zusätz­lich offe­nen Lern­an­ge­bo­te auf­grund der Hal­tung vie­ler Mit­stu­die­ren­der kaum geeig­net sind, ein­zu­schät­zen, wel­ches Wis­sen und wel­che Kom­pe­ten­zen tat­säch­lich erwor­ben wur­den. Das geschlos­se­ne For­mat „Klau­sur“ erscheint mir vor die­sem Hin­ter­grund schon sehr not­wen­dig zu sein, um eine gene­rel­le Beschäf­ti­gung mit den Lern­in­hal­ten zu trig­gern. Bei über 320 Men­schen in einer Ver­an­stal­tung wird das orga­ni­sa­to­risch mit alter­na­ti­ven Prü­fungs­for­ma­ten durch­aus fordernd…Die Klau­su­ren kann man inkl. Frei­ver­such übri­gens 4x wiederholen.

Mit einer ande­ren Hal­tung wäre die Klau­sur viel­leicht nicht not­wen­dig.  Bei eini­gen Fra­gen von Mit­stu­die­ren­den in der gro­ßen Vor­le­sung hin­sicht­lich der inhalt­li­chen Pro­gres­si­on und des Anspruchs kam bei mir schon auch Fremd­scham auf.

Das Ver­hal­ten ist von Schu­le mit ver­ur­sacht. Ich den­ke, wir bedie­nen dort ggf. zu sehr das Kon­sum­be­dürf­nis und zu wenig die for­schen­de Haltung.

 

Mein persönliches Klausurerleben

In den Feri­en, zwei Tage nach dem Urlaub bin ich um 7 Uhr gen Olden­burg gefah­ren – bewaff­net mit Lese­bril­le, drei Kugel­schrei­bern und einem erlaub­ten Spick­zet­tel (hand­schrift­lich, zwei­sei­tig, DINA4). Man kommt in den Hör­saal und setzt sich an einem Platz, an dem eine Klau­sur liegt (Grup­pe A / B). 10 Minu­ten Ein­le­se- und Fra­ge­zeit. Natür­lich hat­te ich im Urlaub nur bedingt Bock auf Vor­be­rei­tung. Durch­ge­le­sen – eigent­lich nichts auf Anhieb ver­stan­den. Bei mir geht es ja um fast nichts. Ruhe bewahrt. Eine Auf­ga­be konn­te ich gleich abschrei­ben – da war nichts zu wol­len. Bei allen ande­ren konn­te ich etwas schrei­ben – Stück für Stück wur­de es kla­rer und bes­ser, viel Lese­kom­pe­tenz war gefragt, man­ches, was hoch­tra­bend klang, war dann doch nicht so schwie­rig wie auf den ers­ten Blick. Den Spick­zet­tel habe ich nicht ein­mal gebraucht. Durch­ge­fal­len ist aber auf jeden Fall im Bereich des Mög­li­chen :o)…

Wie Sprachmodelle unsere Gesellschaft verändern werden

Ein Blick ins Klassenzimmer

Mar­tha hat eine Eng­lisch­haus­auf­ga­be bekom­men. Sie soll einen Text über die drei bekann­tes­ten Sehens­wür­dig­kei­ten von New York schrei­ben. New York steht im Zen­trum der aktu­el­len Unit im Eng­lisch­buch. Mar­tha ist nicht sehr gut in Eng­lisch. Aber die App auf ihrem Han­dy ist direkt an ChatGPT ange­dockt. ChatGPT ist eine künst­li­che Intel­li­genz, die auf mög­lichst natür­li­che Text­aus­ga­be opti­miert ist. Mar­tha tippt in ihre App: „Wri­te an artic­le about the three most famous sights in New York.“, denn das ist die Auf­ga­ben­stel­lung, die ihre Leh­re­rin ihr gege­ben hat. Her­aus kommt fol­gen­der Text (abge­druckt ist die unver­än­der­te Ausgabe):

New York City is one of the world’s most vibrant and exci­ting desti­na­ti­ons. Known for its diver­se cul­tu­re, bust­ling streets, and ico­nic land­marks, the city is a hub of enter­tain­ment and com­mer­ce. From the bright lights of Times Squa­re to the gran­deur of the Sta­tue of Liber­ty, New York offers a wealth of sights to explo­re. In this artic­le, we will take a clo­ser look at the three most famous sights in the city.

1. The Sta­tue of Liberty

The Sta­tue of Liber­ty is one of the most ico­nic land­marks in New York City. Loca­ted on Liber­ty Island, the sta­tue was gifted to the United Sta­tes by the peo­p­le of France in 1886 as a sym­bol of free­dom and demo­cra­cy. The sta­tue is 151 feet tall and is made of cop­per pla­tes, which have tur­ned green over time due to weathering.

Visi­tors can take a fer­ry to Liber­ty Island and climb to the top of the pedes­tal or even to the crown of the sta­tue for pan­o­r­amic views of the city sky­line and har­bor. The sta­tue is also visi­ble from Bat­tery Park in Lower Man­hat­tan, whe­re visi­tors can take in the stun­ning view of the sta­tue against the back­drop of the city.

1. The Empire Sta­te Building

The Empire Sta­te Buil­ding is a towe­ring sky­scra­per loca­ted in Mid­town Man­hat­tan. It was com­ple­ted in 1931 and was the world’s tal­lest buil­ding until 1971. The buil­ding stands at 1,454 feet tall and has 102 flo­ors. Visi­tors can take an ele­va­tor to the obser­va­ti­on deck on the 86th flo­or for breath­ta­king views of the city sky­line. On a clear day, visi­tors can see up to 80 miles in every direction.

The Empire Sta­te Buil­ding has been fea­tured in num­e­rous movies and is a popu­lar tou­rist desti­na­ti­on. The building’s art deco archi­tec­tu­re is a sight to behold, and the night­ti­me light­ing dis­play is an ico­nic part of the city skyline.

1. Cen­tral Park

Cen­tral Park is a vast green space loca­ted in the heart of Man­hat­tan. The park covers 843 acres and is a popu­lar desti­na­ti­on for both locals and tou­rists. Visi­tors can explo­re the park on foot, by bike, or even by hor­se-drawn car­ria­ge. The park fea­tures num­e­rous wal­king paths, gar­dens, lakes, and ponds, as well as famous land­marks such as the Cen­tral Park Zoo and the Bethes­da Fountain.

In the win­ter, visi­tors can go ice-ska­ting at the Woll­man Rink, and in the sum­mer, the­re are num­e­rous con­certs and events held in the park. Cen­tral Park is a wel­co­me respi­te from the hust­le and bust­le of the city and pro­vi­des a tran­quil oasis in the heart of Manhattan.

In con­clu­si­on, New York City is home to many famous sights, but the Sta­tue of Liber­ty, Empire Sta­te Buil­ding, and Cen­tral Park are three of the most ico­nic. The­se land­marks repre­sent the city’s histo­ry, cul­tu­re, and natu­ral beau­ty and are must-see desti­na­ti­ons for anyo­ne visi­ting the city. Whe­ther you’­re a first-time visi­tor or a lifel­ong New Yor­ker, the­se sights never cea­se to ama­ze and inspire.

Mar­tha mel­det sich und liest ihren Text vor. Ihre Lehr­kraft ist ver­wun­dert. Die­ser Text ent­spricht über­haupt nicht Mart­has bis­her im Unter­richt gezeig­ten Fähig­kei­ten. Sie hat den Ver­dacht, dass die­ser Text von irgend­wo­her kopiert sein könn­te – fin­det im Netz aber nichts. Mar­tha erhält eine gute Note.

Han­nes und Fred prä­sen­tie­ren ihren Text im Unter­richt. Eigent­lich lässt sich zum Inhalt wenig Schlech­tes sagen, aber das Geschrie­be­ne erin­nert dann doch mehr an Gespro­che­nes: Satz­zei­chen­in­fla­ti­on am Satz­en­de, kaum Groß- und Klein­schrei­bung und die Zei­chen­set­zung ist opti­mier­bar – oder gar nicht erst vor­han­den. Han­nes und Fred kopie­ren ihren Text dar­auf­hin in https://www.deepl.com/write . Das ist ein KI-basier­ter Web­dienst, der kei­ne Daten sam­melt und bis 2000 Zei­chen kos­ten­los ohne Account nutz­bar ist. Deepl ist eigent­lich ein sehr gutes Über­set­zungs­werk­zeug, kann in einer Beta­ver­si­on jetzt aber auch Tex­te sti­lis­tisch über­ar­bei­ten. Han­nes und Fred schau­en sich die vor­ge­schla­ge­nen Ände­run­gen an. Eini­ges gefällt ihnen, eini­ges scheint den Sinn ihres Tex­tes zu stark zu ver­än­dern. Sie ent­schei­den sich dazu, eini­ge Pas­sa­gen zu ändern, weil sie durch die Ände­run­gen wirk­lich bes­ser klingen.

Die­se bei­den Bei­spie­le zei­gen, was heu­te für alle bereits mit sprach­ba­sier­ter künst­li­cher Intel­li­genz mög­lich ist. Wäh­rend das ers­te Bei­spiel in vie­len Kol­le­gi­en in deut­schen Schu­len für Auf­ruhr sorgt, wenn das Poten­ti­al von Sprach­mo­del­len dort über­haupt ankommt, zeigt das zwei­te Bei­spiel, dass Sprach­mo­del­le gera­de unsi­che­re Schrei­ber sehr gut unter­stüt­zen könnten.

Die Auseinandersetzung über ChatGPT in sozialen Netzwerken

Zwi­schen die­sen bei­den Polen bewe­gen sich manch­mal emo­tio­nal sehr auf­ge­la­de­ne Dis­kus­sio­nen in sozia­len Netz­wer­ken. Die einen sehen bestehen­de Struk­tu­ren und Auf­ga­ben­for­ma­te in Gefahr, die ande­re expe­ri­men­tie­ren mutig mit den sich erge­ben­den neu­en Mög­lich­kei­ten. Die­se Expe­ri­men­te bewe­gen sich oft pri­mär auf einer phä­no­me­no­lo­gi­schen Ebe­ne: Im Kern geht es dar­um, die Ein­ga­ben („Prompts“) zu fin­den, die eine vor­her erdach­te Auf­ga­ben­stel­lung mit Hil­fe eines Sprach­mo­dells opti­mal lösen.

Natür­lich bleibt die Aus­ein­an­der­set­zung vor­erst phä­no­me­no­lo­gisch. Man gibt sich Tipps, wel­che Ein­ga­ben zu einem gewünsch­ten Ergeb­nis füh­ren und wie der Chat­Bot in z.B. eine ande­re Rol­le ein­neh­men kann. Das klappt auf der Ober­flä­che. Die tech­ni­schen Abläu­fe in einem Sprach­mo­dell sind gar nicht so leicht zu verstehen.

Was ist ein Sprachmodell eigentlich?

Ein Sprach­mo­dell ist eine sehr kom­ple­xe Soft­ware, die zur Klas­se der künst­li­chen Intel­li­genz gezählt wird. Schon der Begriff „Intel­li­genz“ ist je nach Fach­dis­zi­plin nicht ein­fach zu defi­nie­ren. Daher spre­chen eini­ge Fach­leu­te lie­ber von „maschi­nel­lem Ler­nen“, was das Defi­ni­ti­ons­pro­blem jedoch ledig­lich auf den Begriff des Ler­nens ver­schiebt. Als Aus­weg aus die­sem Dilem­ma haben eine Rei­he von Autor:innen nicht nur aus dem Infor­ma­tik­um­feld fol­gen­de Arbeits­de­fi­ni­ti­on für künst­li­che Intel­li­genz vorgeschlagen:

Künst­li­che Intel­li­genz bezeich­net die Fähig­keit von Com­pu­ter­sys­te­men, auf sie zuge­schnit­te­ne Auf­ga­ben selbst­tä­tig zu lösen, die auf­grund ihrer Kom­ple­xi­tät bis­lang mensch­li­che Fähig­kei­ten erfor­der­ten”1

Ange­wen­det: Sprach­mo­del­le lösen nun selbst­stän­dig das Pro­blem der Erstel­lung von Tex­ten auf Basis von Ein­ga­ben, die Nutzer:innen vor­ge­ben. Aber wie machen sie das?

In den Anfangs­zei­ten von künst­li­cher Intel­li­genz waren die Auf­ga­ben und Mög­lich­kei­ten von IT-Sys­te­men noch etwas beschränk­ter. Ein sehr ein­fa­ches Bei­spiel sind die dama­li­gen Obst­waa­gen in den Fri­sche­ab­tei­lun­gen der Super­märk­te. Der Kun­de füll­te eine Ware in einen Beu­tel, ging zur einer Waa­ge, leg­te den Beu­tel auf und drück­te eine Tas­te mit einem Sym­bol oder einer Num­mer. Die Waa­ge druck­te dann einen Kas­sen­zet­tel mit Strich­code aus. Es waren aber nicht alle Kun­den ehr­lich, so dass man auf die Idee kam, die­se Waa­gen durch eine Kame­ra zu ergän­zen, mit deren Hil­fe die auf­ge­leg­te Ware erkannt wer­den konn­te, z.B. anhand von Grö­ße oder Far­be. Im Prin­zip konn­te man drei Fäl­le unterscheiden:

a) Wenn der Tas­ten­druck des Kun­den zur erkann­ten Ware pass­te, war die Ent­schei­dung eindeutig.

b) Wenn der Tas­ten­druck ein­deu­tig nicht zur auf­ge­leg­ten Ware pass­te, konn­te ein alter­na­ti­ver Kas­sen­zet­tel gedruckt werden.

c) Wenn die Erken­nung selbst unein­deu­tig war, d.h. zwei Pro­duk­te in Fra­ge kom­men wür­den, aber der Kun­de z.B. die Tas­te mit dem teu­re­ren Pro­dukt gedrückt hat, wur­de natür­lich die teu­re­re Vari­an­te gewählt – gleich­zei­tig ließ sich die­se Situa­ti­on abspei­chern, so dass sie für die Zukunft mit berück­sich­tigt wer­den konnte.

Die­se Waa­ge erzeug­te also auf Basis von Ein­ga­ben und der Bil­der der Kame­ra (Ein­ga­be­schicht) Daten, die sie ver­ar­bei­te­te (Ver­ar­bei­tungs­schicht). Bei der Ver­ar­bei­tung flos­sen die Ein­ga­be­da­ten eben­so ein, wie gespei­cher­te Fäl­le aus einer Daten­bank. Die Daten wur­den unter­ein­an­der gewich­tet, mit einer Daten­bank vol­ler Stan­dard­fäl­le abge­gli­chen und dann eine Aus­ga­be in Form eines Kas­sen­zet­tels erzeugt (Ausgabeschicht).Mit einer gewis­sen Wahr­schein­lich­keit stimm­ten dann Kas­sen­zet­tel und Pro­dukt tat­säch­lich über­ein. Die Wahr­schein­lich­keit der Über­ein­stim­mung war umso grö­ßer, je mehr Stan­dard­fäl­le in der Daten­bank der Waa­ge erfasst wur­den und je mehr Ein­ga­ben die „intel­li­gen­te Waa­ge“ bereits ver­ar­bei­tet hat­te. Softwarentwickler:innen konn­ten die Stan­dard­fäl­le in Form einer Daten­bank vorgeben.

Sprach­mo­del­le funk­tio­nie­ren nach einem ähn­li­chen Prin­zip, nur dass die Stan­dard­fäl­le und Aus­ga­ben ungleich kom­ple­xer sind als bei dem Bei­spiel der Waa­ge. Zudem ist ver­hält­nis­mä­ßig wenig dar­über bekannt, mit wel­chen Daten die zugrun­de­lie­gen­den Daten­ban­ken gefüllt wur­den. Letzt­lich gilt aber auch hier, dass die Aus­ga­ben ledig­lich mit einer gewis­sen Wahr­schein­lich­keit kor­rekt sind oder gar zur Anfra­ge des Nut­zen­den pas­sen – daher ver­hal­ten sich Han­nes und Fred deut­lich smar­ter als Martha.

Es mag auf den ers­ten Blick erstau­nen, dass Sprach­mo­del­le Aus­ga­ben in der momen­ta­nen Qua­li­tät lie­fern. Wir hal­ten Spra­che für ein kom­ple­xes Sys­tem und wür­den einer Maschi­ne deren Imi­ta­ti­on zunächst nicht so recht zutrau­en. Aller­dings sind Sprach­mo­del­le nicht ein­fach vom Him­mel gefallen.

Die Grund­la­gen wur­den schon früh gelegt: Sprachassistent:innen wie Siri, Ale­xa, Cort­a­na usw. sind schon län­ger in der Lage gespro­che­ne Spra­che zu erken­nen und Reak­tio­nen auf ein­fa­che Ein­ga­ben zu erzeugen.

In der Infor­ma­tik gilt der Grundsatz:

Wenn du eine Soft­ware oder KI bau­en kannst, die etwas erkennt, kannst du auch eine Soft­ware oder KI bau­en, die das­sel­be Ding imi­tiert.“2

Neben­bei bemerkt wird durch die­sen schlich­ten Satz auch klar, dass jedes Sicher­heits­sys­tem, das auf der Erken­nung von z.B. mensch­li­cher Spra­che oder der Erken­nung von Gesich­tern basiert, kei­ne gute Idee zur Her­stel­lung von Sicher­heit ist – wenn es künst­li­che Intel­li­genz gibt, die mensch­li­che Spra­che und mensch­li­che Gesich­ter imi­tie­ren kann und die­se sich zudem wei­ter entwickelt.

Einen wei­te­ren Ein­blick in die Kom­ple­xi­tät von Sprach­mo­del­len bie­ten übri­gens auch deren Hard­ware­an­for­de­run­gen. Vor kur­zem tauch­te Face­books Sprach­mo­dell „LLaMA“ im Netz auf. Ein hand­li­cher Down­load von 268GB ent­hält unter­schied­li­che Sprach­mo­dell­va­ri­an­ten. In der ein­fachs­ten 7B Vari­an­te benö­tigt LLaMA zwi­schen 12–16GB an VRAM einer Gra­fik­kar­te, mög­lichst vie­le Pro­zes­sor­ker­ne und RAM. Die Ver­ar­bei­tungs­zei­ten selbst ein­fa­cher Prompts auf Stan­dard­hard­ware bewe­gen sich jen­seits erträg­li­cher Wer­te. Damit ist zumin­dest für den Moment klar, dass auf Basis des heu­ti­gen Wis­sens­stan­des nur sehr weni­ge Mark­teil­neh­mer in der Lage sein wer­den, in der Brei­te ver­füg­ba­re Sprach­mo­del­le sta­bil zu betreiben.

Mögliche Auswirkungen auf das kommerzialisierte Internet

Der dazu not­wen­di­ge immense Ener­gie­ver­brauch ist in die­sem Kon­text letzt­lich eine Fuß­no­te, weil Sprach­mo­del­le das Poten­ti­al besit­zen, das Netz in sei­ner Struk­tur fun­da­men­tal zu verändern.

Gera­de das kom­mer­zi­el­le Inter­net besteht aus einer Viel­zahl von Tex­ten, die einen Gebrauchs­cha­rak­ter auf­wei­sen: Nach­rich­ten, Sport­be­rich­te, Pro­dukt­be­schrei­bun­gen und Zusam­men­fas­sun­gen sind durch Sprach­mo­del­le mit rela­tiv begrenz­ten Anwei­sun­gen und Ein­ga­ben auto­ma­ti­siert erstell­bar. Die dazu not­wen­di­gen Daten lie­gen teil­wei­se bereits in digi­ta­li­sier­ter Form vor. Es wird z.B. bei Hand­ball­spie­len ein dezi­dier­tes Spiel­pro­to­koll geführt, aus dem ein heu­ti­ges Sprach­mo­dell mühe­los und weit­ge­hend auto­ma­ti­siert einen Spiel­be­richt erstel­len kann.

Das wird sowohl immense Aus­wir­kun­gen auf jeden Mark­teil­neh­mer haben, der sich mit Con­ten­ter­stel­lung beschäf­tigt, als auch den Such­ma­schi­nen­markt kom­plett ver­än­dern: Der zur Such­an­fra­ge pas­sen­de Inhalt kann theo­re­tisch indi­vi­du­ell gene­riert wer­den – natür­lich auch aus kom­mer­zi­el­len Quel­len. Das wer­den damit span­nen­de Zei­ten für das Leis­tungsschutz­recht: Zitie­ren auch klei­ne­rer Text­pas­sa­gen ist im Prin­zip nicht mehr not­wen­dig. Die Ergeb­nis­se wer­den einer signi­fi­kant gro­ßen Anwender:innengruppe voll­kom­men aus­rei­chen. Die dann ggf. höf­li­cher­wei­se mit ange­ge­be­nen Ori­gi­nal­quel­len erfah­ren kei­ne Auf­merk­sam­keit durch Klicks und Besu­che mehr – einer immens wich­ti­gen ideel­len Wäh­rung im Netz. Damit wer­den ins­be­son­de­re die Inter­net­gi­gan­ten es noch effek­ti­ver bewerk­stel­li­gen, Nutzer:innen in ihrem eige­nen digi­ta­len Öko­sys­tem zu hal­ten. Micro­soft unter­nimmt bereits ers­te Schrit­te mit Bing­AI und der Inte­gra­ti­on von sprach­mo­dell­ba­sier­ter Kor­rek­tur­funk­tio­nen in sei­ne Office­pro­duk­te. Goog­le holt als Reak­ti­on sei­nen auf Lam­da basier­ten Chat­bot „Bard“ wie­der auf die Büh­ne, des­sen Pro­duk­tiv­be­trieb zunächst auf Basis von ethi­schen Beden­ken ver­wor­fen wur­de: Bard konn­te per Sprach­aus­ga­be täu­schend ech­te Anru­fe z.B. zur Reser­vie­rung von Restau­rant­ti­schen oder Essens­be­stel­lun­gen auf Basis von ein­fa­chen Prompts rea­li­sie­ren. Das poten­ti­el­le Miss­brauchs­po­ten­ti­al die­ser Funk­tio­nen stand einer Markt­ein­füh­rung 2021 noch im Weg.

Sprachmodelle als Unterstützung bei Anträgen und Dokumentationen

Deutsch­land hat ein aus­ge­präg­tes Doku­men­ta­ti­ons- und Antrags­we­sen in unter­schied­li­chen Berei­chen eta­bliert: In der Medi­zin z.B. der Arzt­be­richt, in För­der­pro­gram­men umfang­rei­che Anträ­ge, in der Pfle­ge kom­ple­xe Doku­men­ta­tio­nen, Pro­to­kol­le von allen mög­li­chen Sit­zun­gen – die Lis­te lie­ße sich belie­big fort­set­zen. Allen die­sen „Text­gat­tun­gen“ ist gemein, dass sie oft sehr sche­ma­tisch sind – sche­ma­ti­sche Tex­te sind schon heu­te eine Domä­ne von Sprachmodellen.

Sprach­mo­del­le wer­den dabei hel­fen, Men­schen von die­sen sche­ma­ti­schen Auf­ga­ben zu ent­las­ten. Für spe­zi­el­le Fach­be­rei­che sind Text­ge­ne­ra­to­ren denk­bar, die pri­mär mit fach­be­zo­ge­nen Inhal­ten trai­niert wer­den. Dadurch kön­nen sie bei Rou­ti­ne­auf­ga­ben unter­stüt­zen, wenn­gleich nach heu­ti­gem Stand immer noch eine Über­prü­fung der Aus­ga­ben durch einen sach­kun­di­gen Men­schen erfor­der­lich ist.

Aber auch in die­sem Feld ist es kom­pli­ziert. Neh­men wir das Antrags­we­sen in För­der­pro­gram­men: Die teil­wei­se hohen Anfor­de­run­gen an För­der­an­trä­ge die­nen dazu, den Zugriff auf eine begrenz­te Res­sour­ce (z.B. Geld oder Per­so­nal) zu begren­zen. Sprach­mo­del­le wer­den natür­lich dabei hel­fen, bis­her nicht aus­rei­chend genutz­te För­der­mit­tel tat­säch­lich abru­fen zu kön­nen. Es gibt jedoch Res­sour­cen, die völ­lig über­lau­fen sind – etwa die son­der­päd­ago­gi­schen Unter­stüt­zungs­an­ge­bo­te in Schu­len. Auch hier wer­den Sprach­mo­del­le z.B. bei der Erstel­lung von Gut­ach­ten unter­stüt­zen, jedoch blei­ben gera­de per­so­nel­le Res­sour­cen wei­ter­hin knapp. Damit wird der Zugang zu eben­die­sen Res­sour­cen auf ande­ren Wegen erschwert wer­den: Ein gut begrün­de­ter Antrag steht ledig­lich in Kon­kur­renz zu ande­ren sehr gut begrün­de­ten Anträgen.

Sprachmodelle als neutralere Entscheidungsinstanzen?

Sascha Lobo setzt sich in sei­ner Kolum­ne KI kann mensch­li­che Ver­ant­wor­tung nicht erset­zen? – Doch!“ mit der Stel­lung­nah­me des deut­schen Ethik­ra­tes zu künst­li­cher Intel­li­genz aus­ein­an­der. Er for­dert, dass künst­li­che Intel­li­genz in bestimm­ten Berei­chen an die Stel­le der mensch­li­chen Ent­schei­dung tritt – genau da fällt für den deut­schen Ethik­rat die letz­te Gren­ze. Als Bei­spiel kann die Dia­gno­se eines Arz­tes die­nen: Ein spe­zi­ell mit medi­zi­ni­schem Wis­sen trai­nier­tes Sprach­mo­dell könn­te dabei unter­stüt­zen. Als Ein­ga­be die­nen z.B. Labor- und Ana­mne­se­da­ten. Das spe­zia­li­sier­te Sprach­mo­dell könn­te denk­ba­re Erkran­kun­gen auf Basis die­ser Daten ermit­teln und wäre dabei nicht auf das Wis­sen einer Ein­zel­per­son beschränkt.

Für Sascha Lobo ist das ein Fall, bei dem sich die Fra­ge nach dem Ein­satz von Sprach­mo­del­len nicht stellt, son­dern für ihn ver­bind­lich sein soll­te, weil das spe­zia­li­sier­te Sprach­mo­dell dem Men­schen über­le­gen sei. Die­se Argu­men­ta­ti­on erscheint zunächst bestechend – aller­dings ist ein Modell immer nur so gut wie des­sen Ein­ga­be­da­ten, die hier im Rah­men einer Ana­mne­se durch einen Men­schen ent­ste­hen. Das kann bei eini­gen Krank­heits­bil­dern kom­plex und feh­ler­träch­tig sein – gera­de in Zwei­fels­fäl­len: Die glei­che Krank­heit kann bei unter­schied­li­chen Men­schen völ­lig unter­schied­li­che Sym­pto­me aus­lö­sen – es wird eine span­nen­de Fra­ge in wel­chem ggf. lücken­haf­ten Ver­hält­nis das Erfah­rungs­wis­sen eines Men­schen und des­sen Inter­ak­ti­ons­mög­lich­kei­ten mit ande­ren zu der von einer KI gelie­fer­ten Infor­ma­ti­on steht.

Sprachmodelle und Bildungsprozesse

Kom­men wir am Schluss noch ein­mal zurück zu Mar­tha, Han­nes und Fred: Sie wach­sen in einer Welt auf, in der Sprach­mo­del­le mit ihren immer men­schen­ähn­li­che­ren Inter­faces wie ChatGPT in ganz kur­zer Zeit selbst­ver­ständ­lich sein wer­den – gera­de auch in Kom­bi­na­ti­on mit Sprach­ein- und ‑aus­ga­be. Nie wie­der schu­li­sche Übungs­tex­te? Nie wie­der Haus­auf­ga­ben mit künst­li­chen Auf­ga­ben­stel­lun­gen? Sind Haus­auf­ga­ben gar tot? Wenn doch heu­te ein­fa­ches „Promp­ting“ ausreicht?

Ent­schei­dend beim Schrei­ben ist der gedank­li­che Pro­zess bei der Erstel­lung eines Tex­tes. Wenn wir an die Stel­le des Schreib­pro­zes­ses Promp­ting bei einem Sprach­mo­dell set­zen und den Schreib­pro­zess selbst auto­ma­ti­sie­ren, ver­schie­ben wir den Lern­pro­zess auf eine ande­re Ebe­ne. Die­se Ebe­ne erfor­dert letzt­lich gro­ße Beur­tei­lungs­kom­pe­ten­zen, die sich bei Schreib­ler­nen­den wie Mar­tha, Han­nes und Fred noch in einer sen­si­blen Ent­wick­lungs­pha­se befin­den und damit in vie­len Fäl­len eine Über­for­de­rung dar­stel­len müs­sen. Gleich­zei­tig gehen mit eini­ger Wahr­schein­lich­keit schreib­kom­pe­ten­ten Men­schen durch die Nut­zung von Sprach­mo­del­len Trai­nings- und Denk­pro­zes­se bei eigent­li­chen Erstel­len von Tex­ten ver­lo­ren. An deren Stel­le tre­ten Mecha­nis­men zur Ent­wick­lung und Modi­fi­ka­ti­on von geeig­ne­ten Prompts. Genau die­se Vor­ge­hens­wei­sen und Anwen­dun­gen wer­den bereits in gro­ßer Brei­te in den sozia­len Medi­en dis­ku­tiert. War­um den Ein­füh­rungs­text zu Imma­nu­el Kant aus dem Schul­buch lesen? Las­sen wie Schüler:innen doch ein­fach mit einem Chat­Bot „Imma­nu­el Kant“ chat­ten, den eine Lehr­kraft zuvor per „Mega­prompt“ mit Hil­fe eines Sprach­mo­dells erschaf­fen hat und der auf die indi­vi­du­el­len Fra­gen der Schüler:innen eingeht.

Sprach­mo­del­le selbst kön­nen auf­grund ihrer Kom­ple­xi­tät nur von gro­ßen Markt­teil­neh­mern betrie­ben wer­den – das wirft die Fra­ge nach neu­en Abhän­gig­keits­ebe­nen auf, gera­de im Bildungssystem.

Chancen und neue Herausforderungen

Sprach­mo­del­le berüh­ren einen Bereich, der eine Gesell­schaft aus­macht: Die Kom­mu­ni­ka­ti­on und den Umgang mit Spra­che. Sie sind nach Maß­stä­ben der Digi­ta­li­sie­rung nichts wirk­lich Neu­es, wie Goo­gles Chat­Bot „Bard“ bereits vor drei Jah­ren zeig­te. Mit ChatGPT steht erst­mals ein Inter­face zum Sprach­mo­dell GPT zur Ver­fü­gung, was durch vie­le Men­schen nie­der­schwel­lig nutz­bar ist. Vie­le Anfor­de­run­gen wer­den noch nicht zufrie­den­stel­lend gelöst. Jedoch kön­nen Sprach­mo­del­le auf Mil­lio­nen von Nutzer:inneneingaben zurück­grei­fen und auf deren Basis wei­ter­ent­wi­ckelt wer­den. Bereits auf dem Stand der heu­ti­gen Ent­wick­lung ist immenses Poten­ti­al auf unter­schied­li­chen Ebe­nen erahn­bar. Gleich­zei­tig tre­ten ganz neue Fra­ge­stel­lun­gen auf, die vor allem Juris­ten und Ethi­ker beschäf­ti­gen wer­den. Die Kom­ple­xi­tät bei der Modi­fi­ka­ti­on und dem Betrieb von Sprach­mo­del­len wird dafür sor­gen, dass sie pri­mär in der Hand der Inter­net­gi­gan­ten blei­ben wer­den. Was die­se ohne wirk­sa­me staat­li­che Regu­lie­rung dar­aus machen wer­den, bleibt eine offe­ne Frage.

1 Geth­mann, Bux­mann Dis­tel­rath, Humm, Ling­ner, Nit­sch, Schmidt, Spiecker genannt Döh­mann: „Künst­li­che Intel­li­genz in der For­schung – Neue Mög­lich­kei­ten und Her­aus­for­de­run­gen für die Wis­sen­schaft“, S. 10, aus der Rei­he: Ethics of Sci­ence and Tech­no­lo­gy Assess­ment Bd. 48, bei: Springer

ChatGPT und Co. – der Versuch eines Blickes unter die Haube

Wenn man in sozia­len Netz­wer­ken über Sprach­mo­del­le wie GPT‑3 liest, blei­ben genau wie in den Feuil­le­tons die meis­ten Ana­ly­sen und Bewer­tun­gen auf der phä­no­me­no­lo­gi­schen Ebe­ne stehen:

  • Was kann ich im Unter­richt damit machen?
  • Was muss ich tun, damit ein Feh­ler in der Aus­ga­be auftritt?
  • Wel­chen Ein­fluss wer­den Sprach­mo­del­le auf die Schu­le der Zukunft haben?
  • War­um soll­ten Sprach­mo­del­le in der Schu­le nicht ver­bo­ten werden?
  • […]

Eine Analogie

Wenn ich mit Schul­klas­sen das ers­te Mal mit Indi­ka­to­ren im Che­mie­un­ter­richt expe­ri­men­tie­re, kommt es für vie­le zunächst nicht dar­auf an, war­um ein Indi­ka­tor eine bestimm­te Far­be hat, son­dern eher dar­auf, wie sich mög­lichst vie­le unter­schied­li­che Far­ben durch wahl­lo­ses Zusam­men­kip­pen erzeu­gen las­sen. Ich könn­te dabei in Aner­ken­nung der indi­vi­du­el­len Neu­gier Fra­gen stel­len, die auf einem ähn­li­chen phä­no­me­no­lo­gi­schen Level wie die sozia­len Medi­en zur Sprach­mo­del­len dis­ku­tier­ten Fra­gen operieren.

  • Durch wel­chen Men­gen­ver­hält­nis­se bekom­me ich wel­che Far­be hin?
  • Wie kann ich die­se Far­ben außer­halb des Labors nutzen?
  • Wel­chen Ein­fluss hat das neue Farb­spek­trum auf die Ent­wick­lung neu­er Wandfarben?
  • Stellt die­se Neu­ent­wick­lung nicht grund­le­gen­de Ver­fah­ren der Farb­her­stel­lung und des ästhe­ti­schen Emp­fin­dens in Frage?

Die­se Fra­gen sind berech­tigt. Aber eigent­lich sind die Indi­ka­to­ren z.B. ein Mit­tel, um sich gene­rel­len Stoff­ei­gen­schaf­ten (sau­er / alka­lisch) auf einer phä­no­me­no­lo­gi­schen Ebe­ne anzu­nä­hern, Gesetz­mä­ßig­kei­ten zu ent­de­cken und dar­aus wei­te­re all­ge­mei­ne Aus­sa­gen abzu­lei­ten. Nie­mand käme hier auf die (didak­ti­sche) Idee, hier auf der Ebe­ne der Phä­no­me­ne ste­hen­zu­blei­ben oder Men­schen auf Basis der blo­ßen Beob­ach­tung die­ser Phä­no­me­ne etwas „ver­mit­teln“ zu wollen.

Was ich selbst über Sprachmodelle weiß

Sprach­mo­del­le erle­be ich zur­zeit selbst auf einer phä­no­me­no­lo­gi­schen Ebe­ne. Ich expe­ri­men­tie­re mit Ein­ga­ben und unter­schied­li­chen Para­me­tern her­um. Ich weiß den­noch eini­ges über IT-Sys­te­me, was mir ein wenig hilft, die Leis­tun­gen von Sprach­mo­del­len ein­zu­ord­nen. Ich möch­te für mich durch die­sen Text eher ein­gren­zen, was ich eigent­lich noch nicht weiß, um dar­aus dann Fra­gen zu ent­wi­ckeln, die etwas weg von den Phä­no­me­nen füh­ren. Ich nut­ze dazu Kennt­nis­se, die ich im Rah­men mei­nes Infor­ma­tik­stu­di­ums auf Lehr­amt anders hineinvernetzte.

Ein Sprachmodell braucht eine Grammatik

Eine sehr simp­le Metho­de zur Beschrei­bung einer Gram­ma­tik ist die Erwei­ter­te Backus-Naur-Form (ENBF). Selbst die genaue gram­ma­ti­sche Defi­ni­ti­on einer Zahl ist schon gar nicht so einfach.

Ken­nen“ muss ein Mensch oder IT-Sys­tem dazu zunächst die in einer Spra­che ver­wen­de­ten Sym­bo­le (Ter­mi­na­le), wir ver­wen­den in Deutsch­land die Zei­chen 0–9 zur Dar­stel­lung von Zah­len, das sind also unse­re Terminale.

ZifferAusserNull = "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9";
Ziffer           = "0" | ZifferAusserNull

Damit haben wir defi­niert, wel­che Sym­bo­le unse­re Spra­che zur Dar­stel­lung von Zah­len ver­wen­det. Das „|“-Zei­chen ist als „oder“ zu lesen. Die­se Defi­ni­tio­nen kön­nen wir für alle wei­te­ren als Platz­hal­ter ver­wen­den. Damit kön­nen wir jetzt eine natür­li­che Zahl definieren:

NatuerlicheZahl   = ZifferAusserNull, { Ziffer };
NegativeGanzeZahl = "-", NatuerlicheZahl;

Der Aus­druck in geschweif­ten Klam­mern kann belie­big oft oder gar nicht vor­kom­men. Jetzt kann unse­re „KI“ auf Basis die­ser Gram­ma­tik gan­ze Zah­len mit Vor­zei­chen, aber kei­ne Null erkennen.

Das geht aber mit die­ser Definition:

Zahl = ([ "-" ], ZifferAusserNull, { Ziffer }) | "0" ;

Eine Zahl besteht aus einem optio­na­len Minus­zei­chen, gefolgt von einer Zif­fer außer Null, gefolgt von belie­big vie­len wei­te­ren Zif­fern (auch kei­ner wei­te­ren Zif­fer). Oder: Eine Zahl besteht aus dem Zei­chen Null.

Bei Wor­ten wird es schon schwieriger.

Wort = [A-Z], {a-z}

Ein Wort besteht aus min­des­tens zwei Sym­bo­len aus dem Zei­chen­vor­rat a‑z, wobei am Anfang auch der Sym­bol­vor­rat {A‑Z} ste­hen kann.

Dum­mer­wei­se erfüllt jedes Fan­ta­sie­wort belie­bi­ger Län­ge genau die­se Bedin­gung. An eine Defi­ni­ti­on von „Satz“ mag ich da gar nicht erst den­ken. Aber jedes Sprach­mo­dell muss in einem ers­ten Schritt die Ein­ga­be auf Basis von vor­ge­be­nen Regeln ana­ly­sie­ren, bevor es intern wei­ter­ar­bei­ten kann.

Es wird aber auch schon jetzt klar, dass nicht gram­ma­tik­kon­for­me Eingaben

  1. erkannt
  2. auf Feh­ler ana­ly­siert sind

Damit kön­nen ins­be­son­de­re Recht­schreib­feh­ler recht ein­fach kor­ri­giert wer­den, indem auf Basis von z.B. Wahr­schein­lich­kei­ten ein gram­ma­ti­kon­for­mer Ersatz gesucht wird.

Ein Sprachmodell braucht eine Semantik

Bei uns im Hand­ball wird eine Soft­ware für Spiel­pro­to­kol­le ein­ge­setzt. Die Ein­ga­ben macht ein spe­zi­ell geschul­ter Mensch (z.B. ich), der „Sekre­tär“ genannt wird. Ein sol­ches Spiel­pro­to­koll sieht tech­nisch etwa so aus:

00:59   TOR     HEIM   01   1:0
01:02   GELB    GAST   89
08:36   ZEIT    GAST   89
08:45   TOR 7M  HEIM   04   2:0

Das ers­te Tor fiel für die Heim­mann­schaft nach 59s nach einem Foul des geg­ne­ri­schen Spie­lers mit der Num­mer 89. Es dau­er­te lan­ge 7:34 Minu­ten, bis der nächs­te Tref­fer per 7m nach einem mit Zeit­stra­fe geahn­de­tem Foul dem Spie­ler mit der Num­mer 4 gelang.“

Mit dem Kon­text „Hand­ball­spiel“ kann eigent­lich auch jeder, der in der Hal­le nicht anwe­send war, auf die­ser Basis einen kor­rek­ten Spiel­be­richt ver­fas­sen. Aus Meta­da­ten wie der Zeit las­sen sich auf Basis von Wahr­schein­lich­kei­ten wei­te­re Aus­sa­gen ergän­zen, z.B. sind tor­lo­se sie­ben Minu­ten im Hand­ball schon recht unge­wöhn­lich und es kom­men dafür nur weni­ge Ursa­chen in Betracht. Die Text­sor­te „Bericht“ gibt gram­ma­tisch die zu ver­wen­den­de Zeit­form vor, die mög­li­chen Ver­ben in einem Sport­be­richt sind zudem begrenzt.

Ich glau­be, dass man sich gut vor­stel­len kann, wie sich das Ver­fas­sen von Spiel­be­rich­ten ver­gleichs­wei­se ein­fach mit einem IT-Sys­tem umset­zen lässt, wenn es Regeln zur Umset­zung der Daten in eine Gram­ma­tik gibt. Der resul­tie­ren­de Text wirkt erst ein­mal authen­tisch, wenn er unse­re Erwar­tun­gen an einen Sport­be­richt erfüllt. Das tut er wie­der­um, wenn bestimm­te For­mu­lie­run­gen und Wort­grup­pen ent­hal­ten sind.

Ein Sprachmodell braucht Varianz

Mit einer Gram­ma­tik, ein per Daten und Kon­text las­sen sich schon Tex­te schrei­ben, aber nach ein paar Wochen im Sport­teil wür­de uns dann doch die Lust beim Lesen ver­ge­hen. Ähn­li­che Ein­ga­ben wür­den immer wie­der glei­che For­mu­lie­run­gen her­vor­brin­gen. Als „krea­tiv“ emp­fän­den wir Tex­te, die immer wie­der neue For­mu­lie­rungs­ideen ent­hal­ten wür­den. Die­se könn­te man auch hän­disch in unser bis­he­ri­ges Sprach­mo­dell kip­pen, aber schö­ner wäre es ja schon, wenn das auch auto­ma­ti­siert gin­ge. Und da kom­men neu­ro­na­le Net­ze ins Spiel. Die Funk­ti­ons­wei­se lässt sich am bes­ten mit einer star­ken Ver­ein­fa­chung erklären.

Dazu eine Geschich­te: Es gab eine Zeit, in der in Super­märk­ten Waa­gen zum Selbst­wie­gen stan­den. Da muss­te man eine Tas­te mit z.B. einem Sym­bol  oder einer Num­mer für die auf­ge­leg­te Ware drü­cken und es kam ein Bon zum Auf­kle­ben für die Kas­se her­aus. Es gab auch schon ers­te Waa­gen, die das auf­ge­leg­te Obst oder Gemü­se bereits optisch erken­nen konn­ten, aber trotz­dem noch Tas­ten hat­ten, die auch gedrückt wer­den mussten.

Das IT-Sys­tem hät­te dabei z.B. aus die­sen Kom­po­nen­ten bestehen können:

Eine Ein­ga­be­schicht:

  • Eine Kame­ra, die ein hoch­auf­lö­sen­des Bild von der auf­ge­leg­ten Ware macht.
  • Ein Gewichts­sen­sor, der das Gewicht digi­tal ermittelt.
  • Eine Tas­te, die die Kun­den­ein­ga­be weiterleitet.

Eine Ver­ar­bei­tungs­schicht:

  • Ein Algo­rith­mus, der aus dem Bild die Län­ge der auf­ge­leg­ten Ware ermit­telt („Neu­ron 1“).
  • Ein Algo­rith­mus, der aus dem Bild die Brei­te der auf­ge­leg­ten Ware ermit­telt („Neu­ron 2“).
  • Ein Algo­rith­mus, der die Bild­punk­te der domi­nie­ren­den Far­be der Ware zählt („Neu­ron 3“).
  • Ein Algo­rith­mus, der das Gewicht ins Ver­hält­nis zur Grö­ße setzt („Neu­ron 4“).
  • Ein Algo­rith­mus, der schaut, was der Kun­de gedrückt hat („Neu­ron 5“)

Eine Aus­ga­be­schicht:

  • Ein Algo­rith­mus, der auf Basis eines Schwell­wer­tes und einer Daten­bank einen Preis berech­net und einen Eti­ket­ten­dru­cker ansteuert.

 

Bei­spiel 1:

Neu­ron 1: 15cm

Neu­ron 2: 4cm

Neu­ron 3: Domi­nie­ren­de Far­be ist gelb.

Neu­ron 4: Das Gewicht ent­spricht etwa 70% des äqui­va­len­ten Volu­mens an Wasser

Neu­ron 5: Apfel

Der Kun­de hat mich ver­arscht, das ist eine Banane!“

Das Sys­tem gewich­tet sei­ne Mes­sun­gen hier höher als die Kundeneingabe.

 

Bei­spiel 2:

Neu­ron 1: 12cm

Neu­ron 2: 6cm

Neu­ron 3: grün

Neu­ron 4: Das Gewicht ent­spricht etwa 80% des äqui­va­len­ten Volu­mens an Wasser

Neu­ron 5: Avocado

Eigent­lich blöd, könn­te eine Limet­te oder eine Avo­ca­do sein. Ach, der Kun­de wird ja nicht das bil­li­ge­re Zeug gedrückt haben, also eher eine Avocado.“

 

Das Sys­tem gewich­tet die Kun­den­ein­ga­be in Ver­bin­dung mit einem Preis­ge­fü­ge hier hoch, um zu ent­schei­den, wel­chen Bon es druckt. Es „ent­schei­det“ auf Basis von Daten, wel­che Para­me­ter und Daten es wie gewich­tet und „merkt“ sich belie­big vie­le z.B. unein­deu­ti­ge Situa­tio­nen und wie sel­bi­ge auf­ge­löst wur­den. Danach „kann“ es auf Basis von Daten „ent­schei­den“, wel­chen Bon es z.B. bei einer „nicht stan­dard­kon­for­men Avo­ca­do“ druckt.

Man kann die­sen Pro­zess durch kor­rek­te mensch­li­che Ein­ga­ben beschleu­ni­gen und opti­mie­ren („Trai­ning“). Man kann – falls es einen ande­ren Rück­kopp­lungs­ka­nal gibt – die­se Sys­te­me sich auch selbst opti­mie­ren las­sen – bezo­gen auf Sprach­mo­del­le könn­te man als „Rück­mel­de­ka­nal“ schau­en, wel­che der gene­rier­ten Tex­te per Copy&Paste ver­wen­det wur­den oder wel­che Tex­te wie­der im Netz auftauchen.

Vari­anz „ent­steht“ bei unse­rer Geschich­te mit den Waa­gen durch unkla­re Situa­tio­nen. Im Fal­le von Sprach­mo­del­len kann Vari­anz durch spe­zi­el­le „Neu­ro­nen“ künst­lich erzeugt wer­den, die z.B. betrach­ten, wel­che Tex­te in einem Zeit­raum schon gene­riert wor­den sind und dann „Schwell­wer­te“ ande­rer Neu­ro­nen „ändert“.

Was ein Sprachmodell von einem Menschen unterscheidet

Ein Sprach­mo­dell erfüllt nur eine begrenz­te Auf­ga­ben­stel­lung ganz beson­ders gut: Aus Ein­ga­ben Tex­te erzeu­gen, die für einen mög­lichst gro­ßen Teil von Men­schen authen­tisch wirkt. Men­schen sind in ihren Mög­lich­kei­ten, krea­ti­ve Pro­duk­te zu erschaf­fen da nicht so arg begrenzt. Je mehr „Neu­ro­nen“ durch die Ein­ga­be „getrig­gert“ wer­den, des­to authen­ti­scher wird der Text sein. Daher ist es zumin­dest aus infor­ma­ti­scher Sicht eine Bin­se, wenn Rat­schlä­ge kom­men, ein Sprach­mo­dell mit mög­lichst umfas­sen­den Ein­ga­ben zu speisen.

Begrenzt sind Men­schen jedoch bei der Auf­nah­me von Daten. ChatGPT bricht momen­tan öfter ein­mal zusam­men, weil sehr vie­le Men­schen das Sys­tem gleich­zei­tig nut­zen. Es gibt zwar kei­ne bestä­tig­ten Zah­len, aber die Ein­heit „Mil­lio­nen Anfra­gen pro Sekun­de“ dürf­te als Basis zunächst nicht falsch sein. Mil­lio­nen Anfra­gen bedeu­ten aber auch Mil­lio­nen „Feed­back­ka­nä­le“ zum „Trai­ning“ des neu­ro­na­len Net­zes. Sprach­mo­del­le kön­nen viel mehr Infor­ma­ti­on bewäl­ti­gen als ein ein­zi­ger Mensch. Eigent­lich ist ein Sprach­mo­dell Borg. Wir neh­men die ent­ste­hen­den Tex­te als Pro­duk­te _eines_ Sys­tems wahr. Tech­nisch gese­hen sind es aber die Aus­ga­ben eines Kol­lek­tivs. Der ein­zel­ne Borg agiert ja nicht indi­vi­du­ell, son­dern ver­mit­telt der Figur, die mit ihm kom­mu­ni­ziert, ledig­lich den Anschein einer indi­vi­du­el­len Kom­mu­ni­ka­ti­on.  Wenn die­se Simu­la­ti­on hin­rei­chend gut ist, lässt sie sich für einen rele­van­ten Teil von Men­schen nicht mehr von „ech­ter“ Text­pro­duk­ti­on durch Men­schen unter­schei­den. Mehr braucht es eigent­lich nicht, um (wirt­schaft­lich) als Tech­no­lo­gie erfolg­reich zu sein.

Warum Sprachmodelle emotional wahrgenommen und diskutiert werden

Sprach­mo­del­le sind nüch­tern betrach­tet nicht­ma­te­ri­el­ler Code auf irgend­wel­chen elek­tro­ni­schen Schalt­krei­sen. Ihre Aus­ga­ben drin­gen aber erst­ma­lig leicht benutz­bar in einen Bereich vor, der für Gesell­schaf­ten prä­gend ist: Kom­mu­ni­ka­ti­on. Gesell­schaf­ten kon­sti­tu­ie­ren sich im Wesent­li­chen durch die Art, wie sie intern kom­mu­ni­zie­ren und über wel­che Leit­me­di­en sie das tun. Sprach­mo­del­le decken recht bru­tal auf, wel­che Tex­te einer Gesell­schaft so ein­fach gestrickt sind, dass sie sich mühe­los durch Aus­ga­ben eines IT-Sys­tems erset­zen las­sen. Und das sind zum ganz wesent­li­chen Teil Gebrauchs­tex­te, aber auch Tex­te von Men­schen, die das Schrei­ben (in einer Fremd­spra­che) gera­de ler­nen – also ein Groß­teil von Übun­gen, wie sie in Schul­bü­chern vor­kom­men. Das bedroht zen­tra­le Vor­stel­lun­gen, wie Bil­dung funk­tio­niert und es bedroht Arbeits­rou­ti­nen in Bil­dungs­sys­te­men. In unse­rer Vor­stel­lung waren die­se Tex­te bis­her näm­lich durch­aus nicht unter­kom­plex, son­dern wich­ti­ge Zwi­schen­stu­fen bei der Ent­wick­lung von z.B. Schreibfertigkeiten.

Unterkomplexe Reaktionsmuster auf phänomenologischer Basis

Und es gibt aus mei­ner Sicht unter­kom­ple­xe Reak­tio­nen dar­auf. Ein häu­fi­ger Reflex ist Freu­de dar­über, dass nun end­lich klar wird, wie „stu­pi­de“ Bil­dungs­pro­zes­se eigent­lich sind und wir viel kom­ple­xe­re Auf­ga­ben­for­ma­te brau­chen, z.B. die Bewer­tung der Aus­ga­ben eines Sprach­mo­dells und die Über­ar­bei­tung der­sel­ben. Ohne ein Wis­sen und ohne eige­ne ent­wi­ckel­te Schreib­fer­tig­keit ist das gar nicht so unge­fähr­lich. Im schlimms­ten Fall gibt es eine Aus­ga­be, die dann vom Nut­zen­den an ver­mu­te­te Erwar­tun­gen ange­passt wird.

So wie der Schü­ler, der die Far­be eines Indi­ka­tors so hin­mischt, dass es auf eine Säu­re hin­deu­tet, weil genau das ja auch auf der Fla­sche stand (und das Zeug sau­er schmeckt) – es könn­te aber auch eine ganz ande­re Säu­re oder eine falsch beschrif­te­te Fla­sche gewe­sen sein. MIt Wis­sen dar­über, wie ein Indi­ka­tor funk­tio­niert, wer­den in die­sem Fall ande­re Fra­ge­stel­lun­gen mög­lich. Durch blin­den Glau­ben an den Indi­ka­tor eher nicht.

Rechtfertigungsdruck für tradierte Bildungsprozesse

Was auf jeden Fall geschieht und was für mich der eigent­lich Gewinn dabei ist: Sprach­mo­del­le zwin­gen mich dazu:

  1. Kri­tisch auf für selbst­ver­ständ­lich gehal­te­ne Ver­mitt­lungs­for­men zu schauen
  2. Ver­mitt­lungs­for­men, die der Prü­fung stand­hal­ten, vor der Lern­grup­pe expli­zit recht­fer­ti­gen zu müssen.

Wenn ChatGPT uns alles für eine Erör­te­rung lie­fert, Herr Riecken, war­um müs­sen wir dann noch selbst eine schreiben?

Weil ich es so will und bes­ser weiß, was gut für euch ist!“ könn­te – auch als impli­zi­te Hal­tung – zukünf­tig etwas schwie­ri­ger wer­den – erst­mal gar nicht so komfortabel.

Was ich nicht über Sprachmodelle weiß

Es hat bis­her den Anschein, als sei­en Sprach­mo­del­le wie GPT‑3 bis­her aus­schließ­lich mit Tex­ten trai­niert worde, die Men­schen aus­ge­wählt haben. Da kom­men natür­lich Fra­gen dazu auf, nach wel­chen Kri­te­ri­en die­se Trai­nings­da­ten von wem aus­ge­wählt wor­den sind.

Sprach­mo­del­le sind in einem ers­ten Schritt zunächst nicht in die Lage ver­setzt wor­den, ihre Trai­nings­da­ten „selbst­stän­dig“ aus dem Inter­net her­aus­zu­ho­len. Wel­che Grün­de gibt es eigent­lich dafür?

Sprach­mo­del­le wer­den vie­le Gebrauchs­tex­te erset­zen, die bis­her Domä­nen von Men­schen waren – etwa Sport­be­rich­te. Logisch zuen­de gedacht, wer­den bald wesent­li­che Tei­le einer (west­li­chen) Gesell­schaft nicht mehr ihr Geld mit Schrei­ben ver­die­nen kön­nen. Auch mein Blog kann mühe­los von Aus­ga­ben von Sprach­mo­dell quan­ti­ta­tiv an die Wand gena­gelt und z.B. in Such­ma­schi­nen nicht mehr wahr­nehm­bar sein – mein Blog ist jetzt ein däm­li­ches Bei­spiel, aber was bedeu­tet das insgesamt?

Wird es uns gelin­gen, nen­nens­wer­te Tei­le von Schüler:innen (und uns Lehrer:innen) dazu zu befä­hi­gen, das künf­ti­ge Niveau von Sprach­mo­del­len zu errei­chen? Machen wir uns nicht ganz schön was vor mit der Annah­me, dass gro­ße Tei­le der Schüler:innenschaft in der Lage sein wer­den, Aus­ga­ben von Sprach­mo­del­len „kri­tisch“ zu hin­ter­fra­gen und zu über­ar­bei­ten, WENN uns gleich­zei­tig bewusst ist, dass das Niveau die­ser Aus­ga­ben eher qua­li­ta­tiv stei­gen wird?

 

1 2 3 4 7