„AI-slop“

felix schwenzel in artikel

vol­kers ant­wort auf mei­nen letz­ten bei­trag, der ein KI ge­ne­rier­tes sym­bol­bild in „kne­te“ nutz­te, lau­te­te:

der „ori­gi­nal“ fe­lix re­agier­te auf kri­tik meist re­ni­tent oder spitz­fin­dig. spitz­fin­dig re­agiert der ak­tu­el­le fe­lix wei­ter­hin. oder po­si­ti­ver aus­ge­drückt, ich re­agie­re auf kri­tik nach­denk­lich. und wer­de dann spitz­fin­dig. in die­sem fall, in­dem ich zu­nächst prä­zi­si­on bei der kri­tik ein­for­de­re. da­von dass be­grif­fe wie AI-slop von men­schen „slop­py“ be­nutzt wer­den, war of­fen­bar auch mar­tin ge­nervt und liess clau­de dazu ar­gu­men­te sam­meln. das als ant­wort auf vol­ker wei­ter zu ver­wen­den wäre dann aber tat­säch­lich slop­py.

vol­ker hat im kern na­tür­lich recht. er ist ge­nervt von der ver­meint­lich ge­dan­ken­lo­sen ver­wen­dung von KI-werk­zeu­gen zur bild­ge­ne­rie­rung. ich bin teil­wei­se auch ge­nervt von der äs­the­tik die­ser bil­der und fra­ge mich: war­um, muss das sein? aber wirk­lich ge­dan­ken­los muss das nicht sein. der schock­wel­len­rei­ter ist zum bei­spiel so freund­lich die promts (und werk­zeu­ge) zu nen­nen, die er zur KI-ar­ti­kel­bild­ge­ne­rie­rung nutzt. hier zum bei­spiel:

Prompt: »Co­lo­red Fran­co-Bel­gi­an Co­mic Style. An ele­phant in a green dres­sing gown sits at a desk in front of an old-fa­shio­ned steam­punk-style com­pu­ter. The sur­roun­ding walls are li­ned with shel­ves fil­led with old books. In the back­ground is a win­dow over­loo­king a city. Th­rough the win­dow, a blimp can be seen in the sky. Sun­light floods the room.«. Mo­dell: Nano-Bana­na.

der schock­wel­len­rei­ter lässt sich bil­der er­stell­len, die sei­nen vor­stel­lun­gen von pas­send, schön oder sei­nen as­so­zia­tio­nen ent­spre­chen (zur neu­en ver­si­on von lib­re of­fice as­so­ziert er aus un­er­find­li­chen grün­den „a sexy young wo­man with long red hair, green eyes and red lip­stick“). ich gehe da­von aus, er mo­di­fi­ziert die promts, wenn das er­geb­nis, das er ge­lie­fert be­kommt, nicht sei­nen vor­stel­lun­gen ent­spricht. nicht an­ders, als wenn er ei­nen pro­fes­sio­nel­len il­lus­tra­tor fra­gen wür­de, mit dem un­ter­schied, dass hier kein ho­no­rar fliesst, son­dern höchs­tens abo-ge­büh­ren.

der alte fe­lix (das „ori­gi­nal“?) hat frü­her sym­bol­bil­der ge­goo­gelt (bei­spiel 1, bei­spiel 2). das birgt im­mer die ge­fahr in ur­he­ber­recht­fal­len zu tap­pen, öff­ne­te aber ge­le­gent­lich die chan­ce auf wirk­lich gute ka­lau­er. manch­mal habe ich ge­goo­gel­te bil­der leicht mo­di­fi­ziert (bei­spiel 4), aber auch re­mi­xe bar­gen wei­ter die mög­lich­keit in ur­he­ber­recht­li­che fal­len zu tap­pen. ge­le­gent­lich habe ich ei­ge­ne fo­tos als sym­bol­bild ge­nutzt, manch­mal führ­te das zu ganz gu­ten text-bild-sche­ren (bei­spiel 5). weil mei­ne il­lus­tra­ti­ven fä­hig­kei­ten nicht be­son­ders weit rei­chen, sa­hen sym­bol­bil­der manch­mal sehr, sehr sim­pel aus (bei­spiel 6). da half es dann auf vor­ge­fer­tig­tes zu­rück­zu­grei­fen, et­was, das man heu­te dann emo­ji-slop nen­nen könn­te (bei­spiel 7). in die­sem bei­spiel (8) bil­de­te ich mir ein, ur­he­ber­recht­li­che pro­ble­me er­folg­reich zu um­ge­hen, in­dem ich statt ei­nes prin­ce CD-co­vers mit sei­nem foto, ein­fach die rück­sei­te mei­ner lieb­lings CD nutz­te. gaa­anz sel­ten ge­lang es mir die idee der sym­bol­bil­der auf eine me­ta­ebe­ne zu he­ben, aber auf die­se sym­bol­bild-idee bin ich bis heu­te noch stolz: bei­spiel 9. ge­le­gent­lich ver­wies ich auf gran­dio­se sym­bold­bil­der, die sich an­de­re aus­ge­dacht hat­ten: bei­spiel 10, bei­spiel 11.

wa­ren mei­ne sym­bol­bil­der frü­her bes­ser? ich glau­be nicht. nur die werk­zeu­ge und quel­len wan­del­ten sich im­mer wie­der. wahr­schein­lich sind sym­bol­bil­der im­mer ein biss­chen slop, also un­nö­ti­ges bei­werk, deko. und dass die ver­wen­dung von KI-werk­zeu­gen emo­tio­nen weckt ver­ste­he ich auch in an­sät­zen, weil man die­se bil­der halt neu­er­dings über­all sieht. aber an­de­rer­seits ver­ste­he ich es auch nicht.

ich habe heu­te mal ei­nen schrau­ben­schlüs­sel mit mei­ner neu­en ka­me­ra fo­to­gra­fiert und frei­ge­stellt. hier der ver­gleich zwi­schen der foto-, emo­ji- (🔧) und ki-va­ri­an­te.

der witz ist na­tür­lich, dass auch das foto mit KI-werk­zeu­gen ent­stand. mei­ne ka­me­ra be­nutzt KI zur er­stel­lung, ver­ar­bei­tung, ver­bes­se­rung und die nach­be­ar­bei­tung der bil­der, der her­stel­ler nennt die vor­gän­ge und werk­zei­ge hin­ter der fo­to­er­stel­lung ma­chi­ne lear­ning, neu­ral en­gi­ne oder „in­tel­li­gence“. und auch das frei­stel­len des schrau­ben­schlüs­sels ge­schieht auf der ka­me­ra mit KI-werk­zeu­gen.

so ge­se­hen ist je­des ein­zel­ne foto das ich hier ver­öf­fent­li­che „AI-slop“. emo­ji wer­den auch nicht mehr per hand ge­zeich­net, da wer­keln die de­si­gner mit ziem­li­cher si­cher­heit auch mit werk­zeu­gen her­um, die sie hier und da mit KI-funk­tio­nen un­ter­stüt­zen. so ge­se­hen ist jede der oben ge­zeig­ten va­ri­an­ten mei­nes sym­bol­bilds ir­gend­wie KI-durch­seucht.

ich gebe zu: die schöp­fungs­hö­he die­ses und vie­ler an­de­rer sym­bol­bil­der die ich hier be­nut­ze ist nicht son­der­lich hoch. und die mühe, die ich zur il­lus­tra­ti­on von tex­ten auf­wen­de ist im ver­gleich zum schrei­ben auch ge­ring. in­so­fern han­delt es sich viel­leicht um „slop“, im sin­ne von man­geln­der sorg­falt. aber KI ist mitt­ler­wei­le eben in fast al­len le­bens­be­rei­chen tief ein­ge­drun­gen, in die fo­to­gra­fie, in film und fern­se­hen (vfx, spe­zi­al­ef­fek­te) und in die wis­sen­schaf­ten so­wie­so, mit enorm po­si­ti­ven fol­gen wie ne­ga­ti­ven fol­gen. der trick bei der fo­to­gra­phie und gu­ten spe­zi­al ef­fek­ten ist halt die KI-werk­zeu­ge nicht schlam­pig (slop­py) zu ver­wen­den, son­dern so ge­konnt, dass es nie­mand merkt, selbst KI-lu­di­ten nicht.