„AI-slop“

felix schwenzel vor 2 Monaten in artikel

volkers antwort auf meinen letzten beitrag, der ein KI generiertes symbolbild in „knete“ nutzte, lautete:

der „original“ felix reagierte auf kritik meist renitent oder spitzfindig. spitzfindig reagiert der aktuelle felix weiterhin. oder positiver ausgedrückt, ich reagiere auf kritik nachdenklich. und werde dann spitzfindig. in diesem fall, indem ich zunächst präzision bei der kritik einfordere. davon dass begriffe wie AI-slop von menschen „sloppy“ benutzt werden, war offenbar auch martin genervt und liess claude dazu argumente sammeln. das als antwort auf volker weiter zu verwenden wäre dann aber tatsächlich sloppy.

volker hat im kern natürlich recht. er ist genervt von der vermeintlich gedankenlosen verwendung von KI-werkzeugen zur bildgenerierung. ich bin teilweise auch genervt von der ästhetik dieser bilder und frage mich: warum, muss das sein? aber wirklich gedankenlos muss das nicht sein. der schockwellenreiter ist zum beispiel so freundlich die promts (und werkzeuge) zu nennen, die er zur KI-artikelbildgenerierung nutzt. hier zum beispiel:

Prompt: »Colored Franco-Belgian Comic Style. An elephant in a green dressing gown sits at a desk in front of an old-fashioned steampunk-style computer. The surrounding walls are lined with shelves filled with old books. In the background is a window overlooking a city. Through the window, a blimp can be seen in the sky. Sunlight floods the room.«. Modell: Nano-Banana.

der schockwellenreiter lässt sich bilder erstelllen, die seinen vorstellungen von passend, schön oder seinen assoziationen entsprechen (zur neuen version von libre office assoziert er aus unerfindlichen gründen „a sexy young woman with long red hair, green eyes and red lipstick“). ich gehe davon aus, er modifiziert die promts, wenn das ergebnis, das er geliefert bekommt, nicht seinen vorstellungen entspricht. nicht anders, als wenn er einen professionellen illustrator fragen würde, mit dem unterschied, dass hier kein honorar fliesst, sondern höchstens abo-gebühren.

der alte felix (das „original“?) hat früher symbolbilder gegoogelt (beispiel 1, beispiel 2). das birgt immer die gefahr in urheberrechtfallen zu tappen, öffnete aber gelegentlich die chance auf wirklich gute kalauer. manchmal habe ich gegoogelte bilder leicht modifiziert (beispiel 4), aber auch remixe bargen weiter die möglichkeit in urheberrechtliche fallen zu tappen. gelegentlich habe ich eigene fotos als symbolbild genutzt, manchmal führte das zu ganz guten text-bild-scheren (beispiel 5). weil meine illustrativen fähigkeiten nicht besonders weit reichen, sahen symbolbilder manchmal sehr, sehr simpel aus (beispiel 6). da half es dann auf vorgefertigtes zurückzugreifen, etwas, das man heute dann emoji-slop nennen könnte (beispiel 7). in diesem beispiel (8) bildete ich mir ein, urheberrechtliche probleme erfolgreich zu umgehen, indem ich statt eines prince CD-covers mit seinem foto, einfach die rückseite meiner lieblings CD nutzte. gaaanz selten gelang es mir die idee der symbolbilder auf eine metaebene zu heben, aber auf diese symbolbild-idee bin ich bis heute noch stolz: beispiel 9. gelegentlich verwies ich auf grandiose symboldbilder, die sich andere ausgedacht hatten: beispiel 10, beispiel 11.

waren meine symbolbilder früher besser? ich glaube nicht. nur die werkzeuge und quellen wandelten sich immer wieder. wahrscheinlich sind symbolbilder immer ein bisschen slop, also unnötiges beiwerk, deko. und dass die verwendung von KI-werkzeugen emotionen weckt verstehe ich auch in ansätzen, weil man diese bilder halt neuerdings überall sieht. aber andererseits verstehe ich es auch nicht.

ich habe heute mal einen schraubenschlüssel mit meiner neuen kamera fotografiert und freigestellt. hier der vergleich zwischen der foto-, emoji- (🔧) und ki-variante.

freigestelltes foto eines schraubenschlüssel

vergrössertes emoji eines schraubenschlüssel

der witz ist natürlich, dass auch das foto mit KI-werkzeugen entstand. meine kamera benutzt KI zur erstellung, verarbeitung, verbesserung und die nachbearbeitung der bilder, der hersteller nennt die vorgänge und werkzeige hinter der fotoerstellung machine learning, neural engine oder „intelligence“. und auch das freistellen des schraubenschlüssels geschieht auf der kamera mit KI-werkzeugen.

so gesehen ist jedes einzelne foto das ich hier veröffentliche „AI-slop“. emoji werden auch nicht mehr per hand gezeichnet, da werkeln die designer mit ziemlicher sicherheit auch mit werkzeugen herum, die sie hier und da mit KI-funktionen unterstützen. so gesehen ist jede der oben gezeigten varianten meines symbolbilds irgendwie KI-durchseucht.

ich gebe zu: die schöpfungshöhe dieses und vieler anderer symbolbilder die ich hier benutze ist nicht sonderlich hoch. und die mühe, die ich zur illustration von texten aufwende ist im vergleich zum schreiben auch gering. insofern handelt es sich vielleicht um „slop“, im sinne von mangelnder sorgfalt. aber KI ist mittlerweile eben in fast allen lebensbereichen tief eingedrungen, in die fotografie, in film und fernsehen (vfx, spezialeffekte) und in die wissenschaften sowieso, mit enorm positiven folgen wie negativen folgen. der trick bei der fotographie und guten spezial effekten ist halt die KI-werkzeuge nicht schlampig (sloppy) zu verwenden, sondern so gekonnt, dass es niemand merkt, selbst KI-luditen nicht.

nachtrag 20.10.2025: der schockwellenreiter erklärt seinen workflow und werkzeuge zu bild-generierung.