SEO, KI, ma­schi­nen und men­schen

felix schwenzel

>

ich habe mir vor 16 jah­ren mal ge­dan­ken über such­ma­schi­nen op­ti­mie­rung ge­macht, die ich heu­te nach wie vor für rich­tig hal­te. ei­gent­lich las­sen sich die ge­dan­ken in zwei bul­let points zu­sam­men­fas­sen:

  • schrei­be für men­schen
  • sor­ge für op­ti­ma­le zu­gäng­lich­keit

der frü­he ge­dan­ke hin­ter goog­le war so ein­fach wie ge­ni­al. die be­wer­tung ei­nes tex­tes über­lässt man am bes­ten men­schen. und wenn die im web et­was in­ter­es­sant oder wert-voll fin­den, wei­sen sie dar­auf hin, ver­lin­ken es. so brauch­te der frü­he page-rank kei­ne künst­li­che in­tel­li­genz oder aus­ge­fuchs­te al­go­rith­men, das craw­len und zäh­len von links reich­te. die kom­ple­xi­tät der wer­tungs­me­cha­ni­ken von such­ma­schi­nen (also de-fac­to goog­le) wur­de im lau­fe der zeit na­tür­lich im­mer grös­ser, sei es zur spam­be­kämp­fung, zur dif­fe­ren­zie­rung oder aus kom­mer­zi­el­len mo­ti­ven. aber die grund­idee bleibt. gute tex­te, gute vi­de­os, gute bil­der, die ein pu­bli­kum fin­den, wer­den im in­ter­net nach oben ge­spült.

da­bei hilft es so­wohl den men­schen, als auch den ma­schi­nen, wenn die tex­te gut zu­gäng­lich sind: les­ba­res, zu­gäng­li­ches web­de­sign, abon­nier­bar­keit, kla­re in­halt­li­che und tech­ni­sche aus­zeich­nung, me­ta­da­ten (al­ter, in­halts­art, au­to­ren­schaft, ge­ge­be­nen­falls li­zenz­rech­te), das wich­tigs­te und neu­es­te zu­erst, über­sich­ten und ver­zeich­nis­se.


ich hole die­se ol­len ge­dan­ken jetzt des­halb aus der mot­ten­kis­te, weil hier und da dis­kus­sio­nen auf­flam­men wie und ob man für künst­li­che in­tel­li­gen­zen (oder LLM-craw­ler) schrei­ben soll. eine über­sicht über ei­ni­ge der dis­kus­sio­nen lie­fert riv­va.

ei­nen strang der dis­kus­si­on fasst clau­dia klin­ger in ih­rer di­gi­tal dia­ry zu­sam­men:

Such­ma­schi­nen-Op­ti­mie­rung war ges­tern, LLM-Op­ti­mie­rung ist heu­te

sie hat per­ple­xi­ty ge­fragt und per­ple­xi­ty meint:

Im Ge­gen­satz zu HTML, das pri­mär für die vi­su­el­le Dar­stel­lung von In­hal­ten op­ti­miert ist, kon­zen­triert sich JSON auf die in­halt­li­che Struk­tur und se­man­ti­sche Be­deu­tung. Wäh­rend HTML mit vie­len Lay­out- und Sty­ling-Ele­men­ten an­ge­rei­chert ist, die für LLMs ver­wir­rend sein kön­nen, bie­tet JSON eine kla­re, hier­ar­chi­sche Da­ten­struk­tur ohne vi­su­el­les „Rau­schen“. Dies macht JSON zu ei­nem be­vor­zug­ten For­mat für die Da­ten­be­reit­stel­lung an LLMs und an­de­re KI-Sys­te­me.

mei­ner mei­nung nach stimmt das, ist aber — wie so oft bei KI-ant­wor­ten — gleich­zei­tig auch quatsch. so pro­pa­giert goog­le schon seit an­der­t­alb jahr­zehn­ten, bzw. emp­fiehlt json-ld da­mit web­sei­ten­be­trei­ber struk­tu­rier­te da­ten op­ti­mal zur ver­fü­gung stel­len. aber goog­le un­ter­stützt auch html-er­wei­te­run­gen wie mi­kro­da­ten und RDFa.

mi­kro­da­ten wer­den zum bei­spiel im in­die­web be­vor­zugt ein­ge­setzt. nicht pri­mär für SEO- oder LLM-op­ti­mie­rung, son­dern eben für die zu­gäng­lich­keit und die mensch/ma­schi­ne kom­mu­ni­ka­ti­on. mit mi­kro­da­ten aus­ge­zeich­ne­te web­sei­ten las­sen sich ein­fa­cher zi­tie­ren, er­wäh­nen, li­ken, re­pos­ten, ein­bet­ten - wha­te­ver.

ob­wohl ich bis­her mein html nur mit ein paar mi­kro­da­ten an­ge­rei­chert habe, spukt der mi­cro­da­ten-par­ser hier schon gen­az brauch­ba­res json aus (mit dem sich zum bei­spiel ein wir­res.net feed-abo bas­teln lies­se). be­ein­dru­cken­der ist das was der par­ser aus aa­ron pare­ckis sei­te macht: sau­be­re, of­fe­ne und struk­tu­rier­te da­ten — nicht pri­mär für such­ma­schi­nen oder LLMs, son­dern für dich und mich, um dar­aus et­was zu ma­chen, oder eben — und das ist der punkt — mit den werk­zeu­gen mei­ner wahl auf die in­hal­te mei­ner wahl zu­grei­fen zu kön­nen.


ich bie­te hier mei­ne ge­dan­ken und ideen zur lek­tü­re an und freue mich über je­den und jede die die­ses an­ge­bot an­nimmt und mei­ne ge­dan­ken auf­nimmt. auf wel­chem weg das ge­schieht ist mir re­la­tiv egal. wer sich das vor­le­sen las­sen will, das in ei­nem feed­rea­der oder eine app kon­su­mie­ren möch­te, lie­ber zu­sam­men­fas­sun­gen von an­de­ren men­schen, such­ma­schi­nen oder LLMs le­sen/hö­ren möch­te. mir al­les egal, bzw. ich hel­fe so­gar ger­ne da­bei die tech­ni­schen und or­ga­ni­sa­to­ri­schen vor­aus­set­zun­gen zu schaf­fen, da­mit mei­ne ge­dan­ken den weg in an­de­re ge­hir­ne schaf­fen.

oder an­ders ge­sagt, ge­le­sen (ge­se­hen, ge­hört) zu wer­den ist doch der witz vom ver­öf­fent­li­chen?

na­tür­lich ge­hen bei die­ser be­haup­tung ganz vie­le zei­ge­fin­ger nach oben und es wird ger­ne be­haup­tet, dass es ein kar­di­nal­feh­ler sei, in­hal­te on­line zu ver­schen­ken. zu­min­dest in be­zug auf den jour­na­lis­mus, glau­be ich dass die kri­se des jour­na­lis­mus eher auf eine rei­he von feh­lern und nicht ei­nen ein­zel­nen oder kar­di­na­len feh­ler zu­rück­zu­füh­ren ist. aber ab­ge­se­hen da­von habe ich we­nig lust auf die­se dis­kus­si­on und sehe mei­ne ent­sch­ei­dung mei­ne ge­dan­ken of­fen und gut zu­gäng­lich ins netz zu stel­len eben ge­nau nicht als feh­ler an.

con­stan­tin seibt hat das le­sen mal als ein blen­den­des ge­schäft für die le­ser be­schrie­ben: „In ei­ner Mi­nu­te ha­ben sie eine Stun­de frem­de Denk­ar­beit oder mehr ge­won­nen.“

aber das ge­schäft ist ja nicht ein­sei­tig: ist es nicht auch ein blen­den­des ge­schäft die mög­lich­keit zu ha­ben in die köp­fe von an­de­ren men­schen ein­zu­drin­gen und dort spu­ren zu hin­ter­las­sen?

dik­ta­to­ren, arsch­lö­cher und mie­se­pe­ter ha­ben das schon lan­ge er­kannt. pro­pa­gan­da ist im­mer kos­ten­los und im­mer op­ti­mal zu­gäng­lich und hat kein an­de­res ziel als in die köp­fe der men­schen ein­zu­drin­gen.

ich will hier kei­nes­falls be­haup­ten, dass ich hier ei­nen wert­vol­len bei­trag für die de­mo­kra­tie oder et­was sinn­vol­les ge­gen die troll­ar­meen von pu­tin, elon musk, trump oder wem auch im­mer un­ter­neh­me, das ma­chen vie­le gros­se und klei­ne pu­bli­ka­tio­nen schon sehr gut. auch wenn ich jetzt nur den volks­ver­pet­zer er­wäh­ne, dürf­te die mehr­heit der hier le­sen­den wis­sen wer ge­meint ist und wo die zu fin­den sind.

was ich be­haup­ten will ist fol­gen­des: „in­hal­te“ zu ver­schen­ken ist auch für die schen­ken­den, die schrei­ben­den oder spre­chen­den ein glän­zen­des ge­schäft. naja, zu­min­dest gilt das für mich; es be­rei­tet mir gros­se freu­de und be­frie­di­gung mein wis­sen, mei­ne er­fah­run­gen wei­ter zu ge­ben. nicht zu­letzt auch des­halb, weil ich die freu­de ken­ne, wis­sen, know-how, in­spi­ra­ti­on von an­de­ren zu emp­fan­gen, die ihr wis­sen und know-how tei­len und mich in­spi­rie­ren. teil ei­ner ma­schi­ne, ei­nes sys­tems zu sein, das an­de­re be­fä­higt gute oder bes­se­re ent­sch­ei­dun­gen zu tref­fen, sa­chen zu ma­chen, zu bau­en, zu ver­schö­nern, zu op­ti­mie­ren ist schon an sich ein fürst­li­cher lohn.


ich habe jetzt ja knapp fünf jah­re er­lebt, was es be­deu­tet mei­ne ge­dan­ken nicht in ein öf­fent­lich zu­gäng­li­ches gros­ses loch zu wer­fen, aus dem sich an­de­re be­die­nen kön­nen. un­ge­teil­tes, nicht „ver­schenk­tes“ wis­sen ist durch­aus nütz­lich, aber es macht viel we­ni­ger freu­de und wächst und reift lang­sa­mer. wis­sen, er­fah­run­gen samm­le und ver­ar­bei­te ich oh­ne­hin, aber die freu­de und be­frie­di­gung die sich er­gibt, wenn man das al­les auch tei­len kann und das ge­teil­te wir­kung zeigt — ist un­be­zahl­bar.