we­ber­halt

felix schwenzel in über wirres

mein liebs­tes hob­by ist mich in­ten­siv mit kom­ple­xen tech­ni­schen sys­te­men zu be­schäf­ten, sie zu ver­ste­hen, an mei­ne be­dürf­nis­se an­zu­pas­sen und dann best­mög­lich am lau­fen zu hal­ten und stän­dig zu ver­bes­sern oder zu über­ar­bei­ten. den ver­gleich mit dem le­ben, in dem man die ers­ten 20 jah­re da­mit ver­bringt das gan­ze sys­tem zu ver­ste­hen und sich an­zu­pas­sen oder sei­ne best­mög­li­che funk­ti­on zu fin­den und das gan­ze dann mög­lichst lan­ge am lau­fen zu hal­ten durch ste­ti­ge op­ti­mie­rung und an­pas­sung, den ver­gleich spar ich mir jetzt oder ver­fol­ge ihn nicht wei­ter.

was ich mit die­ser web­site, die­sem sehr kom­ple­xen sys­tem, am meis­ten be­schäf­tigt, ist sie am le­ben zu hal­ten in­dem ich sie fül­le, aber ge­nau­so sie stän­dig zu re­pa­rie­ren, feh­ler zu fin­den und sie für mich (und ge­ge­be­nen­falls an­de­re) op­ti­mal nutz­bar zu ma­chen. ein nicht en­den­der, pro­zess, des­sen zwi­schen­er­geb­nis­se mich stets er­freu­en.

und dann kommt frank west­phal und schreibt die­sen ar­ti­kel: wie web­sei­ten ler­nen:

Das letz­te Le­bens­zei­chen: 13 Jah­re her.
Das ak­tu­el­le De­sign: 19 Jah­re alt.
Die­se Site war mal mein gan­zer Stolz.
Zeit, ihr neu­es Le­ben ein­zu­hau­chen …

Schritt 1: En­tro­pie zu­rück­set­zen!

um’s kurz zu ma­chen: frank be­schreibt kon­kret, wie er alte, über die zeit ver­wais­te links re­stau­riert hat. das the­ma „bro­ken links“ ver­folgt mich auch schon län­ger und erst recht seit­dem ich die­se sei­te wie­der­be­lebt habe und ziem­lich ver­lust­frei aus ei­nem ver­al­te­ten sys­tem in ein neu­es sys­tem mi­griert habe. mein ar­chiv, die sei­ten die schon ein paar jah­re auf dem bu­ckel ha­ben, sind (na­tür­lich) voll mit links die nicht mehr funk­tio­nie­ren.

bis­her habe ich das ein­fach hin­ge­nom­men und ge­le­gent­lich die url des „bro­ken links“ in die way­back ma­chi­ne ein­ge­ge­ben und nach ge­fühlt 13 klicks die alte web­site be­staunt, auf die ich vor x jah­ren mal ge­linkt habe.

auf die idee das sys­te­ma­tisch zu tun bin ich noch nicht ge­kom­men. aber was für eine gross­ar­ti­ge idee:

Ver­al­te­te Links [sind] um Län­gen bes­ser als Lö­schen oder Ab­schal­ten. Tote Links sind be­le­gen­de Ar­te­fak­te, kein Man­gel – rich­tig ge­kenn­zeich­net, zei­gen sie Quel­len­la­ge. So las­sen sich In­hal­te oft noch re­kon­stru­ie­ren – über die URL, über Ar­chi­ve, über Kon­text.

ich hab mich gleich nach dem le­sen an die ar­beit ge­macht. mei­ne pro­gram­mier-hel­fer (chatGTP) hat­te zu­erst et­was wil­de ideen um das in kir­by um­zu­set­zen, aber nach ein biss­chen hin und her ha­ben wir uns auf eine stra­te­gie ge­ei­nigt, die mir ge­fällt.

  • erst­mal alle to­ten links sam­meln (in ei­ner json da­tei)
  • für die­se to­ten links dann an­hand des ar­ti­kel-da­tums ei­nen zeit­lich pas­sen­den ar­chiv-snap­shop imn ar­chi­ve.org fin­den (auch in json)
  • zur „lauf­zeit“ die ka­put­ten links mit den re­pa­rier­ten links er­set­zen und kenn­zeich­nen

alle 13.475 bei­trä­ge zu prü­fen (mit 51.735 ex­ter­nen links) hat ein script 12 stun­den lang be­schäftgt. vor­läu­fi­ges er­geb­nis: von den ca. 50.000 links sind un­ge­fähr 10.000 ka­putt.

für die­se 10.000 links die ent­spre­chen­den snapshots auf ar­chi­ve.org zu fin­den ging schon et­was schnel­ler (8 stun­den), bzw. das script läuft noch.

über das ren­dern der re­pa­rier­ten links muss ich mir noch ge­dan­ken ma­chen, der­zeit ten­die­re ich zu farb­li­cher kenn­zeich­nung, statt ei­ner kenn­zeich­nung mit dem ar­chi­ve.org-logo wie bei frank.


ro­bert ha­beck hat mal ge­bloggt (ge­fun­den in links vom 17.12.2018)


das pro­blem von web­sei­ten ist na­tür­lich (u.a.), dass man ih­nen das al­ter nicht an­sieht. wenn web­sei­ten­be­trei­ben­de nicht un­ter ei­nem stein schla­fen, kann man der sei­te zwar meis­tens das al­ter ent­neh­men, aber man sieht, riecht oder fühlt es nicht, wie man es mit ge­al­ter­tem pa­pier bei­spiels­wei­se tut. streng­ge­nom­men müss­te man alte web­sei­ten ei­gent­lich so an­zei­gen, wie sie zum ver­öf­fent­li­chungs­zeit­punkt aus­ge­se­hen ha­ben, aber das ist na­tür­lich auch wie­der quatsch, bzw. eine zu­mu­tung. ich hab mir im­mer vor­ge­stellt, dass web­sei­ten wie laub al­tern könn­ten, also rich­tung braun al­tern. bis jetzt bin ich da­mit zu­frie­den, alte sei­ten oben mit dem al­ter in jah­ren an­zu­zei­gen.

aber da wer­de ich wohl noch ein biss­chen denk­ar­beit in­ves­tie­ren müs­sen.

was mir beim tes­ten der ar­chi­ve.org api und link-kon­struk­ti­on um alte snapshots zu fin­den je­den­falls auf­fiel ist die be­geis­te­rung die mich er­griff, als ich man­che al­ten web­sei­ten mit ih­rer elek­tro­ni­schen pa­ti­na (wie­der) sah. elek­tro­ni­sche pa­ti­na sind bro­ken images, schrot­ti­ges, kan­ti­ges de­sign und mo­bil­te­le­fon-feind­lich­keit. oder bei frank west­phal, der gute alte schlag­schat­ten, den da­mals ir­gend­wie fast je­der be­nutz­te, weil es auf den grob­pi­xeli­gen bild­schir­men die wir zu die­ser zeit nutz­ten „na­tür­li­cher“ aus­sah.

je­den­falls span­nen­de neue denk­auf­ga­be und ein wei­te­rer tol­ler bau­stein bei der ewi­gen re­pa­ra­tur von wir­res.net. dan­ke frank.