---
title: mit maschinen über maschinenlesbarkeit reden
date: "2025-12-13T18:15:00+01:00"
url: "https://wirres.net/articles/mit-maschinen-uber-maschinenlesbarkeit-reden"
tags: [aus dem maschinenraum, jsonld, seo, see, instagram, google, maschinenlesbarkeit]
category: über wirres
additional_categories: [wirres.net]
author: felix schwenzel
---

# mit maschinen über maschinenlesbarkeit reden

in den letzten tagen habe ich oft mit *gemini* über maschinenlesbaren code und meine implementierung davon hier auf wirres.net geredet. die implementierung mache ich mir *cursor*, was wiederum im hintergrund verschiedene agenten für das coding selbst nutzt. von daher ist es wahrscheinlich nicht schlecht, die arbeit von cursor nicht nur selbst zu *reviewen*, sondern auch noch weitere meinungen, diagnosen und einschätzungen einzuholen.

es zeigt sich, nicht alles was validiert ist auch unbedingt richtig. [ein paar sachen funktionieren bereits richtig gut](https://wirres.net/articles/ganz-hinten-und-doch-vorne) und *google* (der suchbot, der indexer, whatever) versteht hier und da meine inhalte, oder besser, meine intention. an anderen stellen klemmt es noch. so erkennt *google* ein paar meiner bilder [als cc lizensiert](https://www.google.com/search?q=site:wirres.net&sca_esv=ac0834c4b5f7f19c&rlz=1C5CHFA_enDE900DE900&udm=2&tbas=0&sxsrf=AE3TifM5E4Hf3M6MNmGFxrLmKX8t4BA-Cg:1765561890008&source=lnt&tbs=sur:cl&sa=X&ved=2ahUKEwiiuKHKzriRAxWHg_0HHYfFHbYQpwV6BAgGEB0&biw=1440&bih=788&dpr=2), aber nicht alle.

ich finde das alles irre spannend, weil ich *google* bei der arbeit zugucken kann, erkenne wo noch verständnisprobleme stecken und was gegebenenfalls optimiert oder angepasst werden muss.

eben habe ich *gemini* gefragt, wie es die relevanz von maschinenlesbarer auszeichnunng von webinhalten insgesamt bewertet. der grösste faktor dürfte weiterhin *google* sein, das mit der rich-result-anzeige eine dicke, fette karotte in der hand hält, die es vor die nasen von website-betreibenden halten kann.

aber dieses argument, dass sich *gemnini* ausgedacht hat finde ich faszinierend. nämlich das maschinenlesbarer code auch eine antidot gegen ironie sein kann, ein faktenbett, mit dem ironie besser kontextualisiert werden könnte.

> [Maschinenlesbare Auszeichnungen sorgen dafür], dass auch die dümmste KI kapiert, dass dein Verriss eigentlich eine 5-Sterne-Empfehlung ist. **JSON-LD ist der einzige Ort im Internet, wo Ironie verboten ist – und genau das brauchen Maschinen**.

das ist die detailierte herleitung:

> **Fakten vs. Nuance**: Dein Blog ist ironisch ("fachblog für irrelevanz", "[werbung ohne werbung](https://wirres.net/articles/werbung-ohne-werbung)"). Ein Mensch versteht die Ironie. Eine KI könnte verwirrt sein.
> * Text: "Die Mühle ist hässlich, aber mahlt super."
> * *JSON-LD*: reviewRating: 5.
> * Das JSON liefert der KI die "Ground Truth" (die faktische Wahrheit). Es reduziert das Risiko, dass die KI deine Ironie missversteht und sagt: "Der Autor hasst die Mühle."

---

*instagram* nutzt wohl auch json-ld, wer hätte das gedacht? eigentlich ist *instagram* dafür bekannt sehr aggressiv gegen scraping vorzugehen. von der *instagram*-webseite kann man mit bordmitteln keine bilder sichern oder kopieren und selbst um an die eigenen inhalte zu kommen muss, man technisch sehr tief gehen und [bekommt dann ständig auf die nase](https://wirres.net/sofortbilder/3678524890751790499).

instagram nutzt json-ld, allerdings sperrt es offenbar alle user-agents ausser denen von google aus.

1. wenn ich diesen [*instagram*-beitrag](https://www.instagram.com/p/DSF9N6GiPgc/) von mir im browser aufrufe enthält der quelltext keine json-ld (keine maschinenlesbaren infos)
2. wenn ich den gleichen beitrag [in *googles* rich-results-test aufrufe](https://search.google.com/test/rich-results/result?&url=https%3A%2F%2Fwww.instagram.com%2Fp%2FDSF9N6GiPgc%2F), sprudeln plötzlich maschinenlesbare infos aus instagram
3. wenn ich den gleichen beitrag [im *schema.org*-validator aufrufe](https://validator.schema.org/#url=https%3A%2F%2Fwww.instagram.com%2Fp%2FDSF9N6GiPgc%2F), verweigert *instagram* den zugriff

![screenshot vom google rich text tester, hier die auflistung von schema elementen einer instagramseite](https://wirres.net/media/pages/articles/mit-maschinen-uber-maschinenlesbarkeit-reden/745d9ad8bd-1765642131/google-rich-test-tester-640x.png)

![screenshot vom schema.org valdator, hier meldet schema.org dass es auf einer instagramseite keine daten findet](https://wirres.net/media/pages/articles/mit-maschinen-uber-maschinenlesbarkeit-reden/9f85d3a669-1765642131/schema-org-validator-640x.png)

bemerkenswert: die im json-ld ausgegebenen bildurls scheinen permanent zu funktionieren, ein privileg, das *instagram* offenbar lediglich google gönnt: [testlink](https://scontent-atl3-2.cdninstagram.com/v/t51.82787-15/597985966_18543925561003314_677103018590881411_n.jpg?stp=dst-jpg_e35_s640x640_tt6&_nc_cat=102&ccb=7-5&_nc_sid=18de74&efg=eyJlZmdfdGFnIjoiQ0FST1VTRUxfSVRFTS5iZXN0X2ltYWdlX3VybGdlbi5DMyJ9&_nc_ohc=sBcezz2aFcgQ7kNvwEP0ZdL&_nc_oc=AdlWy0iAjbJ_ZEsLy4zorHgE1HZSycW7VT5ire-FBtsBrmSnu9yQr_U0hJdbxHDrhSM&_nc_zt=23&_nc_ht=scontent-atl3-2.cdninstagram.com&_nc_gid=Eoxj4qQ466HcxD_PFf4eJA&oh=00_Aflof_Yy1naxEeLxpm_TkhCWSkoHl5Uvh1gIJNFFQDZjEw&oe=69436725). bildurls die man *instagram* aus der entwicklerkonsole entlockt, verlieren ihre gültigkeit nach ein paar stunden ([testlink](https://scontent-ham3-1.cdninstagram.com/v/t51.82787-15/597985966_18543925561003314_677103018590881411_n.jpg?stp=dst-jpg_e35_s1080x1080_tt6&_nc_cat=102&ig_cache_key=Mzc4NDcwMDI4NzEyNzE4MTU3Mw%3D%3D.3-ccb7-5&ccb=7-5&_nc_sid=58cdad&efg=eyJ2ZW5jb2RlX3RhZyI6InhwaWRzLjIxNjB4MTIxNS5zZHIuQzMifQ%3D%3D&_nc_ohc=sBcezz2aFcgQ7kNvwHhl2up&_nc_oc=Adkb3aQiOXa3L9nicD_TBYB5ew7mKV3vyxXk6qHzhuHAz7za48fCpm3R6WkxqKYI0HI&_nc_ad=z-m&_nc_cid=0&_nc_zt=23&_nc_ht=scontent-ham3-1.cdninstagram.com&_nc_gid=bmiHpc1TWbu9l8EGa8w3FA&oh=00_AfkWacUKDOZ7ZQYDwUaDMYr3pLIfn3OSk-Yimf62u9UB0Q&oe=69436725)) (noch halten beide links).

das ist so ähnlich [wie das was *der spiegel* mit seinen videos veranstaltet](https://wirres.net/articles/aus-dem-maschinenraum-des-spiegel). otto-normal-besucher bekommt die videos nur mit werbung versehen zu gesicht, *google* darf die werbefreie quelldatei aus den maschinenlesbaren metadaten ziehen. die karotten die *google* websitebetreibenden oder hier *instagram* und dem *spiegel* verspricht, verleiteten beide zur diskriminierung von menschen und maschinen, wobei *instagram* zusätzlich auch noch nach herkunft diskriminiert (*google* only).

was *instagram* *google* zum frass vorwirft habe ich mir wegen [diesem artikel auf *cachys blog* angesehen](https://stadt-bremerhaven.de/instagram-generierte-ungefragt-seo-headlines-fuer-posts/):

> Die Plattform erstellt(e) offensichtlich automatisch Überschriften und Beschreibungen für Nutzer-Posts, damit diese besser bei Google ranken.
> […]
> Viele Nutzer fühlen sich dadurch falsch dargestellt und haben keine Kontrolle darüber, wie ihre Inhalte im Netz präsentiert werden. Gerade bei sensiblen Themen oder kreativen Inhalten kann das schnell problematisch werden.

als ich das gelesen habe, dachte ich natürlich wie schön es wäre, wen man bilder und filme einfach bei sich auf einer eigenen webseite hosten könnte, auf einer webseite die man unter kontrolle hat und selbst bestimmen kann, was die maschinen zu sehen bekommen und was nicht.

---

ich poste mittlerweile nur noch sporadisch auf *instagram*. die insights, die instagram mittlerweile jedem zugänglich macht, zeigen auch, dass meine bilder dort ohnehin nur an wenige meiner follower ausgespielt werden. möchte ich dass mehr meiner follower die beiträge sehen, muss *instagram* schon sehr gut gelaunt sein oder will werbegeld von mir. 

ich mag meinen workflow hier im blog mittlerweile lieber, als das mal-eben-schnell-posten auf *instagram*:

* ich kann lizenzinfos anhängen und die lizenz und **zugänglichkeit** meiner bilder selbst steuern
* ich kann schlagworte, links, text, video, geodaten frei schnauze benutzen
* ich kann einmal für alle bilder alt-texte setzen und beiträge und bilder dann inklusive der alt-texte zu mastodon und bluesky „syndizieren“
* ich kann meta-beschreibungen, titel nachträglich ändern und die präsentation, anordnung, grösse der bilder auch komplett selbst bestimmen

der preis dafür (alles selbst bestimmen zu können) ist etwas weniger reichweite und gefühlt eine etwas geringere „interaktion“.

für mich das stärkste argument bilder und filmchen selbst zu hosten, unter eigener kontrolle, ist die gestaltungsmacht über alles, zum beispiel mein archiv zu haben. die halbwertszeit eines post hier im blog dürfte sich nicht gross von der halbwertszeit eines beitrags auf instagram, mastodon oder bluesky unterscheiden. mit anderen worten: kaum jemand schaut sich beiträge an, die älter als 24 stunden oder eine woche sind. aber wenn ich will, kann ich (und jeder andere) schauen, was ich [im dezember 2012](https://wirres.net/grid?year=2012&month=12&category=bilder) so getrieben habe. ich kann alte beiträge von mir einfach einbetten, ohne mir einen haufen tracker von einem dritten ins haus zu holen.

> ![Photo by felix schwenzel in Maxim Gorki Theater. Keine Fotobeschreibung verfügbar..](https://wirres.net/media/pages/sofortbilder/350418825224923681/1bb4e93399-1355993200/2012-12-20_08-46-40_UTC.jpg)
> 
> dafuck?
> 
> — [ursprünglich veröffentlicht am 20.12.2012](https://wirres.net/sofortbilder/350418825224923681)

wo war ich? ach ja. mir fiel heute auf, deshalb die überschrift „mit einer maschine über maschinenlesbarkeit reden“, wie viel vergnügen es mir bereitet mit *gemini* oder *cursor* über solche technischen details zu plaudern. ich bilde mir ein, die maschinen haben interesse an solchen detail-diskussionen und ich muss keinen menschen mit solchen gesprächen langweilen. wobei ich mich natürlich schon frage, wer diesen text, ausser ein paar maschinen, bis hier überhaupt gelesen hat?