Erste Daten: Schema-Markup bringt keine zusätzlichen KI-Zitate
Eine Achtung.app-Auswertung von 1.301 DACH-Marken in vier Branchen zeigt ein überraschendes Bild: Marken, die Schema-Markup (JSON-LD) auf ihrer Startseite einsetzen, werden im Schnitt weniger in KI-Antworten zitiert, nicht mehr. Über alle Branchen hinweg erhalten sie 0,49 Zitate weniger pro Marke (2,19 mit JSON-LD vs. 2,68 ohne). Der Unterschied ist messbar, aber wie sich gleich zeigt, irreführend.
Durchschnittliche KI-Zitate pro Marke nach JSON-LD-Typ
Über alle Branchen aggregiert. Negative Differenzen dominieren, FAQPage und Product tendieren positiv aber bei kleinen Stichproben.
Durchschnittliche Anzahl KI-Zitate pro Marke. Statistische Tests und Bonferroni-Korrektur siehe Einschränkung unten.
Aufgeschlüsselt nach Branche verschwindet der Effekt fast vollständig. In keiner der vier Branchen (Marketing, SaaS, Finance, Media) reicht der Unterschied für die wichtigste Schema-Variante (Organization) für eine belastbare Aussage. Was wie ein negativer Effekt von Schema aussieht, ist tatsächlich eine Statistik der Branchen-Zusammensetzung: Marketing-Sites haben mit 71 Prozent die höchste Schema-Verbreitung und gleichzeitig die niedrigste Zitationsrate. SaaS-Sites werden am häufigsten zitiert, ohne dabei mehr Schema einzusetzen. Wer einfach den Durchschnitt über alle Branchen bildet, vermischt diese Effekte und sieht eine scheinbare negative Korrelation, die innerhalb jeder Branche verschwindet.
Durchschnittliche KI-Zitate pro Marke (irgendein JSON-LD), nach Branche stratifiziert
Innerhalb jeder Branche schrumpft der Effekt deutlich; die Differenzen werden kleiner und enger.
Durchschnittliche Anzahl KI-Zitate pro Marke. Statistische Tests und Bonferroni-Korrektur siehe Einschränkung unten.
Pro JSON-LD-Typ zeigt sich kein einheitliches Bild. WebSite (-0,67) und BreadcrumbList (-0,60) liegen aggregiert am stärksten negativ. FAQPage (+0,38) und Product (+0,94) tendieren positiv, sind aber bei n=88 bzw. n=58 zu klein für belastbare Aussagen. Organization (-0,26) verfehlt knapp die Signifikanzschwelle.
Selbst die beiden leicht positiven Tendenzen, FAQPage und Product, sind kein Argument für Schema. Beide finden sich typischerweise auf Seiten mit Q&A-Blöcken oder detaillierten Produktbeschreibungen, also genau dem sichtbaren Text, den search-grounded LLMs ohnehin lesen. Wenn dort überhaupt ein Effekt liegt, kommt er aus dem Inhalt, nicht aus dem JSON-LD.
Das Ergebnis deckt sich mit einer parallelen Ahrefs-Studie auf US-Daten, die mit einem Difference-in-Differences-Design (also einem Vorher-Nachher-Vergleich mit Kontrollgruppe) ebenfalls keinen positiven Effekt fand (-4,6 % bei AI Overviews, +2,4 % bei AI Mode, +2,2 % bei ChatGPT, alle innerhalb des Rauschens). Der wahrscheinlichste Grund ist mechanisch: search-grounded LLMs wie ChatGPT, Gemini und Perplexity rufen Seiten live ab und lesen primär den sichtbaren Seitentext für die Antwortzusammenstellung. JSON-LD-Blöcke im HTML-Head haben dabei nach aktueller Evidenz keine messbare direkte Wirkung. Für Knowledge Graph, Rich Results und Entitätsabgleich in klassischer Suche bleibt strukturiertes Markup nützlich; als Hebel für KI-Zitate zeigt es in dieser ersten Auswertung keinen Effekt.
Einschränkung: Die Daten sind eine Momentaufnahme, also Korrelation und keine Kausation. Drei weitere Vorbehalte sind wichtig. Erstens misst der Hygiene-Snapshot nur die Startseite; Schema auf Produkt-, FAQ- oder Studienseiten erfasst er nicht. KI-Antworten zitieren zudem oft Drittquellen wie Wikipedia oder Branchenmedien statt der Marke selbst, was den Bezug zur Homepage-Hygiene zusätzlich verdünnt. Zweitens wurden 28 Vergleiche getestet; unter einer Bonferroni-Korrektur (Signifikanzschwelle 0,05 ÷ 28 ≈ 0,0018) bleiben nur der Gesamteffekt für irgendein JSON-LD und der für WebSite eindeutig signifikant. Drittens zeigt sich derselbe Null-Effekt auch bei der normalisierten Zitationsrate (Anteil der Anfragen, in denen die Marke genannt wurde): 4,7 % mit JSON-LD vs. 5,6 % ohne, nicht nur bei der absoluten Zitationszahl. Alle Marken im Datensatz sind bereits in mindestens einem Branchenreport gelistet, d. h. sie haben eine gewisse Grund-Sichtbarkeit in KI-Antworten. Für eine kausale Aussage braucht es Daten über Marken, die Schema neu hinzufügen oder entfernen, gemessen vor und nach der Änderung. Die wöchentlichen Hygiene-Snapshots von Achtung.app laufen seit zwei Wochen; in 8 bis 12 Wochen ist eine erste Vorher-Nachher-Analyse möglich.