Was sind LSI-Keywords?
LSI-Keywords — kurz für Latent Semantic Indexing — ist der SEO-Begriff für Wörter und Phrasen, die semantisch mit Ihrem Hauptthema verwandt sind. Geht es auf Ihrer Seite um „Laufschuhe“, sind Begriffe wie Trainer, Sneaker, Dämpfung, Laufanalyse, Marathon und Pronation LSI-Keywords. Sie signalisieren einer Suchmaschine oder KI-Suchmaschine, dass Ihre Seite das Thema mit echter Tiefe abdeckt — statt nur eine Phrase zu wiederholen.
Wichtige Nuance: Googles John Mueller hat öffentlich gesagt: „LSI-Keywords gibt es nicht“ — Google nutzt nicht das ursprüngliche Latent-Semantic-Indexing-Mathematik-Verfahren von Bell Labs aus 1988 (Deerwester et al.). Moderne Engines nutzen stattdessen BERT, MUM und Word Embeddings. Aber die zugrunde liegende Idee — dass breites, semantisch verwandtes Vokabular thematische Relevanz signalisiert — ist genau das, was diese modernen Systeme belohnen. Wir behalten das Label LSI aus Vertrautheit und nutzen es als Kürzel für „semantische und verwandte Keywords“. Diese Metrik gehört zur Säule Inhaltsqualität in Ihrem GEO-Score.
learnLsiKeywords.howSemanticSearchWorks.title
learnLsiKeywords.howSemanticSearchWorks.intro
learnLsiKeywords.howSemanticSearchWorks.steps.embeddings.title
learnLsiKeywords.howSemanticSearchWorks.steps.embeddings.description
learnLsiKeywords.howSemanticSearchWorks.steps.queryMatching.title
learnLsiKeywords.howSemanticSearchWorks.steps.queryMatching.description
learnLsiKeywords.howSemanticSearchWorks.steps.entityGraphs.title
learnLsiKeywords.howSemanticSearchWorks.steps.entityGraphs.description
learnLsiKeywords.semanticChecklist.title
learnLsiKeywords.semanticChecklist.intro
Warum semantische Keywords für die KI-Suche wichtig sind
KI-Suchmaschinen wie ChatGPT, Perplexity und Google AI Overviews matchen keine Buchstabenketten mehr. Sie wandeln Ihren Text in Vektor-Embeddings und vergleichen ihn mit Anfrage-Embeddings. Seiten, die ein Thema aus mehreren Blickwinkeln abdecken, landen nahe vielen Anfragevektoren — genau dann werden sie zitiert.
Thematische Tiefe schlägt Keyword-Wiederholung
Eine Ahrefs-Studie fand, dass die durchschnittliche Top-Ranking-Seite auch für rund 1.000 verwandte Keywords rankt — nicht weil sie eine Phrase wiederholt, sondern weil sie das Thema breit abdeckt. Seiten mit dünnem semantischem Vokabular wirken auf Google und KI-Suchmaschinen oberflächlich und werden zugunsten umfassenderer Quellen übersprungen.
Engines denken in Entitäten, nicht in Strings
Seit Hummingbird (2013) und BERT (2019) denkt Google in Entitäten — Personen, Orte, Produkte, Konzepte — und ihren Beziehungen. Bill Slawskis Patentforschung bei SEO by the Sea zeigte, dass Google Knowledge-Graph-Entitäten und Co-Occurrence-Terme nutzt, um zu prüfen, ob eine Seite wirklich zu einem Thema gehört. Semantisches Vokabular löst diese Erkennung aus.
Semantische Breite befeuert AI-Overview-Zitate
Eine Ahrefs-Analyse von 4 Mio. AI-Overview-URLs fand, dass breitere thematische Abdeckung stark mit Zitierwahrscheinlichkeit korreliert. Sites mit gut entwickelten Topic-Clustern und semantisch reichem Content erzielen bis zu 30 % höhere Zitierraten in AI Overviews als dünne Single-Keyword-Seiten.
Was die Forschung sagt
The average top-ranking page also ranks in the top 10 for nearly 1,000 other relevant keywords. Pages do not rank for one phrase — they rank for a cloud of semantically-related queries because they cover a topic, not a keyword.
— Ahrefs, How Often Top-Ranking Pages Also Rank for Related Keywords, ranking study (3M+ search queries analyzed)
We analyzed 863,000 keyword SERPs and 4 million AI Overview URLs. Topical authority — measured by the breadth of related keywords a domain ranks for — was the strongest single predictor of AI Overview citations, with a correlation of r = 0.41.
— Ahrefs, AI Overview Citation Patterns Study, 2026 (4M URLs analyzed across 863K SERPs)
There is no such thing as LSI keywords — anyone who is telling you otherwise is mistaken, sorry.
— John Mueller, Google Search Advocate, public statement (2019). The mathematical LSI from Deerwester et al. (1988) is not used by Google. Modern engines use BERT, MUM, and word embeddings — but the practical principle of semantic breadth still applies.
Echte Beispiele: Single-Keyword-Stuffing vs. Semantische Abdeckung
Am klarsten zeigt sich das so: drei reale Seiten und das Vokabular, das sie tatsächlich nutzen. Seiten, die eine Phrase aufstapeln, werden von Google und KI-Suchmaschinen übersprungen. Seiten, die das volle semantische Feld nutzen, werden zitiert.
Beispiel 1: Blogpost zum Thema „Laufschuhe“
„Auf der Suche nach den besten Laufschuhen? Unser Laufschuhe-Guide testet die Top-Laufschuhe 2026. Wir haben Laufschuhe für Straßenlaufen, Trailrunning und Anfänger-Laufen getestet. Die besten Laufschuhe sind die Laufschuhe, die zu Ihrem Laufstil passen. Kaufen Sie Laufschuhe noch heute.“
Warum das nicht funktioniert: „Laufschuhe“ erscheint 9-mal in 50 Wörtern (18 % Dichte einer Phrase). Keine Vokabular-Tiefe — keine Erwähnung von Dämpfung, Sprengung, Laufstil, Pronation, Trainer, Sneaker, Marathon oder anderen Begriffen, die ein echter Experte verwenden würde. Googles Spam-Policy listet „dieselben Phrasen unnatürlich wiederholen“ ausdrücklich als Keyword-Stuffing.
„Den richtigen Laufschuh wählt man nach Laufstil, Aufsatz und Wochenkilometern. Neutralläufer mit Mittelfußaufsatz greifen oft zu maximal gedämpften Trainern wie dem Hoka Clifton 9 (8 mm Sprengung, 32 mm Stack-Höhe). Überpronierer profitieren von Stabilitätssneakern mit Guide Rail oder medialem Stützpfosten. Trailrunner brauchen profilierte Außensohlen für Halt im Gelände, während Marathonläufer oft Carbon-Plate-Wettkampfschuhe für mehr Vortrieb wählen.“
Warum das funktioniert: „Laufschuhe“ wiederholt sich nie — aber die Seite handelt unverkennbar von Laufschuhen. Begriffe wie Laufstil, Aufsatz, Mittelfuß, Sprengung, Stack-Höhe, Überpronierer, Stabilität, medialer Stützpfosten, profilierte Außensohle und Carbon-Plate sagen BERT und modernen KI-Suchmaschinen, dass das Expertencontent ist. Sie wird für hunderte verwandter Anfragen ranken.
Beispiel 2: Produktseite für „ergonomischen Bürostuhl“
„Kaufen Sie unseren ergonomischen Bürostuhl. Dieser ergonomische Bürostuhl ist der beste ergonomische Bürostuhl für jedes Büro. Unser ergonomischer Bürostuhl hat alle Funktionen, die Sie in einem ergonomischen Bürostuhl brauchen. Bestellen Sie Ihren ergonomischen Bürostuhl jetzt.“
Warum das nicht funktioniert: 36 Wörter, 6 Wiederholungen von „ergonomischer Bürostuhl“ (16 % Dichte). Null beschreibendes Vokabular. Ein KI-Assistent, gefragt „welcher Stuhl hat gute Lordosenstütze für eine große Person?“, kann aus dieser Seite nichts ziehen, weil sie weder Lordose, Größe, Stütze noch eine Funktion erwähnt.
„Unser Bürostuhl kombiniert eine verstellbare Lordosenstütze mit 4D-Armlehnen, einer atmungsaktiven Mesh-Rückenlehne und einer Synchronmechanik, die Ihrer Wirbelsäule durch Neigungen von 90 bis 135 Grad folgt. Die Sitztiefe verstellt sich um 70 mm für Nutzer zwischen 1,57 m und 1,96 m. Eine Klasse-4-Hydraulikfeder trägt bis zu 136 kg und erfüllt BIFMA-Haltbarkeitsstandards.“
Warum das funktioniert: Eine natürliche Erwähnung von „Bürostuhl“ plus reiches Vokabular — Lordosenstütze, 4D-Armlehne, Mesh-Rückenlehne, Synchronmechanik, Neigung, Sitztiefe, Hydraulikfeder, BIFMA. Die Seite beantwortet nun Dutzende verwandter Fragen und erscheint bei Long-Tail-Anfragen wie „Stuhl mit verstellbarer Sitztiefe für große Nutzer“.
Beispiel 3: B2B-SaaS-Seite zu „Data Observability“
„Data Observability ist kritisch für Data Observability. Unsere Data-Observability-Plattform liefert Data Observability über Ihren Data-Observability-Stack. Holen Sie sich Data Observability heute mit unseren Data-Observability-Tools, die für moderne Data-Observability-Bedürfnisse gemacht sind.“
Warum das nicht funktioniert: „Data Observability“ ist ein echter B2B-Begriff, aber 8 Wiederholungen in 35 Wörtern ist Spam. Die Seite verfehlt auch die semantische Nachbarschaft: Ein CTO, der das recherchiert, nutzt Begriffe wie Datenqualität, Lineage, Aktualität, Anomalieerkennung, Schema Drift, SLA, dbt, Snowflake, Monte Carlo, OpenLineage. Keiner davon kommt vor, also wird die Seite von ChatGPT bei technischen Anfragen nie zitiert.
„Data Observability gibt Data Teams End-to-End-Sichtbarkeit auf Pipeline-Health: Aktualität, Volumen, Schema Drift, Lineage und Verteilungsanomalien. Anders als klassisches Monitoring deckt Observability die fünf Säulen aus dem Monte-Carlo-Framework ab — und integriert nativ mit dbt, Snowflake, BigQuery und Airflow über OpenLineage. Häufige Alerts sind Null-Spikes, verspätet eintreffende Daten und unerwartete Schemaänderungen upstream.“
Warum das funktioniert: Eine kanonische Erwähnung von „Data Observability“ plus das volle Entitätsfeld — Aktualität, Volumen, Schema Drift, Lineage, Anomalien, Monte Carlo, dbt, Snowflake, OpenLineage, Airflow. ChatGPT zitiert diese Seite nun selbstbewusst bei Fragen zu Datenqualität, Pipeline-Monitoring oder Schema-Drift-Erkennung.
So decken Sie ein Thema semantisch ab
Das sollten Sie NICHT tun
- ✗Ihre exakte Ziel-Phrase mehr als einmal pro 200–300 Wörter wiederholen — Googles Spam-Policy listet das als Keyword-Stuffing, und moderne KI-Suchmaschinen überspringen es schlicht
- ✗Nur die exakte Ziel-Phrase nutzen und offensichtliche Synonyme ignorieren (z. B. „Sneaker“ neben „Trainer“, „Laptop“ neben „Notebook“) — Engines bestrafen unnatürlich enges Vokabular
- ✗Jeden Begriff, den ein „LSI-Keyword-Tool“ vorschlägt, hineinzwingen, auch wenn er nicht passt — Engines erkennen unnatürliche Co-Occurrence-Muster
- ✗Die benannten Entitäten Ihres Themas auslassen — Produkte, Marken, Frameworks, Standards, Personen, Orte. Ohne sie kann BERT Ihre Seite nicht im Knowledge Graph verorten
- ✗Seiten mit dünnen Füll-Synonymen polstern statt mit substanzieller Abdeckung — breites Vokabular ohne echte Information verliert dennoch gegen einen tieferen, dichteren Wettbewerber
Tun Sie stattdessen Folgendes
- ✓Schreiben Sie, als erklärten Sie das Thema einem Fachexperten — er nutzt das volle semantische Vokabular (Jargon, Einheiten, Standards, Markennamen) ganz natürlich
- ✓Öffnen Sie die Top-10-Ranking-Seiten Ihrer Ziel-Anfrage und listen Sie jeden wiederkehrenden Begriff — das deckt die echte semantische Nachbarschaft auf (die SEO-Methode hinter Tools wie Surfer, Clearscope und Frase)
- ✓Bauen Sie die benannten Entitäten ein — Produkte, Organisationen, Standards, Personen, Orte — damit Google Ihre Seite mit seinem Knowledge Graph verbinden kann
- ✓Nutzen Sie Synonyme, Abkürzungen und Pluralformen natürlich („Laufschuhe“ / „Trainer“ / „Sneaker“; „KI“ / „künstliche Intelligenz“) — Backlinkos Forschung zeigt, dass Google diese als gleiche Intention behandelt
- ✓Bauen Sie einen Topic-Cluster: eine Pillar-Seite, die das Thema breit abdeckt, plus 5–15 unterstützende Seiten zu Subtopics. HubSpot-Daten zeigen, dass Topic-Cluster-Sites im Schnitt 43 % mehr organischen Traffic und deutlich höhere KI-Zitierraten erzielen
Schnelltipps für semantische Abdeckung
- •Verbringen Sie 15 Minuten mit den Top-10-SERP-Ergebnissen, bevor Sie schreiben — notieren Sie jedes wiederkehrende Substantiv und Verb. Diese Liste ist Ihre semantische Checkliste.
- •Verwenden Sie Ihre exakte Ziel-Phrase nicht öfter als 1–2-mal pro 300 Wörter. Danach wechseln Sie zu Synonymen, verwandten Begriffen oder Pronomen.
- •Nennen Sie pro Artikel mindestens 3 konkrete Entitäten — ein Produkt, ein Unternehmen, einen Standard, eine Person, einen Ort. Entitäten füttern den Knowledge Graph.
- •Nutzen Sie Surfer, Clearscope, Frase oder Googles „People also ask“ und „Verwandte Suchanfragen“, um semantische Begriffe aufzudecken — aber ignorieren Sie alles, was nicht natürlich passt.
- •Gruppieren Sie verwandte Artikel in Cluster mit internen Links. HubSpot fand, dass Topic-Cluster-Sites organischen Traffic im Schnitt ~3,2-mal schneller wachsen lassen.
- •Lesen Sie jeden Absatz laut. Klingt er wie von einem menschlichen Experten geschrieben, ist das semantische Vokabular wahrscheinlich schon da. Klingt er roboterhaft, stuffen Sie.
Häufig gestellte Fragen
Nutzt Google tatsächlich LSI-Keywords?
Was ist der Unterschied zwischen LSI-Keywords, semantischen Keywords und verwandten Keywords?
Wie finde ich semantische Keywords zu meinem Thema?
Was ist mit Keyword-Dichte — gilt die alte 1–3-%-Regel noch?
Hilft das Hinzufügen weiterer semantischer Keywords, von ChatGPT und Perplexity zitiert zu werden?
Kann ich einfach einen KI-Writer für semantischen Content nutzen?
Verwandte Metriken zum Erkunden
- Vollständigkeit
Semantische Keywords sind das Vokabular; Vollständigkeit ist die Tiefe der Abdeckung. Zusammen signalisieren sie, dass Ihre Seite das Thema wirklich abdeckt.
- Thematische Autorität
Ahrefs fand, dass thematische Autorität (Breite verwandter Keyword-Rankings) der stärkste Einzel-Prädiktor für AI-Overview-Zitate ist. Bauen Sie sie mit Topic-Clustern auf.
- Semantische Klarheit
Auch mit reichem Vokabular müssen Sätze eindeutig sein. Semantische Klarheit sorgt dafür, dass BERT und KI-Suchmaschinen die Bedeutung Ihres Texts korrekt extrahieren.
- Knowledge Graph
Benannte Entitäten (Produkte, Marken, Personen, Orte) verbinden Ihre Seite mit Googles Knowledge Graph — dem strukturierten Rückgrat hinter AI Overviews und ChatGPT.