Wat zijn LSI-zoekwoorden?
LSI-zoekwoorden — kort voor Latent Semantic Indexing — is de SEO-term voor woorden en zinnen die semantisch verwant zijn aan je hoofdonderwerp. Gaat je pagina over "hardloopschoenen", dan zijn termen als trainers, sneakers, demping, looptechniekanalyse, marathon en pronatie LSI-zoekwoorden. Ze signaleren een zoekmachine of AI-zoekmachine dat je pagina het onderwerp echt in de diepte dekt in plaats van één zin te herhalen.
Belangrijke nuance: Google's John Mueller heeft publiekelijk gesteld dat "er niet zoiets bestaat als LSI-zoekwoorden" — Google gebruikt niet de oorspronkelijke Latent Semantic Indexing-wiskunde uit 1988 van Bell Labs (Deerwester et al.). Moderne zoekmachines gebruiken in plaats daarvan BERT, MUM en word embeddings. Maar het onderliggende idee — dat brede, semantisch verwante woordenschat topical relevance signaleert — is precies wat die moderne systemen belonen. Daarom houden we het LSI-label aan voor de herkenbaarheid en behandelen het als afkorting voor "semantische en gerelateerde zoekwoorden". Deze metric maakt deel uit van de Content Quality-pijler in je GEO-Score.
learnLsiKeywords.howSemanticSearchWorks.title
learnLsiKeywords.howSemanticSearchWorks.intro
learnLsiKeywords.howSemanticSearchWorks.steps.embeddings.title
learnLsiKeywords.howSemanticSearchWorks.steps.embeddings.description
learnLsiKeywords.howSemanticSearchWorks.steps.queryMatching.title
learnLsiKeywords.howSemanticSearchWorks.steps.queryMatching.description
learnLsiKeywords.howSemanticSearchWorks.steps.entityGraphs.title
learnLsiKeywords.howSemanticSearchWorks.steps.entityGraphs.description
learnLsiKeywords.semanticChecklist.title
learnLsiKeywords.semanticChecklist.intro
Waarom semantische zoekwoorden tellen voor AI-zoekmachines
AI-zoekmachines als ChatGPT, Perplexity en Google AI Overviews matchen geen letterstrings meer. Ze zetten je tekst om in vector-embeddings en vergelijken die met query-embeddings. Pagina's die een onderwerp van meerdere kanten dekken, eindigen dichtbij veel query-vectoren — en juist dan worden ze geciteerd.
Onderwerpsdiepte verslaat zoekwoordherhaling
Een Ahrefs-studie vond dat de gemiddelde top-rankende pagina ook rankt voor zo'n 1.000 verwante zoekwoorden — niet omdat ze één zin herhaalt, maar omdat ze het onderwerp breed dekt. Pagina's met dunne semantische woordenschat lijken oppervlakkig voor zowel Google als AI-zoekmachines en worden overgeslagen ten gunste van completere bronnen.
Zoekmachines redeneren over entiteiten, niet strings
Sinds Hummingbird (2013) en BERT (2019) redeneert Google over entiteiten — mensen, plaatsen, producten, concepten — en de relaties daartussen. Bill Slawski's patentenonderzoek bij SEO by the Sea liet zien dat Google Knowledge Graph-entiteiten en co-voorkomende termen gebruikt om te verifiëren dat een pagina werkelijk over een onderwerp gaat. Semantische woordenschat is wat die herkenning triggert.
Semantische breedte voedt AI Overview-vermeldingen
Een Ahrefs-analyse van 4M AI Overview-URL's vond dat bredere onderwerpsdekking sterk correleert met de kans op vermelding. Sites met goed ontwikkelde topic clusters en semantisch rijke content zien tot 30% hogere citatieratio's in AI Overviews vergeleken met dunne single-keyword-pagina's.
Wat het onderzoek zegt
The average top-ranking page also ranks in the top 10 for nearly 1,000 other relevant keywords. Pages do not rank for one phrase — they rank for a cloud of semantically-related queries because they cover a topic, not a keyword.
— Ahrefs, How Often Top-Ranking Pages Also Rank for Related Keywords, ranking study (3M+ search queries analyzed)
We analyzed 863,000 keyword SERPs and 4 million AI Overview URLs. Topical authority — measured by the breadth of related keywords a domain ranks for — was the strongest single predictor of AI Overview citations, with a correlation of r = 0.41.
— Ahrefs, AI Overview Citation Patterns Study, 2026 (4M URLs analyzed across 863K SERPs)
There is no such thing as LSI keywords — anyone who is telling you otherwise is mistaken, sorry.
— John Mueller, Google Search Advocate, public statement (2019). The mathematical LSI from Deerwester et al. (1988) is not used by Google. Modern engines use BERT, MUM, and word embeddings — but the practical principle of semantic breadth still applies.
Echte voorbeelden: single-keyword stuffing vs. semantische dekking
De duidelijkste manier om dit te tonen: pak drie real-world pagina's en kijk naar de woordenschat die ze daadwerkelijk gebruiken. Pagina's die één zin opstapelen worden door zowel Google als AI overgeslagen. Pagina's die het hele semantische veld benutten worden geciteerd.
Voorbeeld 1: blogpost over "hardloopschoenen"
"Op zoek naar de beste hardloopschoenen? Onze hardloopschoenen-gids reviewt de top hardloopschoenen van 2026. We testten hardloopschoenen voor wegrunning, trailrunning en beginnende hardloopschoenen-gebruikers. De beste hardloopschoenen zijn de hardloopschoenen die bij je hardlopen passen. Koop vandaag hardloopschoenen."
Waarom dit faalt: "hardloopschoenen" verschijnt 9 keer in 50 woorden (18% dichtheid van één zin). Geen vocabulaire-diepte — geen vermelding van demping, drop, looptechniek, pronatie, trainers, sneakers, marathon of een andere term die een echte expert zou gebruiken. Google's spambeleid noemt expliciet "dezelfde zinnen onnatuurlijk herhalen" als keyword stuffing.
"De juiste hardloopschoen kiezen hangt af van je looptechniek, voetlanding en wekelijkse kilometers. Neutrale lopers met een midfoot-strike kiezen vaak max-cushion trainers als de Hoka Clifton 9 (8mm drop, 32mm stack). Overpronators profiteren van stabiliteits-sneakers met een guide rail of medial post. Trailrunners hebben outsoles met diepe lugs nodig voor grip op technisch terrein, terwijl marathonlopers vaak voor carbon-plate racing shoes kiezen vanwege de afzet."
Waarom dit werkt: "hardloopschoenen" wordt nooit herhaald — maar de pagina gaat onmiskenbaar over hardloopschoenen. Termen als looptechniek, voetlanding, midfoot, drop, stack, overpronator, stabiliteit, medial post, lugged outsole en carbon-plate vertellen BERT en moderne AI-zoekmachines dat dit expert content is. De pagina rankt voor honderden gerelateerde queries.
Voorbeeld 2: productpagina voor een "ergonomische bureaustoel"
"Koop onze ergonomische bureaustoel. Deze ergonomische bureaustoel is de beste ergonomische bureaustoel voor elk kantoor. Onze ergonomische bureaustoel heeft alle features die je nodig hebt in een ergonomische bureaustoel. Bestel je ergonomische bureaustoel nu."
Waarom dit faalt: 36 woorden, 6 herhalingen van "ergonomische bureaustoel" (16% dichtheid). Nul beschrijvende woordenschat. Een AI-assistent gevraagd "welke stoel heeft goede lendensteun voor een lang persoon?" kan hier niets uit extraheren, omdat de pagina geen lendensteun, lengte, ondersteuning of feature noemt.
"Onze taakstoel combineert verstelbare lendensteun met 4D-armleuningen, een ademende mesh-rugleuning en een synchro-tilt-mechanisme dat je rug volgt bij een verstelling van 90 tot 135 graden. De zitdiepte schuift 70mm voor gebruikers tussen 1,57m en 1,96m. Een class-4 hydrauliekcilinder ondersteunt tot 136 kg en voldoet aan BIFMA-duurzaamheidsstandaarden."
Waarom dit werkt: één natuurlijke vermelding van "taakstoel" plus rijke woordenschat — lendensteun, 4D-armleuningen, mesh-rug, synchro-tilt, recline, zitdiepte, hydrauliekcilinder, BIFMA. De pagina beantwoordt nu tientallen gerelateerde vragen en verschijnt voor long-tail queries als "stoel met verstelbare zitdiepte voor lange gebruikers".
Voorbeeld 3: B2B SaaS-pagina over "data observability"
"Data observability is cruciaal voor data observability. Ons data observability-platform levert data observability over je data observability-stack. Krijg vandaag data observability met onze data observability-tools voor moderne data observability-behoeften."
Waarom dit faalt: "Data observability" is een echte B2B-term, maar 8 keer herhalen in 35 woorden is spam. De pagina mist ook de semantische buurt: een CTO die dit onderwerp onderzoekt, gebruikt woorden als data quality, lineage, freshness, anomaly detection, schema drift, SLA, dbt, Snowflake, Monte Carlo, OpenLineage. Geen daarvan komt voor, dus de pagina wordt nooit door ChatGPT geciteerd voor technische queries.
"Data observability geeft data-teams end-to-end zicht op pipeline-gezondheid: freshness, volume, schema drift, lineage en distribution anomalies. Anders dan traditionele monitoring dekt observability de vijf pillars uit Monte Carlo's framework — en integreert native met dbt, Snowflake, BigQuery en Airflow via OpenLineage. Veelvoorkomende alerts zijn null spikes, late-arriving data en onverwachte schema changes upstream."
Waarom dit werkt: één canonieke vermelding van "data observability" plus het volledige entiteitsveld — freshness, volume, schema drift, lineage, anomalies, Monte Carlo, dbt, Snowflake, OpenLineage, Airflow. ChatGPT citeert deze pagina nu met vertrouwen bij vragen over data quality, pipeline monitoring of schema-drift-detectie.
Hoe dek je een onderwerp semantisch
Doe dit NIET
- ✗Herhaal je exacte target-zin niet vaker dan eens per 200-300 woorden — Google's spambeleid noemt dit keyword stuffing en moderne AI-zoekmachines slaan het simpelweg over
- ✗Gebruik niet alleen de exacte target-zin en negeer geen voor de hand liggende synoniemen (bijv. "sneakers" naast "trainers", "laptop" naast "notebook") — zoekmachines bestraffen woordenschat die onnatuurlijk smal lijkt
- ✗Forceer geen elke term die een "LSI keyword tool" voorstelt erin, ook als hij niet past — zoekmachines detecteren ongemakkelijke, onnatuurlijke co-voorkomenspatronen
- ✗Sla de benoemde entiteiten van je onderwerp niet over — producten, merken, frameworks, standaarden, mensen, plaatsen. Zonder hen kan BERT je pagina niet aan de Knowledge Graph koppelen
- ✗Vul pagina's niet op met dunne synoniemenvulling in plaats van substantiële dekking — brede woordenschat zonder echte informatie verliest nog steeds van een diepere, dichtere concurrent
Doe dit in plaats daarvan
- ✓Schrijf alsof je het onderwerp uitlegt aan een expert in het veld — die gebruikt vanzelf de volledige semantische woordenschat (jargon, eenheden, standaarden, merknamen) zonder erover na te denken
- ✓Open de top 10 rankende pagina's voor je doelquery en lijst elke terugkerende term op — dat onthult de echte semantische buurt van het onderwerp (de SEO-methode achter tools als Surfer, Clearscope en Frase)
- ✓Neem de benoemde entiteiten op — producten, organisaties, standaarden, mensen, geografische plaatsen — zodat Google je pagina aan zijn Knowledge Graph kan verbinden
- ✓Gebruik synoniemen, afkortingen en meervouden natuurlijk ("hardloopschoenen" / "trainers" / "sneakers"; "AI" / "kunstmatige intelligentie") — Backlinko-onderzoek toont dat Google deze als dezelfde intentie behandelt
- ✓Bouw een topic cluster: één pillar-pagina die het onderwerp breed dekt, plus 5-15 ondersteunende pagina's over subtopics. HubSpot-data toont dat topic-cluster-sites gemiddeld 43% meer organisch verkeer halen en significant hogere AI-citatieratio's
Snelle tips voor semantische dekking
- •Spendeer 15 minuten aan de top 10 SERP-resultaten lezen voor je schrijft — noteer elk terugkerend zelfstandig naamwoord en werkwoord. Die lijst is je semantische checklist.
- •Gebruik je exacte target-zin niet meer dan 1-2x per 300 woorden. Schakel daarna over naar synoniemen, gerelateerde termen of voornaamwoorden.
- •Noem per artikel minstens 3 specifieke entiteiten — een product, een bedrijf, een standaard, een persoon, een plaats. Entiteiten voeden de Knowledge Graph.
- •Gebruik Surfer, Clearscope, Frase of zelfs Google's "People also ask" en "Verwante zoekopdrachten" om semantische termen te vinden — maar negeer wat niet natuurlijk past.
- •Groepeer gerelateerde artikelen in clusters met interne links. HubSpot vond dat topic-cluster-sites organisch verkeer ~3,2x sneller laten groeien.
- •Lees elke paragraaf hardop. Klinkt het alsof een menselijke expert het schreef, dan zit de semantische woordenschat er waarschijnlijk al. Klinkt het robotachtig, dan ben je aan het stuffen.
Veelgestelde vragen
Gebruikt Google daadwerkelijk LSI-zoekwoorden?
Wat is het verschil tussen LSI-zoekwoorden, semantische zoekwoorden en gerelateerde zoekwoorden?
Hoe vind ik semantische zoekwoorden voor mijn onderwerp?
En keyword density — geldt de oude 1-3%-regel nog?
Helpt meer semantische zoekwoorden toevoegen me geciteerd te worden door ChatGPT en Perplexity?
Kan ik niet gewoon een AI-writer gebruiken om semantische content te genereren?
Gerelateerde metrics om te verkennen
- Volledigheid
Semantische zoekwoorden zijn de woordenschat; volledigheid is de diepte van de dekking. Samen signaleren ze dat je pagina het onderwerp werkelijk dekt.
- Topical authority
Ahrefs vond dat topical authority (breedte van gerelateerde keyword-rankings) de sterkste voorspeller is van AI Overview-vermeldingen. Bouw die op met topic clusters.
- Semantische helderheid
Ook met rijke woordenschat moeten zinnen ondubbelzinnig zijn. Semantische helderheid zorgt dat BERT en AI-zoekmachines de betekenis correct uit je tekst halen.
- Knowledge Graph
Benoemde entiteiten (producten, merken, mensen, plaatsen) verbinden je pagina met Google's Knowledge Graph — de gestructureerde ruggengraat achter zowel AI Overviews als ChatGPT.