Terug naar leerhub

LSI-zoekwoorden

Dek het hele onderwerp, niet alleen één zin, zodat AI-zoekmachines je begrijpen en citeren

Laatst bijgewerkt: 20 mei 2026

Wat zijn LSI-zoekwoorden?

LSI-zoekwoorden — kort voor Latent Semantic Indexing — is de SEO-term voor woorden en zinnen die semantisch verwant zijn aan je hoofdonderwerp. Gaat je pagina over "hardloopschoenen", dan zijn termen als trainers, sneakers, demping, looptechniekanalyse, marathon en pronatie LSI-zoekwoorden. Ze signaleren een zoekmachine of AI-zoekmachine dat je pagina het onderwerp echt in de diepte dekt in plaats van één zin te herhalen.

Belangrijke nuance: Google's John Mueller heeft publiekelijk gesteld dat "er niet zoiets bestaat als LSI-zoekwoorden" — Google gebruikt niet de oorspronkelijke Latent Semantic Indexing-wiskunde uit 1988 van Bell Labs (Deerwester et al.). Moderne zoekmachines gebruiken in plaats daarvan BERT, MUM en word embeddings. Maar het onderliggende idee — dat brede, semantisch verwante woordenschat topical relevance signaleert — is precies wat die moderne systemen belonen. Daarom houden we het LSI-label aan voor de herkenbaarheid en behandelen het als afkorting voor "semantische en gerelateerde zoekwoorden". Deze metric maakt deel uit van de Content Quality-pijler in je GEO-Score.

learnLsiKeywords.howSemanticSearchWorks.title

learnLsiKeywords.howSemanticSearchWorks.intro

learnLsiKeywords.howSemanticSearchWorks.steps.embeddings.title

learnLsiKeywords.howSemanticSearchWorks.steps.embeddings.description

learnLsiKeywords.howSemanticSearchWorks.steps.queryMatching.title

learnLsiKeywords.howSemanticSearchWorks.steps.queryMatching.description

learnLsiKeywords.howSemanticSearchWorks.steps.entityGraphs.title

learnLsiKeywords.howSemanticSearchWorks.steps.entityGraphs.description

learnLsiKeywords.semanticChecklist.title

learnLsiKeywords.semanticChecklist.intro

Waarom semantische zoekwoorden tellen voor AI-zoekmachines

AI-zoekmachines als ChatGPT, Perplexity en Google AI Overviews matchen geen letterstrings meer. Ze zetten je tekst om in vector-embeddings en vergelijken die met query-embeddings. Pagina's die een onderwerp van meerdere kanten dekken, eindigen dichtbij veel query-vectoren — en juist dan worden ze geciteerd.

Onderwerpsdiepte verslaat zoekwoordherhaling

Een Ahrefs-studie vond dat de gemiddelde top-rankende pagina ook rankt voor zo'n 1.000 verwante zoekwoorden — niet omdat ze één zin herhaalt, maar omdat ze het onderwerp breed dekt. Pagina's met dunne semantische woordenschat lijken oppervlakkig voor zowel Google als AI-zoekmachines en worden overgeslagen ten gunste van completere bronnen.

Zoekmachines redeneren over entiteiten, niet strings

Sinds Hummingbird (2013) en BERT (2019) redeneert Google over entiteiten — mensen, plaatsen, producten, concepten — en de relaties daartussen. Bill Slawski's patentenonderzoek bij SEO by the Sea liet zien dat Google Knowledge Graph-entiteiten en co-voorkomende termen gebruikt om te verifiëren dat een pagina werkelijk over een onderwerp gaat. Semantische woordenschat is wat die herkenning triggert.

Semantische breedte voedt AI Overview-vermeldingen

Een Ahrefs-analyse van 4M AI Overview-URL's vond dat bredere onderwerpsdekking sterk correleert met de kans op vermelding. Sites met goed ontwikkelde topic clusters en semantisch rijke content zien tot 30% hogere citatieratio's in AI Overviews vergeleken met dunne single-keyword-pagina's.

Wat het onderzoek zegt

The average top-ranking page also ranks in the top 10 for nearly 1,000 other relevant keywords. Pages do not rank for one phrase — they rank for a cloud of semantically-related queries because they cover a topic, not a keyword.

— Ahrefs, How Often Top-Ranking Pages Also Rank for Related Keywords, ranking study (3M+ search queries analyzed)

We analyzed 863,000 keyword SERPs and 4 million AI Overview URLs. Topical authority — measured by the breadth of related keywords a domain ranks for — was the strongest single predictor of AI Overview citations, with a correlation of r = 0.41.

— Ahrefs, AI Overview Citation Patterns Study, 2026 (4M URLs analyzed across 863K SERPs)

There is no such thing as LSI keywords — anyone who is telling you otherwise is mistaken, sorry.

— John Mueller, Google Search Advocate, public statement (2019). The mathematical LSI from Deerwester et al. (1988) is not used by Google. Modern engines use BERT, MUM, and word embeddings — but the practical principle of semantic breadth still applies.

Echte voorbeelden: single-keyword stuffing vs. semantische dekking

De duidelijkste manier om dit te tonen: pak drie real-world pagina's en kijk naar de woordenschat die ze daadwerkelijk gebruiken. Pagina's die één zin opstapelen worden door zowel Google als AI overgeslagen. Pagina's die het hele semantische veld benutten worden geciteerd.

Voorbeeld 1: blogpost over "hardloopschoenen"

Slecht — single-keyword stuffing

"Op zoek naar de beste hardloopschoenen? Onze hardloopschoenen-gids reviewt de top hardloopschoenen van 2026. We testten hardloopschoenen voor wegrunning, trailrunning en beginnende hardloopschoenen-gebruikers. De beste hardloopschoenen zijn de hardloopschoenen die bij je hardlopen passen. Koop vandaag hardloopschoenen."

Waarom dit faalt: "hardloopschoenen" verschijnt 9 keer in 50 woorden (18% dichtheid van één zin). Geen vocabulaire-diepte — geen vermelding van demping, drop, looptechniek, pronatie, trainers, sneakers, marathon of een andere term die een echte expert zou gebruiken. Google's spambeleid noemt expliciet "dezelfde zinnen onnatuurlijk herhalen" als keyword stuffing.

Goed — volledig semantisch veld

"De juiste hardloopschoen kiezen hangt af van je looptechniek, voetlanding en wekelijkse kilometers. Neutrale lopers met een midfoot-strike kiezen vaak max-cushion trainers als de Hoka Clifton 9 (8mm drop, 32mm stack). Overpronators profiteren van stabiliteits-sneakers met een guide rail of medial post. Trailrunners hebben outsoles met diepe lugs nodig voor grip op technisch terrein, terwijl marathonlopers vaak voor carbon-plate racing shoes kiezen vanwege de afzet."

Waarom dit werkt: "hardloopschoenen" wordt nooit herhaald — maar de pagina gaat onmiskenbaar over hardloopschoenen. Termen als looptechniek, voetlanding, midfoot, drop, stack, overpronator, stabiliteit, medial post, lugged outsole en carbon-plate vertellen BERT en moderne AI-zoekmachines dat dit expert content is. De pagina rankt voor honderden gerelateerde queries.

Voorbeeld 2: productpagina voor een "ergonomische bureaustoel"

Slecht — copy met alleen het keyword

"Koop onze ergonomische bureaustoel. Deze ergonomische bureaustoel is de beste ergonomische bureaustoel voor elk kantoor. Onze ergonomische bureaustoel heeft alle features die je nodig hebt in een ergonomische bureaustoel. Bestel je ergonomische bureaustoel nu."

Waarom dit faalt: 36 woorden, 6 herhalingen van "ergonomische bureaustoel" (16% dichtheid). Nul beschrijvende woordenschat. Een AI-assistent gevraagd "welke stoel heeft goede lendensteun voor een lang persoon?" kan hier niets uit extraheren, omdat de pagina geen lendensteun, lengte, ondersteuning of feature noemt.

Goed — beschrijvend semantisch veld

"Onze taakstoel combineert verstelbare lendensteun met 4D-armleuningen, een ademende mesh-rugleuning en een synchro-tilt-mechanisme dat je rug volgt bij een verstelling van 90 tot 135 graden. De zitdiepte schuift 70mm voor gebruikers tussen 1,57m en 1,96m. Een class-4 hydrauliekcilinder ondersteunt tot 136 kg en voldoet aan BIFMA-duurzaamheidsstandaarden."

Waarom dit werkt: één natuurlijke vermelding van "taakstoel" plus rijke woordenschat — lendensteun, 4D-armleuningen, mesh-rug, synchro-tilt, recline, zitdiepte, hydrauliekcilinder, BIFMA. De pagina beantwoordt nu tientallen gerelateerde vragen en verschijnt voor long-tail queries als "stoel met verstelbare zitdiepte voor lange gebruikers".

Voorbeeld 3: B2B SaaS-pagina over "data observability"

Slecht — alleen jargon en synoniemen-blind

"Data observability is cruciaal voor data observability. Ons data observability-platform levert data observability over je data observability-stack. Krijg vandaag data observability met onze data observability-tools voor moderne data observability-behoeften."

Waarom dit faalt: "Data observability" is een echte B2B-term, maar 8 keer herhalen in 35 woorden is spam. De pagina mist ook de semantische buurt: een CTO die dit onderwerp onderzoekt, gebruikt woorden als data quality, lineage, freshness, anomaly detection, schema drift, SLA, dbt, Snowflake, Monte Carlo, OpenLineage. Geen daarvan komt voor, dus de pagina wordt nooit door ChatGPT geciteerd voor technische queries.

Goed — dekt de entiteits-buurt

"Data observability geeft data-teams end-to-end zicht op pipeline-gezondheid: freshness, volume, schema drift, lineage en distribution anomalies. Anders dan traditionele monitoring dekt observability de vijf pillars uit Monte Carlo's framework — en integreert native met dbt, Snowflake, BigQuery en Airflow via OpenLineage. Veelvoorkomende alerts zijn null spikes, late-arriving data en onverwachte schema changes upstream."

Waarom dit werkt: één canonieke vermelding van "data observability" plus het volledige entiteitsveld — freshness, volume, schema drift, lineage, anomalies, Monte Carlo, dbt, Snowflake, OpenLineage, Airflow. ChatGPT citeert deze pagina nu met vertrouwen bij vragen over data quality, pipeline monitoring of schema-drift-detectie.

Hoe dek je een onderwerp semantisch

Doe dit NIET

  • Herhaal je exacte target-zin niet vaker dan eens per 200-300 woorden — Google's spambeleid noemt dit keyword stuffing en moderne AI-zoekmachines slaan het simpelweg over
  • Gebruik niet alleen de exacte target-zin en negeer geen voor de hand liggende synoniemen (bijv. "sneakers" naast "trainers", "laptop" naast "notebook") — zoekmachines bestraffen woordenschat die onnatuurlijk smal lijkt
  • Forceer geen elke term die een "LSI keyword tool" voorstelt erin, ook als hij niet past — zoekmachines detecteren ongemakkelijke, onnatuurlijke co-voorkomenspatronen
  • Sla de benoemde entiteiten van je onderwerp niet over — producten, merken, frameworks, standaarden, mensen, plaatsen. Zonder hen kan BERT je pagina niet aan de Knowledge Graph koppelen
  • Vul pagina's niet op met dunne synoniemenvulling in plaats van substantiële dekking — brede woordenschat zonder echte informatie verliest nog steeds van een diepere, dichtere concurrent

Doe dit in plaats daarvan

  • Schrijf alsof je het onderwerp uitlegt aan een expert in het veld — die gebruikt vanzelf de volledige semantische woordenschat (jargon, eenheden, standaarden, merknamen) zonder erover na te denken
  • Open de top 10 rankende pagina's voor je doelquery en lijst elke terugkerende term op — dat onthult de echte semantische buurt van het onderwerp (de SEO-methode achter tools als Surfer, Clearscope en Frase)
  • Neem de benoemde entiteiten op — producten, organisaties, standaarden, mensen, geografische plaatsen — zodat Google je pagina aan zijn Knowledge Graph kan verbinden
  • Gebruik synoniemen, afkortingen en meervouden natuurlijk ("hardloopschoenen" / "trainers" / "sneakers"; "AI" / "kunstmatige intelligentie") — Backlinko-onderzoek toont dat Google deze als dezelfde intentie behandelt
  • Bouw een topic cluster: één pillar-pagina die het onderwerp breed dekt, plus 5-15 ondersteunende pagina's over subtopics. HubSpot-data toont dat topic-cluster-sites gemiddeld 43% meer organisch verkeer halen en significant hogere AI-citatieratio's

Snelle tips voor semantische dekking

  • Spendeer 15 minuten aan de top 10 SERP-resultaten lezen voor je schrijft — noteer elk terugkerend zelfstandig naamwoord en werkwoord. Die lijst is je semantische checklist.
  • Gebruik je exacte target-zin niet meer dan 1-2x per 300 woorden. Schakel daarna over naar synoniemen, gerelateerde termen of voornaamwoorden.
  • Noem per artikel minstens 3 specifieke entiteiten — een product, een bedrijf, een standaard, een persoon, een plaats. Entiteiten voeden de Knowledge Graph.
  • Gebruik Surfer, Clearscope, Frase of zelfs Google's "People also ask" en "Verwante zoekopdrachten" om semantische termen te vinden — maar negeer wat niet natuurlijk past.
  • Groepeer gerelateerde artikelen in clusters met interne links. HubSpot vond dat topic-cluster-sites organisch verkeer ~3,2x sneller laten groeien.
  • Lees elke paragraaf hardop. Klinkt het alsof een menselijke expert het schreef, dan zit de semantische woordenschat er waarschijnlijk al. Klinkt het robotachtig, dan ben je aan het stuffen.

Veelgestelde vragen

Gebruikt Google daadwerkelijk LSI-zoekwoorden?
Strikt genomen niet. Google's John Mueller stelde in 2019 publiekelijk dat "er niet zoiets bestaat als LSI-zoekwoorden". De oorspronkelijke Latent Semantic Indexing-wiskunde uit 1988 (Deerwester, Dumais, Furnas et al. bij Bell Labs) wordt niet gebruikt in Google's ranking-algoritme. Maar Google gebruikt wel semantisch begrip via systemen als BERT, MUM en word embeddings — en die belonen hetzelfde gedrag dat LSI-tools aanraden: een onderwerp dekken met brede, gerelateerde woordenschat in plaats van één zin te herhalen. De term LSI is technisch onjuist, maar de praktijk van semantische zoekwoord-dekking is heel reëel en heel waardevol.
Wat is het verschil tussen LSI-zoekwoorden, semantische zoekwoorden en gerelateerde zoekwoorden?
In de praktijk beschrijven alle drie de termen vandaag hetzelfde: woorden en zinnen die topisch verwant zijn aan je hoofdwoord. "LSI-zoekwoorden" is de oudere term, geërfd van een Bell Labs-algoritme uit 1988. "Semantische zoekwoorden" is de accuratere moderne term — zoekmachines als Google redeneren over betekenis (semantiek) via BERT en embeddings. "Gerelateerde zoekwoorden" is de meest losse term en verwijst vaak naar suggesties uit keyword-tools. We gebruiken ze door elkaar en raden aan te focussen op het onderliggende gedrag: het onderwerp breed dekken.
Hoe vind ik semantische zoekwoorden voor mijn onderwerp?
Vijf gratis methoden werken goed: (1) Google's "People also ask" en "Verwante zoekopdrachten" onderaan elke SERP. (2) Google autocomplete — begin je keyword te typen en noteer de suggesties. (3) Lees de top 5 rankende pagina's en lijst elke terugkerende term op. (4) Bekijk het Wikipedia-artikel over het onderwerp — dat noemt de canonieke entiteiten en concepten. (5) Gebruik AI-assistenten — vraag ChatGPT "wat zijn de gerelateerde concepten en entiteiten voor [je onderwerp]?". Betaalde tools als Surfer SEO, Clearscope en Frase doen dit automatisch door SERPs te scrapen en NLP op de resultaten te draaien.
En keyword density — geldt de oude 1-3%-regel nog?
Keyword density als enkel getal is grotendeels achterhaald. Er is geen magisch percentage. Wat telt is dat je exacte target-zin natuurlijk verschijnt (doorgaans 1-2 keer per 300 woorden) en dat de omliggende tekst semantisch rijk is. Google's spamrichtlijnen noemen geen percentage — ze beschrijven het symptoom: "dezelfde woorden of zinnen zo vaak herhalen dat het onnatuurlijk klinkt". Leest je tekst natuurlijk voor een menselijke expert, dan is de density prima. Klinkt hij als een robot, dan ben je aan het stuffen — zelfs bij 2%.
Helpt meer semantische zoekwoorden toevoegen me geciteerd te worden door ChatGPT en Perplexity?
Indirect ja — maar niet omdat de AI ze "telt". ChatGPT en Perplexity gebruiken embeddings om content te vinden die semantisch matcht met een query. Een pagina die een onderwerp breed dekt, mapt op veel query-vectoren, dus verschijnt voor meer queries. Een Ahrefs-analyse van 4M AI Overview-URL's vond dat topical authority (breedte van gerelateerde zoekwoorden) de sterkste voorspeller was van AI Overview-vermeldingen (r = 0,41). Vertaling: dek het onderwerp diep, noem de entiteiten, en de vermeldingen volgen.
Kan ik niet gewoon een AI-writer gebruiken om semantische content te genereren?
AI-writers kunnen helpen semantisch rijke tekst op te stellen — ze zijn getraind op enorme corpora en gebruiken vanzelf gerelateerde woordenschat. Maar drie kanttekeningen: (1) AI-drafts missen vaak recente benoemde entiteiten (nieuwe producten, standaarden uit 2025-2026, actuele personen) — die moet je handmatig toevoegen. (2) AI levert vaak generieke synoniemen in plaats van expert-jargon — review met een vakinhoudelijke expert. (3) Google's spambeleid bevat "scaled content abuse" — pure ongeredigeerde AI-output op schaal wordt bestraft. Gebruik AI als eerste draft en voeg vervolgens echte entiteiten, actuele data en menselijke expertise toe.

Gerelateerde metrics om te verkennen

  • Volledigheid

    Semantische zoekwoorden zijn de woordenschat; volledigheid is de diepte van de dekking. Samen signaleren ze dat je pagina het onderwerp werkelijk dekt.

  • Topical authority

    Ahrefs vond dat topical authority (breedte van gerelateerde keyword-rankings) de sterkste voorspeller is van AI Overview-vermeldingen. Bouw die op met topic clusters.

  • Semantische helderheid

    Ook met rijke woordenschat moeten zinnen ondubbelzinnig zijn. Semantische helderheid zorgt dat BERT en AI-zoekmachines de betekenis correct uit je tekst halen.

  • Knowledge Graph

    Benoemde entiteiten (producten, merken, mensen, plaatsen) verbinden je pagina met Google's Knowledge Graph — de gestructureerde ruggengraat achter zowel AI Overviews als ChatGPT.

Wijzigingen gedaan? Check je score.

Semantische zoekwoorden en benoemde entiteiten toevoegen verandert hoe AI-zoekmachines je pagina zien — snel. Doe na elke herschrijfronde een gratis GEO-Score Check om te zien hoe je topical coverage en citatiepotentieel zijn verbeterd.

Analyseer je pagina gratis
Semantische & LSI-zoekwoorden: hoe je een onderwerp dekt zodat AI je citeert