Mitä ovat LSI-avainsanat?
LSI-avainsanat — lyhennys sanasta Latent Semantic Indexing — on SEO-termi sanoille ja lauseille, jotka liittyvät semanttisesti pääaiheeseesi. Jos sivusi on "juoksukengistä", termit kuten lenkkitossut, kengät, vaimennus, askelanalyysi, maraton ja pronaatio ovat LSI-avainsanoja. Ne viestivät hakukoneelle tai tekoälyhakukoneelle, että sivusi kattaa aiheen todellisella syvyydellä yhden lauseen toistamisen sijaan.
Tärkeä vivahde: Googlen John Mueller on julkisesti todennut, että "LSI-avainsanoja ei ole olemassa" — Google ei käytä alkuperäistä vuoden 1988 Latent Semantic Indexing -matematiikkaa Bell Labsista (Deerwester et al.). Modernit hakukoneet käyttävät BERTiä, MUMia ja sanan upotuksia sen sijaan. Mutta perimmäinen idea — että laaja, semanttisesti liittyvä sanasto viestii aiheen relevanssista — on juuri sitä, mitä nuo modernit järjestelmät palkitsevat. Joten pidämme LSI-leiman tutuksi ja käsittelemme sitä lyhenteenä "semanttisille ja liittyville avainsanoille." Tämä mittari on osa Content Quality -pilaria GEO-Scoressasi.
Miksi semanttiset avainsanat ovat tärkeitä tekoälyhaussa
Tekoälyhakukoneet kuten ChatGPT, Perplexity ja Googlen AI Overviews eivät enää täsmää kirjainmerkkijonoja. Ne muuntavat tekstisi vektoriupotuksiksi ja vertaavat niitä kyselyupotuksiin. Sivut, jotka kattavat aiheen useista näkökulmista, päätyvät lähelle monia kyselyvektoreita — joka on juuri silloin, kun ne siteerataan.
Aiheellinen syvyys voittaa avainsanan toiston
Ahrefs-tutkimus havaitsi, että keskimääräinen top-sijoittunut sivu sijoittuu myös noin 1 000 liittyvälle avainsanalle — ei siksi, että se toistaa yhtä lausetta, vaan koska se kattaa aiheen laajasti. Sivut, jotka ovat ohuita semanttisesta sanastosta, näyttävät matalilta sekä Googlelle että tekoälyhakukoneille ja ohitetaan kattavampien lähteiden eduksi.
Hakukoneet pohtivat entiteettejä, eivät merkkijonoja
Hummingbirdistä (2013) ja BERTistä (2019) lähtien Google pohtii entiteettejä — ihmisiä, paikkoja, tuotteita, käsitteitä — ja niiden välisiä suhteita. Bill Slawskin patenttitutkimus SEO by the Seassa osoitti, että Google käyttää Knowledge Graph -entiteettejä ja yhteisesiintymistermejä todentaakseen, että sivu on aidosti aiheesta. Semanttinen sanasto on se, mikä laukaisee tuon tunnistuksen.
Semanttinen laajuus polttaa AI Overview -sitaatteja
Ahrefsin analyysi 4 miljoonasta AI Overview -URL-osoitteesta havaitsi, että laajempi aiheellinen kattavuus korreloi vahvasti sitaattitodennäköisyyden kanssa. Sivustot, joilla on hyvin kehittyneitä aiheklustereita ja semanttisesti rikkaa sisältöä, näkevät jopa 30 % korkeammat sitaattiluvut AI Overviewsissä verrattuna ohuiin yhden avainsanan sivuihin.
Mitä tutkimus sanoo
There is no such thing as LSI keywords — anyone who is telling you otherwise is mistaken, sorry.
— John Mueller, Google Search Advocate, public statement (2019). The mathematical LSI from Deerwester et al. (1988) is not used by Google. Modern engines use BERT, MUM, and word embeddings — but the practical principle of semantic breadth still applies.
The average top-ranking page also ranks in the top 10 for nearly 1,000 other relevant keywords. Pages do not rank for one phrase — they rank for a cloud of semantically-related queries because they cover a topic, not a keyword.
— Ahrefs, How Often Top-Ranking Pages Also Rank for Related Keywords, ranking study (3M+ search queries analyzed)
We analyzed 863,000 keyword SERPs and 4 million AI Overview URLs. Topical authority — measured by the breadth of related keywords a domain ranks for — was the strongest single predictor of AI Overview citations, with a correlation of r = 0.41.
— Ahrefs, AI Overview Citation Patterns Study, 2026 (4M URLs analyzed across 863K SERPs)
Todellisia esimerkkejä: yhden avainsanan täyttäminen vs. semanttinen kattavuus
Selkein tapa näyttää tämä: ota kolme todellista sivua ja katso sanastoa, jota ne todella käyttävät. Sivut, jotka kasaavat yhden lauseen, ohitetaan sekä Googlen että tekoälyhakukoneiden toimesta. Sivut, jotka käyttävät koko semanttista kenttää, siteerataan.
Esimerkki 1: Blogiteksti "juoksukengistä"
"Etsitkö parhaita juoksukenkiä? Juoksukenkäoppaamme arvioi vuoden 2026 parhaat juoksukengät. Testasimme juoksukenkiä tiejuoksuun, polkujuoksuun ja aloittelevalle juoksulle. Parhaat juoksukengät ovat ne juoksukengät, jotka sopivat juoksutyyliisi. Osta juoksukengät tänään."
Miksi tämä epäonnistuu: "juoksukengät" esiintyy 9 kertaa 50 sanassa (18 %:n tiheys yhdelle lauseelle). Ei sanaston syvyyttä — ei mainintaa vaimennuksesta, dropista, askeleesta, pronaatiosta, lenkkitossuista, kenkien tyypeistä, maratonista tai mistään muusta termistä, jota oikea asiantuntija käyttäisi. Googlen spämmikäytäntö listaa nimenomaisesti "samojen lauseiden epäluonnollisen toistamisen" avainsanan täyttämiseksi.
"Oikean juoksukengän valinta riippuu askeleestasi, jalan iskukohdasta ja viikoittaisesta kilometrimäärästä. Neutraalit juoksijat keskijalkaiskulla valitsevat usein maksimaalivaimennuksen lenkkikengät kuten Hoka Clifton 9 (8 mm drop, 32 mm pino). Yliponaatiosta hyötyvät vakautuskengät ohjauskiskolla tai medialisella tuella. Polkujuoksijat tarvitsevat nappuloituja ulkopohjia teknisellä maastolla, kun taas maratonjuoksijat valitsevat usein hiilikuitulevyiset kilpailukengät työntöä varten."
Miksi tämä toimii: "juoksukengät" ei koskaan toistu — mutta sivu on selvästi juoksukengistä. Termit kuten askel, jalan iskukohta, keskijalka, drop, pino, ylipronaatio, vakaus, mediaalinen tuki, nappuloitu ulkopohja ja hiilikuitulevyinen kertovat BERTille ja moderneille tekoälyhakukoneille, että tämä on asiantuntijasisältöä. Se sijoittuu satoihin liittyviin kyselyihin.
Esimerkki 2: Tuotesivu "ergonomiselle toimistotuolille"
"Osta ergonominen toimistotuolimme. Tämä ergonominen toimistotuoli on paras ergonominen toimistotuoli mihin tahansa toimistoon. Ergonomisessa toimistotuolissamme on kaikki ominaisuudet, joita tarvitset ergonomisessa toimistotuolissa. Tilaa ergonominen toimistotuolisi nyt."
Miksi tämä epäonnistuu: 36 sanaa, 6 toistoa lauseesta "ergonominen toimistotuoli" (16 % tiheys). Nolla kuvailevaa sanastoa. Tekoälyavustaja, joka kysytään "missä tuolissa on hyvä lannetuki pitkälle henkilölle?", ei voi poimia mitään tältä sivulta, koska sivu ei koskaan mainitse lannetukea, korkeutta, tukea tai mitään ominaisuutta.
"Työtuolimme yhdistää säädettävän lannetuen 4D-käsinojaan, hengittävään verkkoselkä-osaan ja synchro-tilt-mekanismiin, joka seuraa selkärankaa kallistuksissa 90:stä 135 asteeseen. Istuinsyvyys liukuu 70 mm käyttäjille 158–195 cm. Luokan 4 hydraulinen sylinteri tukee 136 kiloon asti ja täyttää BIFMA-kestävyysstandardit."
Miksi tämä toimii: Yksi luonnollinen maininta "työtuoli" plus rikas sanasto — lannetuki, 4D-käsinoja, verkkoselkä, synchro-tilt, kallistus, istuinsyvyys, hydraulinen sylinteri, BIFMA. Sivu vastaa nyt kymmeniin liittyviin kysymyksiin ja näkyy pitkän hännän kyselyissä kuten "tuoli säädettävällä istuinsyvyydellä pitkille käyttäjille."
Esimerkki 3: B2B SaaS -sivu "data observabilitysta"
"Data observability on kriittinen data observabilitylle. Data observability -alustamme tarjoaa data observabilitya koko data observability -pinossasi. Hanki data observability tänään data observability -työkaluillamme, jotka on suunniteltu modernin data observability -tarpeiden mukaan."
Miksi tämä epäonnistuu: "Data observability" on todellinen B2B-termi, mutta sen toistaminen 8 kertaa 35 sanassa on spämmiä. Sivu jättää myös semanttisen naapuruston huomiotta: CTO, joka tutkii tätä aihetta, käyttää sanoja kuten data laatu, lineage, freshness, anomalia havainnointi, schema drift, SLA, dbt, Snowflake, Monte Carlo, OpenLineage. Mitään näistä ei esiinny, joten ChatGPT ei koskaan siteeraa sivua teknisille kyselyille.
"Data observability antaa datatiimeille päästä päähän -näkyvyyden putken terveyteen: tuoreuteen, volyymiin, schema driftiin, lineageen ja jakauma-anomalioihin. Toisin kuin perinteinen valvonta, observability kattaa Monte Carlon viitekehyksen viisi pilaria — ja integroituu natiivisti dbt:hen, Snowflakeen, BigQueryyn ja Airflowiin OpenLineagen kautta. Yleisiä hälytyksiä ovat null-piikit, myöhässä saapuva data ja odottamattomat schema-muutokset upstreamissä."
Miksi tämä toimii: Yksi kanoninen maininta "data observabilitysta" plus koko entiteettikenttä — tuoreus, volyymi, schema drift, lineage, anomaliat, Monte Carlo, dbt, Snowflake, OpenLineage, Airflow. ChatGPT siteeraa nyt luottavaisesti tätä sivua, kun kysytään datan laadusta, putken valvonnasta tai schema drift -havainnoinnista.
Kuinka kattaa aihe semanttisesti
ÄLÄ tee näin
- ✗Toista tarkkaa kohdelausettasi useammin kuin kerran 200–300 sanassa — Googlen spämmikäytäntö listaa tämän avainsanan täyttämiseksi ja modernit tekoälyhakukoneet yksinkertaisesti ohittavat sen
- ✗Käytä vain tarkkaa kohdelausetta ja sivuuta ilmeiset synonyymit (esim. "lenkkitossut" rinnalla "juoksukengät", "läppäri" rinnalla "kannettava") — hakukoneet rankaisevat sanastoa, joka näyttää epäluonnollisen kapealta
- ✗Pakota mukaan jokainen termi, jota "LSI-avainsanatyökalu" ehdottaa, vaikka se ei sopisi — hakukoneet havaitsevat kömpelöt, epäluonnolliset yhteisesiintymiskuviot
- ✗Ohita aiheen nimetyt entiteetit — tuotteet, brändit, viitekehykset, standardit, ihmiset, paikat. Ilman niitä BERT ei voi mapata sivuasi Knowledge Graphille
- ✗Täytä sivuja ohuilla täytesynonyymeillä sisällöllisen kattavuuden sijaan — laaja sanasto ilman todellista tietoa häviää silti syvemmälle, tiheämmälle kilpailijalle
Tee näin sen sijaan
- ✓Kirjoita ikään kuin selittäisit aihetta alan asiantuntijalle — he käyttävät luonnollisesti koko semanttista sanastoa (ammattikieli, yksiköt, standardit, brändien nimet) ajattelematta sitä
- ✓Avaa kohdekyselysi top 10 -sijoittuneet sivut ja listaa jokainen toistuva termi, jota ne käyttävät — tämä paljastaa aiheen todellisen semanttisen naapuruston (SEO-menetelmä työkalujen kuten Surfer, Clearscope ja Frase takana)
- ✓Sisällytä nimetyt entiteetit — tuotteet, organisaatiot, standardit, ihmiset, maantieteelliset paikat — jotta Google voi yhdistää sivusi Knowledge Graphiinsa
- ✓Käytä synonyymejä, lyhenteitä ja monikkoja luonnollisesti ("juoksukengät" / "lenkkitossut" / "kengät"; "AI" / "tekoäly") — Backlinkon tutkimus osoittaa, että Google kohtelee näitä samana aikomuksena
- ✓Rakenna aiheklusteri: yksi pillar-sivu, joka kattaa aiheen laajasti, plus 5–15 tukisivua alaaiheista. HubSpotin data osoittaa, että aiheklusteri-sivustojen orgaaninen liikenne on 43 % korkeampi keskimäärin ja merkittävästi korkeammat tekoälysitaattiluvut
Nopeat vinkit semanttiseen kattavuuteen
- •Käytä 15 minuuttia top 10 SERP-tulosten lukemiseen ennen kirjoittamista — huomaa jokainen toistuva substantiivi ja verbi. Tuo lista on semanttinen tarkistuslistasi.
- •Käytä tarkkaa kohdelausettasi enintään 1–2 kertaa 300 sanaa kohden. Sen jälkeen vaihda synonyymeihin, liittyviin termeihin tai pronomineihin.
- •Nimeä vähintään 3 tiettyä entiteettiä per artikkeli — tuote, yritys, standardi, henkilö, paikka. Entiteetit ruokkivat Knowledge Graphia.
- •Käytä Surferia, Clearscopea, Frasea tai jopa Googlen "People also ask" ja "Related searches" tuodakseen esiin semanttisia termejä — mutta sivuuta mikä tahansa, joka ei sovi luonnollisesti.
- •Ryhmitä liittyvät artikkelit klustereihin sisäisillä linkeillä. HubSpot havaitsi, että aiheklusteri-sivustojen orgaaninen liikenne kasvaa noin 3,2 kertaa nopeammin keskimäärin.
- •Lue jokainen kappale ääneen. Jos se kuulostaa siltä, että ihmisasiantuntija kirjoitti sen, semanttinen sanasto on todennäköisesti jo siellä. Jos se kuulostaa robottimaiselta, täytät.
Usein kysytyt kysymykset
Käyttääkö Google todella LSI-avainsanoja?
Mikä on ero LSI-avainsanojen, semanttisten avainsanojen ja liittyvien avainsanojen välillä?
Kuinka löydän semanttisia avainsanoja aiheelleni?
Entä avainsanan tiheys — onko vanha 1–3 %:n sääntö edelleen pätevä?
Auttaako useamman semanttisen avainsanan lisääminen minua tulemaan siteeratuksi ChatGPT:ssä ja Perplexityssä?
Voinko vain käyttää tekoälykirjoittajaa tuottamaan semanttista sisältöä?
Liittyvät mittarit tutkittavaksi
- Kattavuus
Semanttiset avainsanat ovat sanasto; kattavuus on kattamisen syvyys. Yhdessä ne viestivät, että sivusi todella kattaa aiheen.
- Aiheellinen auktoriteetti
Ahrefs havaitsi, että aiheellinen auktoriteetti (liittyvien avainsanasijoitusten laajuus) on yksittäinen vahvin ennustaja AI Overview -sitaateille. Rakenna sitä aiheklustereilla.
- Semanttinen selkeys
Vaikka sanasto olisi rikasta, lauseiden on oltava yksiselitteisiä. Semanttinen selkeys varmistaa, että BERT ja tekoälyhakukoneet poimivat merkityksen tekstistäsi oikein.
- Knowledge Graph
Nimetyt entiteetit (tuotteet, brändit, ihmiset, paikat) yhdistävät sivusi Googlen Knowledge Graphiin — strukturoidun selkärangan AI Overviewsin ja ChatGPT:n takana.