Het semantisch clusteren van zoekwoorden is een onmisbaar onderdeel in een zoekwoorden onderzoek maar vaak een tijdrovende en ingewikkelde taak. In een onderzoek uitgevoerd door search marketeer Paul Shapiro, duurt een gemiddelde zoekwoorden analyse 5 tot 28 uur per project.
Handig als je dit proces kan automatiseren! Gelukkig gaan ontwikkelingen in kunstmatige intelligentie gepaard met de opmars van tools en technieken die je helpen om het clusteren van zoekwoorden te automatiseren.
Maar hoe kan je automatiseren zonder het hoofd te breken over ingewikkelde code, zoals in Python?
Misschien nog belangrijker: waarom clusteren we zoekwoorden? Hoe zorg je ervoor dat je goed clustert? En hoe kan KeyWI je helpen om binnen enkele minuten de juiste clustering en inzichten te krijgen?
In dit artikel geef ik antwoorden op deze vragen en leg ik tevens uit waarom de kwaliteit van een automatische clustering in de meeste gevallen beter is dan bij handmatig clusteren.
Navigeer direct naar:
In 2013 kondigde Google Hummingbird aan; de codenaam voor een nieuwe algoritme update. Het omvat verschillende onderdelen, onder anderen RankBrain dat in 2015 werd aangekondigd.
Hummingbird is in staat de semantiek van een zoekopdracht van een gebruiker te begrijpen. Het neemt de hele zoekopdracht - één woord of hele zin - in overweging in plaats van losse woorden.
In 2015 kondigde Google RankBrain aan, een machine learning technologie en een verlengstuk van Hummingbird, die helpt zoekopdrachten nog beter te interpreteren. Rankbrain is in staat patronen te zien tussen schijnbaar niet met elkaar gerelateerde zoekopdrachten en leert hoe ze op elkaar lijken.
RankBrain werkt samen met Hummingbird om betere zoekresultaten te geven voor zoekopdrachten van gebruikers. Alleen gaat Rankbrain verder dan semantisch zoeken. Het zelflerende algoritme is in staat om, op basis van wat het leert, deze ‘leerervaring’ toe te passen op toekomstige zoekopdrachten. Dit kunnen vergelijkbare zoekopdrachten zijn maar ook onbekende of combinaties van zoekopdrachten.
In 2019 introduceerde Google een nieuw algoritme update, genaamd BERT. Dit model gebruikt onder andere natuurlijke taalverwerking (NLP) en sentiment analyse om elk woord in een zoekopdracht te begrijpen in relatie tot alle andere woorden in een zin. Maar recent kondigde Google aan dat ze een nieuwe technologie ontwikkelen die 1000 x krachtiger is dan BERT: MUM.
“MUM is a technique that enables transferring knowledge across languages. MUM not only understands language, but also generates it. It’s trained across 75 different languages and many different tasks at once, allowing it to develop a more comprehensive understanding of information and world knowledge than previous models.” (Nayak, Google, 2021)
Tevens is MUM multimodal. Dit betekent dat MUM informatie van verschillende content formaten, zoals webpagina's, foto's, video’s en meer, tegelijkertijd kan begrijpen.
“.. MUM is multimodal, so it understands information across text and images and, in the future, can expand to more modalities like video and audio.” (Nayak, Google, 2021)
Volgens Google zijn zoekmachines nog niet in staat zeer complexe zoekopdrachten in één keer op te lossen. Vaak ‘begrijpen’ de modellen niet de context of de gebruikersbehoefte achter een zoekopdracht. Dit resulteert in meerdere zoekopdrachten voordat in de gebruikersbehoefte is voorzien.
“People issue eight queries on average for complex tasks ....” (Nayak, Google, 2021)
Met MUM komt Google dichterbij om voor complexe vraagstukken direct antwoorden te geven. Denk bijvoorbeeld aan de "next query you're going to type in”. Hiermee wil Google eigenlijk het antwoord op je 3e vraag al weergeven bij je eerste zoekopdracht. Latente behoeftes worden zo nog duidelijker, al tijdens de zoekopdracht van de gebruiker.
Het is voor Google’s modellen dus essentieel om te snappen wat iemands intentie is en welke zoekwoorden diezelfde intentie en informatiebehoeftes hebben.
Twee (of meer) op het oog niet met elkaar gerelateerde zoekopdrachten kunnen dus inspelen op dezelfde informatiebehoefte en intentie van de zoeker.
Hoe werkt dit in praktijk? Neem het volgende voorbeeld:
Zoekopdrachten 1 en 2
“Arabica koffiebonen”
“Robusta koffiebonen”
Op het eerste gezicht schuilen achter de zoekwoorden de volgende intenties en informatiebehoeften.
Indien je deze zoekwoorden handmatig zou groeperen enkel op basis van de syntax of de onderliggende betekenis, zou een mogelijke cluster naam "soorten koffiebonen" kunnen zijn. Er is een semantische relatie, maar heb je genoeg aan deze informatie als SEO marketeer?
De SERP laat zien dat de top 3 / 4 resultaten in Google zo goed als wordt gedomineerd door blog artikelen die inspelen op de vraag wat het verschil is tussen Arabica en Robusta koffiebonen:
De semantische link is in eerste instantie duidelijk, maar zonder analyse had je wellicht over het hoofd gezien dat de intentie en informatiebehoefte van de gebruiker bij beide zoekopdrachten zo goed als hetzelfde is.
Dit is de kracht van RankBrain.
Ook wordt ingespeeld op de commerciële en transactionele intent door verschillende Ads. Op één URL na bevatten de organische zoekresultaten geen enkele URL die op deze intenties inspelen. Bijvoorbeeld, je ziet geen e-commerce landingspagina met een overzicht van Robusta (of Arabica) bonen. Blijkbaar overheerst de informatieve intentie en behoefte bij deze zoekopdrachten.
De bovenstaande inzichten had je waarschijnlijk alleen gekregen door de SERP voor elk zoekwoord apart te analyseren.
Je begrijpt ook dat er geen beginnen aan is om handmatig een analyse uit te voeren voor een zoekwoorden onderzoek van 5.000 of meer zoektermen.
Als SEO consultant heb je als taak de juiste acties te verbinden aan de inzichten uit een zoekwoorden analyse. Voor het maken van content wil je eerst gefundeerd op de volgende vragen antwoord kunnen geven:
En idealiter ook
Voordat jij juiste acties kan verbinden aan een zoekwoord, dien je dus eerst te weten welke zoekwoorden in eerste instantie semantisch gerelateerd zijn en welke zoekwoorden inspelen op dezelfde intenties en informatiebehoeftes.
Het clusteren van zoekwoorden houdt in dat je zoekwoorden die semantisch gerelateerd zijn en inspelen op dezelfde zoekintentie clustert in een groep.
Hoe werkt dit in de praktijk?
In 2017 schreef ik een artikel over ‘whisky voor beginners’ voor Gall & Gall. Ik was destijds een beginnende whiskydrinker en ging bij mezelf te rade om inzicht te krijgen wat de inhoud zou worden van het artikel. Ik stelde mijzelf de eerder genoemde 4 vragen:
Hieronder zie je de top 18 huidige rankings van het artikel zonder site link rankings, 4 jaar later.
In eerste instantie het hoofd zoekwoord. ‘Whisky voor beginners’ wordt 0x genoemd. Is dit erg?
Nee.
Ik vergat destijds wel eens om keywords in de tekst te plaatsen [1]. In plaats daarvan hield ik mij bezig met de bovenstaande vragen.
Ook komen meerdere thema’s of topics voor in het artikel:
Grotendeels [2], omdat de semantische relatie en zoekintentie van de gebruiker bij alle termen omme en nabij gelijk zijn. Daarnaast is het overkoepelende thema ‘whisky voor beginners’. Een beginner zoekt naar specifieke dingen waar een ervaren whisky drinker simpelweg niet op zoekt.
Een beginnende whisky drinker zoekt op zoete of zachte whisky, omdat dat de instap whisky’s zijn. De overwegend makkelijk te drinken whisky’s. Het ‘leren drinken’ van whisky doe je alleen als beginner. En de onderliggende informatiebehoeften zijn dat je wilt weten hoe je begint en met welke whisky’s. ‘Whisky smaken’ en ‘lekkere whisky’ zijn typische zoekopdrachten voor iemand die weinig of niets van whisky af weet.
Google Search was met behulp van onder andere RankBrain in 2017 dus al in staat via het zelflerende algoritme de semantische relatie te bepalen tussen deze zoekopdrachten. Daarom rankt het artikel ook op zoekwoorden, die niet per se terugkomen in het artikel, maar wel inspelen op de onderliggende intentie en informatiebehoefte.
Het correct clusteren van zoekwoorden geeft je een ijzersterke start voor een content strategie. Je krijgt beter inzicht in hoe je pagina's kunt organiseren en voor welke clusters van zoekwoorden je kan ranken.
Zoekwoorden clustering begint uiteraard met een zoekwoorden onderzoek. Verzamel zoveel mogelijk relevante zoektermen inclusief alle variaties, long-tail zoekwoorden en subtopics.
Zorg bij het creëren van een zoekwoordenlijst ervoor dat je relevantie en zoekintentie als leidraad neemt. Je wilt natuurlijk alleen tijd en budget spenderen aan content die relevante bezoekers naar de site brengt. Het kan een flinke klus zijn om te bepalen waarom een zoekopdracht nu precies relevant is. Zeker gezien relevantie een veelgebruikt ‘buzzword’ is.
De volgende factoren helpen om de scope te verkleinen en de nauwkeurigheid van zoekwoorden onderzoek te verbeteren:
Afhankelijk van deze factoren kunnen bepaalde zoekopdrachten wel of juist niet worden opgevangen door een site.
Daarnaast spelen ook het type pagina en content formats een rol in het begrijpen van de informatiebehoeften. Sommige zoekopdrachten kunnen bijvoorbeeld alleen worden opgevangen met een bepaald type pagina en content format. Dit hangt af van hoe de gebruiker content wil zien en consumeren.
Een voorbeeld
Stel je bent als SEO marketeer ingehuurd voor het denkbeeldige fietsmerk “SnelFietsie”. Het fietsenmerk heeft een eigen platform met webshop. Je hebt het zoekwoord ‘fiets kopen’ gevonden in het zoekwoordenonderzoek. Is dit zoekwoord relevant?
Nee.
De top zoekresultaten in Google tonen gevestigde partijen die:
Mensen die zoeken op ‘fiets kopen’ overwegen een fiets te kopen, maar hebben nog niet een bepaald merk voor ogen. Het voelt logisch om een overzicht te zien van verschillende merken en fietsen met bijbehorende content die inspeelt op eventuele expliciete en latente vragen.
Het is aannemelijk dat SnelFietsie als individueel fietsmerk niet kan inspelen op deze informatiebehoefte en intenties. Een relevante pagina is daarom ook buiten het bereik van SnelFietsie.
Begrijpen welke zoekwoorden op basis van deze factoren wel of niet relevant zijn, is essentieel om de juiste content clusters te maken en dus relevant verkeer naar de website te sturen.
KeyWI is een AI gedreven keyword clustering tool, die in een paar minuten een lijst van duizenden zoekwoorden analyseert en semantisch groepeert.
Van een gestructureerde lijst naar een volledige zoekwoorden clustering in 2 eenvoudige stappen. De stappen worden uitgelegd aan de hand van voorbeelden inclusief inzichten en concrete acties.
De test set is een zoekwoordenlijst van 469 zoekwoorden over het onderwerp ‘kunstgras’.
Upload de csv van de zoekwoorden set inclusief het zoekvolume. Of, als je nog geen lijst hebt, kies de optie ‘generate keyword set’.
Vervolgens configureer je de geolocatie instellingen naar jouw wens. Wij kozen voor de volgende setup:
Je kan bij ‘Domain rank’ een domein opgeven, bijvoorbeeld die van je klant [3]. KeyWI verzamelt voor het ingestelde domein de rankings van alle zoekwoorden in de set. Op deze manier kun je de zichtbaarheid van jouw site analyseren op cluster en zelfs subcluster niveau.
Klaar? Druk ‘Cluster’.
Het clusteren van 469 zoekwoorden duurt ongeveer 2 minuten.
Na 2 minuten geeft KeyWI de volgende visualisatie.
De eerste schil bevat de primaire content clusters. In de tweede schil vind je de subclusters. KeyWI heeft elk content cluster (=circle) een dominante intentie toegewezen. Bijvoorbeeld, een blauw cluster is overwegend informatief.
Een (sub)cluster of individueel zoekwoord hoeft natuurlijk niet op 1 Intentie in te spelen. In het voorbeeld van het zoekwoord ‘fiets kopen’ is de intentie een mix van informatief, commercieel en transactioneel.
Selecteer een van de clusters.
In het onderstaande voorbeeld zie je een overwegend informatief content cluster met commercieel als secundaire intentie. Het topic is ‘kunstgras leggen’.
Wat valt op?
Als je op de 2e schil van rechts klikt, ga je nog een schil dieper. Daar vind je het subcluster ‘kunstgras leggen - generiek’.
Wat opvalt is dat de zoekwoorden zowel inspelen op de informatieve als commerciële intent. Het is namelijk niet duidelijk of het hier gaat om mensen die kunstgras willen laten aanleggen of kunstgras zelf willen aanleggen. De zoekresultaten van Google bevestigen dit.De getoonde advertenties spelen in op de commerciële intentie en de behoefte voor particulieren of bedrijven die op zoek zijn naar een bedrijf die kunstgras aanlegt:
En de top 3 [4] organische zoekresultaten worden gedomineerd door blog artikelen die inspelen op een informatieve intentie en zoekers voorzien van tips hoe ze zelf kunstgras kunnen aanleggen:
Een ander subcluster in hetzelfde hoofd cluster van kunstgras aanleggen is ‘aanleg kunstgras tuin’.
In dit voorbeeld gaat het specifiek om het aanleggen van kunstgras in de tuin. Dit geeft een betere indicatie dat het hier om particulieren gaat die zelf kunstgras in de tuin willen aanleggen.
Het nalopen van de zoektermen in Google geeft ommenabij dezelfde resultaten als het vorige subcluster. Namelijk, content artikelen over het zelf aanleggen van kunstgras.
Inzichten
Acties voor organische content [5]
Op eenzelfde manier analyseer je de overigen content clusters.
Wil je weten hoe het eerder opgegeven domein presteert in Google? KeyWI visualiseert ook per sub(cluster) de gemiddelde ranking.
Is een cluster grijs? Dan rankt het gehele (sub)cluster niet.
De bovenstaande visualisatie geeft je direct inzicht in mogelijke kansen voor content creatie en optimalisatie.
Ook reeds sterk presterende pagina’s of zoektermen zijn het evalueren waard.
De volgende afbeelding toont een voorbeeld van het groene subcluster ‘online kopen’ van het bovenliggende subcluster ‘kopen’ van het commercieel dominante cluster ‘kunstgras generiek / kopen’.
Hier valt iets eigenaardig op: bij de eerste 3 termen is navigationele intentie dominant. Je zou hier commerciële of transactionele intent verwachten.
Een ander subcluster, met enkel de gerelateerde generieke zoekwoorden ‘kunstgras kopen’ en ‘kunstgras bestellen’ rankt gemiddeld op nummer 1. De zoekwoorden hebben zowel een commerciële en transactionele intent.
De zoekwoorden van beide subclusters ranken voor dezelfde pagina.
Samenvattend kan het volgende worden waargenomen:
Een snelle check in Google geeft al snel antwoord: een geval van Exact-Match-Domain (EMD) [6]. In deze gevallen zorgt de match van de domeinnaam ervoor dat gebruikers sneller klikken op het zoekresultaat. Immers, gebruikers zijn specifiek naar kunstgras wat ze online kunnen bestellen.
Maar staat het daarom op nummer 1? En betekent dit dan ook dat ze initieel op zoek waren naar het bedrijf Kunstgras Online? Waarschijnlijk niet. Wellicht sommigen. En hoe interpreteert Google’s zoekmachine het zoekgedrag?
Logische vragen die niet relevant zijn.
Belangrijker is om eruit af te leiden dat het uitdagender wordt om op nummer 1 te ranken op zoektermen met ‘kunstgras online’.
Wel is het mogelijk direct on-page optimalisaties door te voeren die helpen bij het beter ranken op deze zoektermen. Kunstgras Direct kan bijvoorbeeld de meta titel optimaliseren.
Ook op de landingspagina wordt nergens gesproken over het online bestellen van kunstgras.
KeyWI genereert op een intuïtieve manier direct actie-gedreven inzichten voor content optimalisaties en content creatie. Het is snel, makkelijk in gebruik en bovenal data gedreven.
Het automatisch clusteren van zoekwoorden met KeyWI scheelt niet alleen tijd, maar ook de kwaliteit van clusteren verbetert.
Andere voordelen van het automatisch clusteren van zoekwoorden met KeyWI:
Wil je meer weten over de tool of een keertje testen? Probeer hier onze clustering tool gratis uit. Wij zijn overtuigd van wel. Wil je meer weten over het clusteren van zoekwoorden, SEO gerelateerde topics of automatisering van SEO inzichten? Neem dan contact op met Bartjan.
Liever een persoonlijke adviseur die elke week tips geeft hoe jij beter gevonden kunt worden in Google? Probeer dan onze KeyWI Adviseur gratis.