Als het goed is ben je bekend met het principe van een sitemap. Indien niet geen zorgen, ik zal er kort op ingaan om je ook mee te nemen indien je dat niet bent. Maar te vaak zie ik dat er nog geen goed gebruik wordt gemaakt van alle mogelijkheden die er komen kijken bij sitemaps.
Maar ook wordt lang niet altijd aan alle vereisten van een sitemap gedacht.
Waarom ik het ga hebben over sitemaps
Naarmate het web evolueert, geldt dat ook voor Google en voor SEO. Dit betekent dat wat als beste praktijk wordt beschouwd, vaak in beweging is. Wat gisteren misschien goede raad was, is dat niet vandaag. Dit geldt met name voor sitemaps, die bijna net zo oud zijn als SEO zelf.
Het probleem is dat wanneer Jan en alleman antwoorden heeft gepost op forums, aanbevelingen heeft gepubliceerd op blogs en meningen heeft versterkt op sociale media, het tijd kost om de waardevolle adviezen uit verkeerde informatie te sorteren. Zo ontstaat er een stuk desinformatie en deze wil ik tegen gaan.
Dus hoewel de meesten van jullie waarschijnlijk al weten dat een sitemap in Google Search Console belangrijk is, weet je misschien niet hoe ingewikkeld de implementatie ervan is op een manier die SEO performance indicators mogelijk maakt.
Laat me de verwarring over de beste werkwijzen omtrent sitemaps eens bespreken en de misverstanden voor eens en altijd uit de wereld helpen.
Wat is een Sitemap?
Een sitemap is een pagina (of bestand) met een lijst van alle pagina’s die op een website te vinden zijn.
Eenvoudig gezegd is een XML-sitemap een lijst met de URL’s van je website. Het fungeert als een routekaart om zoekmachines te laten zien welke inhoud beschikbaar is en hoe deze te bereiken is.
Maar waarom zijn ze handig, laat me dat aan de hand van een simpel voorbeeld uitleggen;
- Een zoekmachine zal alle negen pagina’s in een sitemap met één bezoek aan het XML-sitemapbestand.
- Via de website zal het vijf interne links moeten doorlopen om alle 9 pagina’s te vinden.
Er is dus een duidelijk verschil tussen hoe de zoekmachine en een bezoeker moet bewegen om alles inzichtelijk te krijgen.
Dit vermogen van een XML-sitemap om crawlers te helpen bij snellere indexering is vooral belangrijk voor websites die:
- Duizenden pagina’s en / of een diepe website-architectuur hebben.
- Ze voegen vaak nieuwe pagina’s toe.
- Ze veranderen vaak de inhoud van bestaande pagina’s.
- Lijdt aan zwakke interne links- en /of aan orphaned pagina’s (met orphaned pagina’s bedoel ik pagina’s welke niet op een normale / logische manier gevonden kunnen worden)
Hoewel zoekmachines je URL’s technisch zonder kunnen vinden, door pagina’s in een XML-sitemap op te nemen, geeft je aan dat je ze zelf beschouwt als pagina’s van hoge kwaliteit. Ondanks dat er geen garantie is dat een XML-sitemap je pagina’s zal laten crawlen, laat staan dat ze worden geïndexeerd of geranked, levert het verzenden van een daarvan zeker kansen op.
Want je maakt het voor een zoekmachine gewoonweg duidelijker en makkelijker.
Belangrijke attributen voor in een sitemap
Als je gaat kijken naar de opbouw van een XML sitemap dan zitten daar een aantal elementen in die niet voor iedereen even duidelijk zullen zijn. Maar deze attributen hebben wel een bepaalde semantische waarde. Het is dus goed om te weten wat ze doen en of je ze goed gebruikt?
Loc (Locatie) Tag
Deze verplichte tag bevat de absolute, canonieke versie van de URL-locatie. Het moet site-protocol accuraat weergeven (http of https) en of je ervoor hebt gekozen www op te nemen of uit te sluiten.
Hreflang / taal
Voor internationale websites MOET je hier ook de hreflang-afhandeling implementeren.
Door het kenmerk xhtml: link te gebruiken om de taal- en regievarianten voor elke URL aan te geven, vermindert u de laadtijd van de pagina, wat de andere implementaties van koppelingselementen in de <head> – of HTTP-headers niet kunnen bieden.
Yoast heeft een uitgebreide post geschreven over hoe om te gaan met hreflang; https://yoast.com/hreflang-ultimate-guide/
Lastmod (Laatst gewijzigd) Tag
Officieel is deze tag optioneel maar ik zou hem toch heel stevig willen aanbevelen. Het wordt gebruikt om de laatste gewijzigde datum en tijd van de url te communiceren. Dit is voor zoekmachines van belang zodat zij een goed beeld hebben van wanneer zowel de content voor het eerst is gepubliceerd alsmede wanneer deze voor het laatste gewijzigd is.
Zoekmachines gebruiken dit als een signaal voor het ranken van je pagina’s.
Het is ook aan te raden om de versheid te communiceren, maar vergeet niet de wijzigingsdatum alleen bij te werken als je ingrijpende wijzigingen hebt aangebracht.
Indien het alleen kleine, niet noemenswaardige, aanpassingen betreft zou je kunnen volstaan met een korte edit notitie in het bericht of op de pagina zelf. Daarnaast kan dit overkomen als dat je een zoekmachine probeert te misleiden, daar moet je natuurlijk mee opletten.
Changefreq (veranderings frequentie) tag
Deze optionele tag, welke ik ook sterk aanraad, geeft een indicatie hoe vaak dat de inhoud van de URL zou veranderen aan de zoekmachines.
Google, en met name John Mueller heeft verklaard dat “veranderingsfrequentie niet zo veel van een rol speelt met sitemaps” en dat “het veel beter is om simpelweg de tijdindicatie van direct op te geven”. Derhalve zou ik aanraden om het advies van Google hierin maar te volgen.
Priority Tag (prioriteit)
Deze optionele tag zou ogenschijnlijk de zoekmachines vertellen hoe belangrijk een pagina is ten opzichte van de andere URL’s op een schaal tussen 0,0 en 1,0. Echter is door verschillende mensen van Google, waaronder Gary Illyes, aangegeven dat ze hier niets mee doen.
Je website heeft een XML-sitemap nodig, maar niet noodzakelijk de metagegevens over de prioriteit en de wijzigingsfrequentie aangezien de zoekmachines daar niet naar omkijken.
Gebruik de tags lastmod nauwkeurig en richt uw aandacht op het zorgen dat u de juiste URL’s ontvangt.
Verschillende vormen sitemaps
Buiten de algemene sitemap is het zo dat er nog verschillende andere sitemaps zijn die je mogelijkerwijs moet gebruiken. Denk daarbij aan sitemaps voor afbeeldingen, videos, nieuws en bijvoorbeeld mobiele sitemaps.
Als je veel met afbeeldingen doet; gebruik een afbeelding sitemap.
Als je veel met video’s doet; gebruik een video sitemap
Als je specifiek werkt met nieuwsberichten (persberichten); gebruik dan een nieuws sitemap.
Als je incidenteel een van bovenstaande zaken doet dan is het niet nodig om daar een volledige sitemap aan te wijden. Daarnaast kan het zijn dat je ook heel specifieke entiteiten hebt, denk bijvoorbeeld aan een website met recepten. Je kunt dan nog steeds de normale sitemap hebben maar je zou ook juist een specifieke recepten sitemap kunnen hanteren. Zo kun je meer modulair te werk gaan.
Mobiele sitemaps
Een mobiele sitemap is niet perse een must ook al zou je dat zo denken. Het is aan te raden om deze te gebruiken indien de mobiele ervaring en desktop ervaring geheel of enorm van elkaar afwijken.
Sitemaps optimalisatie
Nu komen we bij het leuke gedeelte. Hoe gebruik je XML-sitemaps het meest nuttig?
Neem alleen relevante SEO-pagina’s op in XML-sitemaps
Een XML-sitemap is een lijst met pagina’s die je aanbeveelt om te worden gecrawld, wat niet noodzakelijk elke pagina van je website is. De XML-sitemap geeft aan dat je de opgenomen URL’s belangrijker vindt dan niet vermeldde URL’s die zich niet in de sitemap bevinden.
Je gebruikt je sitemap in feite om de zoekmachines te laten weten; “Ik zou het zeer op prijs stellen als jullie je in het bijzonder op deze URL’s zou concentreren.”
In wezen helpt je het crawlbudget effectief te gebruiken. Het crawlbudget is iets wat je opbouwt over tijd, door goed om te blijven gaan met het maken van content.
Door alleen SEO-relevante pagina’s op te nemen, help je zoekmachines je site op een slimmere manier te crawlen om de voordelen van een betere indexering te benutten.
Zaken welke je zou moeten uitsluiten van je sitemap
- Url’s zonder een canonical
- Dubbele pagina’s
- URL’s met paginatie
- URL’s met parameters / sessie-ID
- Pagina’s met zoekresultaten
- Comment URL’s
- Deel via e-mail-URL’s.
- Filterings URL’s
- Archief pagina’s.
- Alle omleidingen (3xx), ontbrekende pagina’s (4xx) of serverfoutpagina’s (5xx).
- Pagina’s geblokkeerd door robots.txt.
- Hulppagina’s die nuttig zijn voor gebruikers, maar niet bedoeld zijn als bestemmingspagina’s (inlogpagina, neem contact met ons op, privacybeleid, accountpagina’s, enz.).
Houd op deze manier je crawlbudget zo schoon als mogelijk doordat je niet nuttige pagina’s niet aan je sitemap toevoegt.
Het is daarom ook aan te raden om je crawl statistieken in Google Search Console geregeld te controleren.
BONUS; Sitemaps en de-indexeren
Wist je dat je een sitemap ook kunt gebruiken om pagina’s uit de Google Index te krijgen?
Soms komt het voor dat je ondanks de beste bedoelingen pagina’s in de Google Index krijgt terwijl dat niet gewenst is.
Google Search Console bied de opties om enkele URL’s te verwijderen of om met een disavow file te werken (https://www.google.com/webmasters/tools/disavow-links-main?pli=1)
Maar je sitemap heeft een mogelijkheid om hetzelfde voor elkaar te krijgen zonder dat je van losse tools afhankelijk moet zijn.
Het verzenden van een sitemap met noindex-URL’s kan de deindexering versnellen. Dit kan efficiënter zijn dan het verwijderen van URL’s in Google Search Console als er veel geïndexeerd moeten worden.
Let wel; gebruik dit met zorg en zorg ervoor dat je dergelijke URL’s TIJDELIJK aan je sitemaps toevoegt.
Sitemaps zijn dus belangrijk
Het goed inzetten van een sitemap is dus veel meer vaak dan alleen maar hem maken en hem toevoegen aan de zoekmachines. Voor een zo optimaal functionerende sitemap moet je kijken naar wat er wel en met name naar wat er niet in moet komen.
Misschien dat je nu de header afbeelding van dit item beter zult begrijpen!
Zoals je kunt zien ga ik toch ook redelijk diep in op zelfs de kleinste aspecten want ik wil dat jij het optimale uit je medium kunt halen. Keertje sparren over je sitemap? Laat het me gerust weten!