Noindex en nofollow: je komt ze regelmatig tegen als je met SEO bezig bent. Maar wat betekenen ze nu eigenlijk en wat is het verschil? Wanneer gebruik je de één en wanneer de ander?

Het verschil tussen noindex en nofollow

Noindex heeft betrekking op pagina’s en betekent dat zoekmachines de betreffende pagina niet mogen indexeren (opnemen in hun zoekresultaten).

Nofollow heeft betrekking op links en betekent dat crawlers van zoekmachines een bepaalde link niet moeten volgen (oftewel: de pagina waar de link naartoe verwijst moet niet gecrawld worden).

Hoe gebruik je een noindex tag?

Noindex is een metatag die in de <head> van de broncode van een pagina staat. In dezelfde metatag kun je aangeven of links op die pagina wel of niet gevolgd mogen worden. Hier combineer je dus een noindex met een follow of nofollow richtlijn voor de crawler.

Mag een pagina niet geïndexeerd worden, maar mag de crawler wel links op die pagina crawlen, dan gebruik je deze code: <meta name=”robots” content=”noindex, follow”>. Als je ook niet wilt dat de links gevolgd worden, dus dat de crawler op dat moment bij die pagina stopt, dan gebruik je <meta name=”robots” content=”noindex, nofollow”>.

Overigens zal een noindex, follow in de praktijk uiteindelijk hetzelfde effect hebben als een noindex, nofollow. Immers als de pagina niet geïndexeerd mag worden, dan zal Google een volgende keer die pagina ook niet meer crawlen en de links op die pagina ook niet meer vinden.

Mag een pagina wel geïndexeerd worden, dan kun je deze metatag weglaten, maar meestal zal op een pagina de volgende tag staan: <meta name=”robots” content=”index, follow”>. Uiteraard kun je ook nog kiezen voor de combinatie index, nofollow, maar deze komt in de praktijk zelden voor.

Noindex vs. robots.txt

Let op als je de noindex tag gebruik in combinatie met het blokkeren van de betreffende pagina in robots.txt. Als je in je robots.txt een pagina een disallow meegeeft is dat een aanwijzing voor Google om die pagina niet te crawlen. Het is echter geen garantie dat Google en andere crawlers die aanwijzing ook echt opvolgen. Bovendien kan je site ook op een andere manier gevonden worden (bijvoorbeeld via een link op een andere site).

Wil je zeker weten dat je pagina niet wordt geïndexeerd, dan kun je beter de noindex metatag gebruiken (of een HTTP response header). Maar let op: als je pagina nog in je robots.txt staat, dan zal Google deze metatag waarschijnlijk niet zien (je pagina wordt immers niet gecrawld).

Hoe gebruik je ‘nofollow’?

Hierboven heb je al kunnen lezen hoe een nofollow werkt in combinatie met een noindex tag. Daarnaast kun je een nofollow meegeven aan elke link op je website. Is er een bepaalde link op je website waarvan je niet wilt dat een crawler zoals Googlebot deze volgt, dan kun je aan die link een rel=”nofollow” meegeven. Crawlers weten dan dat ze de betreffende link niet moeten volgen.

Rel staat voor ‘relation’ en het vertelt aan de crawler (bijvoorbeeld Google) wat meer over de relatie tussen jouw website en die waar je naar linkt. Met een rel=”nofollow” geef je eigenlijk aan dat Google de link niet moet volgen of dat je niet geassocieerd wilt worden met de content op de betreffende pagina. Normaal gesproken draagt elke link een stukje ‘linkwaarde’ over. Heeft de link een nofollow, dan gebeurt dit niet.

De belangrijkste redenen voor het gebruik van een rel=”nofollow”:

als de link gesponsord is of als er is betaald voor de link;
als je niet geassocieerd wilt worden met of verantwoordelijk wilt zijn voor de content op de pagina waar naar gelinkt wordt;
om misbruik van linkwaarde te voorkomen, bijvoorbeeld op forums of in de reacties op een blogartikel.

In het verleden werd de nofollow ook weleens gebruikt om interne linkwaarde te sturen. Er werd dan op links naar interne pagina’s zoals de klantenservicepagina of inlogpagina een nofollow geplaatst om hier geen linkwaarde aan te verspillen. Echter kan dit een verkeerd signaal geven aan Google. Google adviseert dan ook om hiervoor je robots.txt te gebruiken en de rel=”nofollow” alleen voor externe links te gebruiken.

Omdat het soms onduidelijk was waar een nofollow precies voor diende heeft Google aanvullende rel-waardes in het leven geroepen:

rel=”sponsored”: voor gesponsorde of betaalde links
rel=”ugc”: voor ‘user generated content’, zoals links in forumposts en blogreacties
rel=”nofollow”: als bovenstaande situaties niet van toepassing zijn en je niet met de pagina geassocieerd wilt worden of niet wilt dat de betreffende pagina gecrawld wordt.

Ook is het een mogelijk om een combinatie van bovenstaande rel-waardes te gebruiken.

Het is belangrijk om te beseffen dat een nofollow-attribuut er niet voor zorgt dat de pagina waar naar gelinkt wordt niet geïndexeerd wordt. De pagina kan namelijk ook op een andere manier gevonden worden (bijvoorbeeld via je sitemap). Als je niet wilt dat Google of een andere zoekmachine die pagina indexeert kun je hier beter een noindex tag voor gebruik en de pagina eventueel uitsluiten voor crawlers via je robots.txt.