Noindex

Was versteht man unter „noindex“?

Wenn in einem Meta-Tag die robots-Angabe „noindex“ steht, dann erscheint die Seite nicht in den Suchergebnisse. Es kann somit aktiv beeinflusst, welche URLs indexiert werden und welche nicht. Dies geschieht meistens durch Webmaster. Dieser Noindex-Tag kann noch durch den Zusatz „follow“ oder „nofollow“ ergänzt werden.

Wann wird „noindex“ verwendet?

Sollte auf einer Seite dem User kein Mehrwert in den Suchergebnissen geboten werden, dann kann die „noindex“ Angabe benutzt werden. Ein weiteres Anwendungsgebiet ist, wenn wiederholte Inhalte nicht angezeigt werden sollten. Ein Beispiel dafür wäre die interne Suchfunktion einer Website, die nicht indexiert werden soll. Falls gleiche Inhalte auf verschiedenen URLs vorhanden sind, kann mittels der Filter-URL die Indexierung ausgeschlossen werden.

Um es mit einfacheren Worten zu sagen, mit „noindex“ kann Suchmaschinen gesagt werden, dass die Webseite von der Indexierung ausgenommen werden soll. Diese Funktion kann hilfreich sein bei:

  • internen Suchergebnisseiten
  • zweifachen Kategorieseiten
  • Inhalten, die urheberrechtlich geschützt sind
  • paginierten Seiten (Inhalte einer Webseite, werden auf mehrere Seiten verteilt)

Wie erfolgt die Umsetzung?

Direkt im Quelltext einer Webseite oder einer Unterseite wird der Meta-Tag „noindex“ eingebaut. Es ist auch möglich, ihn bei weiteren Meta-Angaben hinzuzufügen. Aussehen würde dies dann so:

Hier Screenshot hinzufügen

Danach werden die Inhalte der Webseite nicht indiziert und sind auch nicht in den Suchergebnissen vorhanden.

Durch die Site-Abfrage kann jeder Webseiten-Entwickler die betreffende Seite kontrollieren, ob der Meta-Tag gelesen und auch richtig funktioniert. Sollte dies der Fall sein, fällt das Suchergebnis negativ aus. Grund dafür ist, dass der Tag das Indexieren der Webseite nicht erlaubt hat. Folge davon ist, dass die Webseite in keinen Suchergebnissen von Google, Bing & Co angezeigt wird. Es besteht auch die Möglichkeit, dass nur einzelne Crawler angesprochen werden. In der Praxis wird diese Möglichkeit jedoch kaum genutzt.

Was gibt es für einen Unterschied zwischen „noindex“ und „disallow“?

Mit „disallow“ in der robots.txt können einzelne Seiten vom Crawling ausgeschlossen werden. Somit haben Suchmaschinen keinen Zugriff auf diese Seiten. Der Meta Tag „Noindex“ bedeutet, dass die Suchergebnisse nicht gelistet werden. Vielen Webmastern ist dieser Unterschied nicht bekannt bzw. bewusst.

Wenn eine Webseite besucht wird, ist die robots.txt das erste Dokument, das sich der Crawler anschaut. Wird dem Crawler der Zugriff aufgrund des „disallow“-Befehls in der robots.txt auf der Seite verweigert, kann auch der Meta Tag „noindex“ nicht ausgelesen werden. Daher sollten beide Verfahren nicht gleichzeitig verwendet werden. Fakt ist auch, wenn die Webseite einmal indexiert wurde, kann sie auch nicht über die robots.txt aus den Suchergebnissen entfernt werden.

Hier Screenshot einfügen

„noindex“:

  • für interne Suchergebnisseiten
  • keine Index-Aufnahme
  • Inhalte sollen gecrawlt werden, aber nicht indiziert

„disallow“:

  • Inhalte solle nicht gecrawlt werden
  • Login-Seiten, für sensible Inhalte
  • Aufnahme in den Index möglich
  • Für großes Datenvolumen, wie Bilddatenbanken

Wann ist die Verwendung von „follow“ und „noindex“ von Bedeutung?
Ob Suchmaschinen den Links auf einer Webseite folgen oder nicht, wird mit dem Meta Tag „follow“ oder „nofollow“ festgelegt. Ist die „nofollow“ Angabe nicht vorhanden, ist es so, als wäre „follow“ automatisch ausgewählt.

Hier Screenshot einfügen

Beide, „noindex“ und „follow“ werden verwendet, wenn die Links einer Seite von Bedeutung sind, der Inhalt aber nicht in den Suchergebnissen aufgeführt werden soll. Ein Beispiel dafür wäre die Suchseitenergebnisse eines Onlineshops.

Wann sollte „noindex“ und „nofollow“ verwendet werden?

Durch die Kombination von „noindex“ und „nofollow“ werden Suchmaschinen im Prinzip ausgeschlossen. Durch „nofollow“ kann der Crawler den Links auf der Webseite nicht folgen. Falls Inhalte von großer Bedeutung verlinkt sind, die auch nicht von anderen Webseiten verwiesen werden, können diese von Suchmaschinen nicht analysiert werden. Meistens wird diese Kombination nur für Tests oder für den privaten Gebrauch verwendet und sollte nur mit Vorsicht eingesetzt werden.

Hier Screenshot einfügen

Welchen Nutzen hat „noindex“ für SEO?

Für die Suchmaschinenoptimierung ist der Meta-Tag „noindex“ eine perfekte Möglichkeit, um die gleichen Inhalte zu vermeiden. Google und alle anderen Suchmaschinen belegen doppelte Inhalte mit Penalties. Durch die Ergänzung „follow“ besteht die Möglichkeit, allen Links auf der nicht-indexierten Webseite trotzdem zu folgen.

Einige CMS legen Archivseiten an, die gleich in den Index gelangen können. Es kann passieren, dass dies dann als Spamming bewertet wird. Nur durch „noindex“ kann dies vermieden werden. Wird eine Webseite relauncht oder eine neue Version veröffentlicht, kann „noindex“ die Arbeit erleichtern. Das Projekt kann von allen Beteiligten live auf die Funktionalität getestet werden, ohne dass Bereiche davon schon in den Index einer Suchmaschine gelangen. Diese „noindex“-Angabe muss aber nach dem Veröffentlichen wieder aus dem Quellcode gelöscht werden. Nach diesem Schritt können Suchmaschinen die Webseite auch indexieren. Denn nur diese indexierbaren URLs können überhaupt gerankt werden.

philipp-pistis
Über den Autor

Philipp Pistis ist seit 2009 Webdesigner und Programmierer. Er hat mit seinem Team bereits über 300 WordPress Projekte erfolgreich umgesetzt und teilt sein Wissen hier auf diesem Blog.

Folge mir auf LinkedIn