Duplicate Content aufspüren und vermeiden

Duplicate Content aufspüren und vermeiden

Gehört hat es jeder Webseiten-Betreiber und Online-Shop-Besitzer mit Sicherheit schon einmal: Duplicate Content, das magische Wort in der Suchmaschinenoptimierung. Allerdings nicht im positiven Sinne. Duplicate Content ist schlecht, Google mag ihn gar nicht und am besten haben Sie nie etwas mit ihm zu tun. Warum Duplicate Content aber eigentlich gar kein Grund zur Panik ist, wie Sie ihn aufspüren, vermeiden und im Netz einzigartig bleiben, erklären wir Ihnen jetzt.

Was ist Duplicate Content eigentlich?

Als Duplicate Content bezeichnet man doppelte Inhalte, im wahrsten Sinne des Wortes. Jeder identische Text im Netz, der unter mehr als einer URL veröffentlicht wurde, ist Duplicate Content, also ein Duplikat. Darunter zählt nicht nur der externe Content, also ein- und derselbe Inhalte auf verschiedenen Webseiten, sondern auch der Inhalt innerhalb Ihrer eigenen Seite.

Es geht also nicht nur darum, dass Sie Wettbewerber oder andere Webseiten-Betreiber nicht kopieren dürfen – auch Ihre eigenen Texte veröffentlichen Sie bestenfalls nur ein einziges Mal und nur unter einer URL. Dabei ist es egal, ob Sie eine komplette Seite eins zu eins übernehmen oder nur einen Teiltext, wie zum Beispiel einen Produkttext für verschiedene Varianten Ihres Produktes (und damit auch für verschiedene URLs). Achtung: Auch Textbausteine wie Versandinformationen, die auf mehreren Seiten Ihres Shops oder Ihrer Website oder im Footer auftauchen, zählt Google zum Duplicate Content.

Sie verwirren damit die Suchmaschinen, die nicht wissen, was sie von diesen doppelten Inhalten halten sollen und die betroffenen Seiten daher schlecht bewerten oder gleich ganz herausfiltern. Ziel ist es also, für jede einzelne URL einzigartigen Content zu produzieren.

Warum ist Duplicate Content ein Problem?

Haben Sie eine sehr gut besuchte, bekannte und gut rankende Website, deren Inhalte schon lange bestehen, brauchen Sie sich erst einmal wenig Sorgen machen, ob jemand Ihre Inhalte kopieren könnte. Google wird in diesem Fall relativ schnell erkennen, dass Ihre Seite zuerst da war und außerdem die relevantere ist und wird eine Kopie Ihrer Inhalte einfach aus den Ergebnissen der Suchmaschine herausfiltern.

Anders sieht es aus, wenn Suchmaschinen sich nicht zwischen zwei Domains entscheiden können, nicht sicher sind, welche Seite die relevantere ist und beide Seiten abwechselnd aus dem Ranking filtern oder gleichzeitig abstrafen.

Jeder Duplicate Content auf Ihrer Website wirkt sich auch auf die Sichtbarkeit und das Ranking Ihrer gesamten Domain aus. Versuchen Sie also das Duplizieren von Inhalten so gut es geht zu vermeiden.

Wie vermeide ich doppelte Inhalte?

Die einfachste Möglichkeit ist, Duplicate Content gar nicht erst entstehen zu lassen. Das heißt nicht, dass Sie sich auf anderen Seiten keine Inspirationen holen dürfen – das reine Abschreiben von Textpassagen oder ganzen Seiten sollten Sie dabei aber unbedingt vermeiden. Es gibt einige kostenlose Tools (z.B. Duplicate Content Checker), in die Sie Ihren Inhalt vor Veröffentlichung einfügen können und die Ihnen nach der Prüfung im Netz melden, ob dieser Inhalt oder Teile daraus bereits irgendwo existieren.

Haben Sie auf Ihrer eigenen Seite doppelten Content entdeckt, leiten Sie die nicht relevante Seite am besten per 301-Weiterleitung auf die Hauptseite und geben Google damit zu verstehen, welche der beiden Seiten mit identischem Inhalt als relevant erachtet werden soll.

Lässt sich Duplicate Content keinesfalls vermeiden, so wie bereits erwähnt bei verschiedenen Varianten eines einzelnen Produkts, können Sie Google durch einen sogenannten Canonical Tag zu verstehen geben, welche dieser Seiten in den Suchmaschinen erscheinen soll – nämlich die Variante, auf die Sie den Canonical Tag setzen. Das ist ein für den Nutzer nicht sichtbarer Link im Header einer Seite. Suchmaschinen wissen damit ganz genau, wie sie mit dem vorhandenen Duplicate Content verfahren müssen.

Alternativ geben Sie der Seite, die Sie nicht in die Suchmaschine aufnehmen möchten, ein noindex-Attribut und verhindern somit, dass Google sie in seinen Index aufnimmt. Für Ihre Position im Suchmaschinen-Ranking wird es nicht entscheidend sein, ob ein T-Shirt in gelb, rot oder blau auf der Google-Ergebnisseite auftaucht.

Wie finde ich vorhandenen Duplicate Content?

Um Duplicate Content auf Ihrer eigenen Seite ausfindig zu machen, gibt es verschiedene Tools. Mit der kostenlosen Search Console von Google können Sie zum Beispiel die Indexabdeckung Ihrer Seite und damit die nicht indexierten Seiten überprüfen. Mit einem Klick auf diese Seiten wird Ihnen der Grund für die Nicht-Indexierung, damit auch Duplikate, angezeigt. Auch gängige kostenpflichtige SEO-Tools weisen Duplicate Content auf Ihrer Seite aus.

Externen Duplicate Content, also Ihre Inhalte auf einer anderen Domain, können Sie ganz einfach mithilfe von Google aufspüren: Kopieren Sie einfach Ihre Textbausteine in Anführungszeichen in die Google-Suche. Falls mehr als ein Ergebnis auftaucht, handelt es sich um Duplicate Content.

Gründe für internen Duplicate Content

Duplikate innerhalb Ihrer eigenen Webseite entstehen meist völlig unbewusst und aufgrund technischer Besonderheiten. Werfen Sie also immer zunächst einen Blick auf folgende Punkte, wenn Sie doppelte Inhalte auf Ihrer Seite vermuten:

Ihre Seite ist mit www und ohne zu erreichen

Dasselbe gilt für die Erreichbarkeit mit http und https. Über die htaccess-Datei im Root-Verzeichnis Ihres Webservers, können Sie Inhalte von www auf Seiten ohne www weiterleiten und die Domain von http auf https umleiten, oder umgekehrt.

Mobile Website mit identischen Inhalten

Duplicate Content auf Desktop- und Mobile-Seiten ist für Google kein Problem – solange es erkennt, dass es sich um zwei verschiedene Versionen für verschiedene Endgeräte handelt. Bei technisch sauberer Arbeit und klarer Kennzeichnung in der http-Header-Datei werden beide Seiten sowohl in den Suchmaschinen als auch beim Nutzer passend ausgeliefert.

Archiv- und Kategorieseiten

Achten Sie darauf, unnötige Seiten (Autor- oder Datumsseiten) auf noindex zu stellen, um zu verhindern, dass diese Seiten überhaupt von Google gecrawlt werden.

Verschiedene Produktvarianten

Bei verschiedenen Varianten eines Produktes (von denen eine aber auch jeden Fall im Suchmaschinen-Ranking erscheinen sollte) helfen die bereits erwähnten Canonical-Tags.

Interne Suche

Wie auch bei Filtern gilt bei Suchbegriffen: ein Canonical-Tag auf die Haupt-Themenseite oder die Kategorieseite ohne Filter, hilft Google zu verstehen, welche URL relevant ist.

URL-Parameter und Session ID’s

Zu Analyse-Zwecken macht es sicher Sinn, zum Beispiel Landing Pages mit einem bestimmten URL-Parameter zu versehen, um besser identifizieren zu können, woher welche Besucher auf Ihre Seite gekommen sind. Auch diese Seiten sollten Sie unbedingt auf noindex stellen, da hier ebenfalls eine neue URL für bereits vorhandenen Inhalt kreiert wird.

Gründe für externen Duplicate Content

  1. Übernahme von Produktbeschreibungen des Herstellers
  2. Thematisch gleiche Seiten mit ähnlichen Inhalten
  3. Content-Klau

Es wird zugegebenermaßen immer schwieriger, einzigartigen Content zu produzieren, auf den bis jetzt noch niemand im Netz gekommen ist. Gerade deshalb ist es wichtig, sich selbst Gedanken zu machen, was speziell Ihre Kunden und Leser am meisten interessiert. Sie werden das Rad wahrscheinlich nicht neu erfinden – aber selbst ein Thema, über das schon öfter geschrieben wurde, kann noch einmal von einer komplett anderen Seite beleuchtet werden oder ergibt im Kontext mit einem anderen Thema einen ganz neuen Sinn. Bringen Sie Ihre ganz persönlichen Erfahrungen, Ihren Schreibstil und Ihre Emotionen ein und versuchen Sie nicht, andere zu kopieren. Individualisieren Sie jede Ihrer Seiten – ja, auch die Produktseiten – und überlegen Sie, was Sie mit dieser Seite aussagen oder erreichen möchten. Dann laufen Sie erstens nicht Gefahr, externen Duplicate Content zu produzieren und werden zweitens interessant für die Nutzer.

Fazit

Solange Sie spannende und individuelle Inhalte produzieren, müssen Sie sich keine Gedanken um Ihr Suchmaschinen-Ranking machen. Google ist inzwischen sehr gut in der Lage, relevanten Content von Spam zu unterscheiden.

Selbst für nicht vermeidbaren, internen Duplicate Content gibt es Lösungen, die Sie auch noch einmal bei Google selbst nachlesen können, um immer auf dem Laufenden zu bleiben und sich somit bestmöglich vor Sichtbarkeitsverlusten und Abstrafungen zu schützen. Sie werden sehen – je kreativer Sie in der Themenwahl und Texterstellung werden, desto mehr werden Sie selbst und Ihre Kunden davon profitieren.