So vermeidest du Duplicate Content
Einstein1 Digitales Gründerzentrum > Allgemein  > So vermeidest du Duplicate Content
Duplicate Content

So vermeidest du Duplicate Content

Duplicate Content bedeutet auf Deutsch schlicht “doppelter Inhalt” und ist ein wichtiges Thema im SEO-Bereich. Die Darstellung von identischem Inhalt auf verschiedenen Webseiten wird von den meisten Suchmaschinen negativ bewertet und kann zu unangenehmen Konsequenzen führen.

 

In diesem Beitrag findet sich alles Wichtige rund um das Thema Duplicate Content und zudem wertvolle Tipps für Webseitenbetreiber.

 

Duplicate Content: Was genau versteht man darunter?

 

Doppelte Inhalte sind schlicht als in Teilen oder komplett identische Inhalte zu definieren, welche man über verschiedene URLs abrufen kann. Im Umgang damit wird solcher Duplicate Content gern als “DC” abgekürzt. Dabei kann es sich einerseits nur um textlich gleichen Inhalt handeln, aber auch um komplett identische Einzelseiten. Dieser DC stellt in vielerlei Hinsicht ein Problem für den SEO-bewussten Webseitenbetreiber dar, weil Suchmaschinen diesen als einen negativen Umstand bewerten.

 

Ob man auf einer eigenen Webseite identische Inhalte unter verschiedenen URLs veröffentlicht hat, kann man mittels mehrerer Dienste im Netz bequem prüfen lassen. Diese Prüfungen laufen äußerst rasch ab und liefern zuverlässige Ergebnisse.

 

Was nicht als Duplicate Content gilt, sind dieselben Inhalte in unterschiedlichen Sprachversionen. In dieser Hinsicht kann man also ganz beruhigt sein. Was ebenfalls nicht als doppelter Inhalt gewertet wird, sind Zitate. Allerdings sollte man dies auch mittels des “blockquote”-Tags so auszeichnen, dass sie für Suchmaschinen als Zitate erkennbar sind. Fullqoutes von anderen Texten sollte man natürlich dennoch tunlichst vermeiden.

 

Bei der Frage danach, was Duplicate Content eigentlich ist, unterscheidet man grob zwei Kategorien, nämlich internen und externen doppelten Inhalt. Was das bedeutet, wird im folgenden Absatz erläutert und anhand von Beispielen veranschaulicht.

 

Klicken Sie auf den unteren Button, um den Inhalt von giphy.com zu laden.

Inhalt laden

 

 

Unterschied zwischen internem und externem Duplicate Content.

 

Externer doppelter Inhalt liegt vor, wenn dieselben Texte auf zwei verschiedenen Domains existieren. Das kann gewollt von einem Webseitenbetreiber so gestaltet werden oder auch der Fall sein, falls sich jemand anders per Crawl oder auch durch menschliche Hand ungefragt an den eigenen Inhalten bedient. Dieser Fall wäre dann echter Diebstahl von Content. Darum soll es hier allerdings weniger gehen, weil das dann eher rechtlicher Schritte bedürfte – und nicht SEO-Maßnahmen, wie im anderen Fall.

 

Interner Duplicate Content ist zwar wohl der wesentlich häufigere Fall, aus Sicht der meisten Suchmaschinen aber weniger problematisch. Ein solcher interner doppelter Inhalt entsteht auf etlichen verschiedenen Wegen, die weiter unten dargestellt sind. Hier ist natürlich der Vorteil, dass man selber Abhilfe schaffen kann. Mit einfachen Lösungen umgeht man hier, dass Suchmaschinen nicht wissen, welche der Versionen die in ihren Ergebnissen anzuzeigende ist.

 

Duplicate Content: Aus SEO-Sicht ein Problem?

 

Nun könnte man als Laie annehmen, dass es doch eher von Vorteil ist, wenn man seine Inhalte unter verschiedenen URL erreichbar macht. Damit sollte doch die Wahrscheinlichkeit steigen, dass man gut in den Suchergebnissen der einzelnen Suchmaschinen rankt. Tatsächlich stellt Duplicate Content aber ein echtes Problem dar. Dies weniger bei internen doppelten Inhalten (hier jedoch in Maßen auch) als bei externen doppelten Inhalten.

 

Google zumindest, die mit riesigem Abstand populärste Suchmaschine im deutschsprachigen Raum, erklärt explizit, warum es doppelte Inhalte negativ bewertet. Bzw. Google sagt, dass man es vermeiden möchte, derartige identische Inhalte mehr als einmal zu indexieren und damit Suchenden bei einer Suchanfrage auch mehr als einmal als Ergebnis anzuzeigen.

 

Anders formuliert liefern doppelte Inhalte an verschiedenen Orten im Netz dem Besucher keinen Mehrwert. Google will seinen Nutzern das bestmögliche Ergebnis mit unterschiedlichen Resultaten für seine Inhalte bieten. Diesem Bestreben läuft ein solcher identischer natürlich zuwider. Weshalb es auch durchaus vorkommen kann, dass Fälle solchen gleichen Inhalts von Google abgestraft werden. Zudem ist es nicht unwahrscheinlich, dass es hier häufig schwankt, welche der URL mit denselben Inhalten gute Positionen im Suchergebnis erhält. Das kann nicht im Interesse eines Webseitenbetreibers sein.

 

Zwar bemüht sich Google seinerseits schon, bei der Indexierung von Inhalten doppelte Inhalte nur in der bestmöglichen Version als Suchergebnis aufzunehmen. In der Regel tauchen interne doppelte Inhalte also nicht zweimal als Ergebnis auf. Doch wünscht sich Google, dass auch vonseiten der Webseitenbetreiber diese Problematik berücksichtigt wird. Wie also geht man mit dieser Problematik am besten im Sinne der Suchmaschinen um?

 

Wie kann man Duplicate Content vermeiden?

 

Abhilfe zur Vermeidung von doppelten Inhalten können gleich mehrere Maßnahmen schaffen.

 

1. Druckansichten

 

Nicht mehr ganz so gebräuchlich, aber immer noch anzutreffen sind Druckversionen von Webseiten. Diese sind in der Regel anders gestaltet als jene Seiten für das Web, enthalten andere Formatierungen etc., aber denselben Inhalt. Somit läge auch hier unter zwei verschiedenen URL identischer Inhalt vor. Dem begegnet man schlicht, indem man die Druckansichten per Tag von der Indizierung durch Suchmaschinen ausschließt. Zudem sollten interne Verlinkungen auf die Druckansichten als nofollow-Link gestaltet werden.

 

2. index-Datei

 

In der Regel ist eine Webseite so aufgebaut, dass die sogenannte index-Datei jene ist, die ein Browser zuerst ausliest und anzeigt, wenn man eine URL ohne jeden weiteren Adresszusatz aufruft. Das führt aber dazu, dass diese beiden Adressen

 

http://www.beispiel.de
http://www.beispiel.de/index.html

 

identische Inhalte zeigen. Das würde dann als doppelter Content im SEO-Sinne gewertet. Dieser Problematik begegnet man, indem man dem Bot per Tag mitteilt, welche dieser Seiten in den Suchmaschinen angezeigt und aufgerufen werden soll. Konkret sähe dies so aus:

link rel=”canonical” href=”http://www.beispiel.de”

Eine einfache und rasch umzusetzenden Lösung des Problems.

 

3. Slashs am Ende des URL

 

Dies kann so aussehen, dass diese beiden Optionen:

 

http://www.beispiel.de
http://www.beispiel.de/

 

denselben Inhalt ausliefern, bzw. das sollte sogar zwingend so sein. Hier hat Google inzwischen selbst Maßnahmen ergriffen, um diese beiden unterschiedlichen URL mit demselben Inhalt nicht als solchen doppelt zu indizieren. Um zu vermeiden, dass dies bei anderen Suchmaschinen, die noch nicht so weit sind wie Google, geschieht, sollte man hier bei einem einheitlichen Schema bei internen Verlinkungen bleiben.

 

4. Mit und ohne “www” abrufbar

 

In vielen Fällen sind Webseiten mit und ohne den Zusatz “www” erreichbar. Das kann dann so aussehen, dass

 

http://beispiel.de
http://www.beispiel.de

 

beide identische Inhalte ausliefern. Dieser Problematik wird man schnell Herr, indem man selbst festlegt, welche die bevorzugte Variante sein soll. Dies kann man entweder in der .htaccess-Datei festlegen oder Google in deren Google Search Console mitteilen. So einfach ist in diesem Fall die Lösung.

 

Als letzter Kniff gilt übrigens immer noch, dass man im Falle von nicht lösbaren Problemen bezüglich doppelter Inhalte auf einer eigenen Webseite Google mitteilen kann, welche dieser Seiten gar nicht erst indiziert werden sollen. Das löst man ganz einfach durch den Tag “noindex” und schon tauchen diese so gekennzeichneten Varianten nicht mehr im Index von Google auf.

 

Fazit und Zusammenfassung

 

Von vielen gerne vernachlässigt, ist der Punkt des DC auf den eigenen Webseiten auch heute noch einer, den man im Sinne eines guten Rankings bei den Suchmaschinen berücksichtigen sollte. Zumal all die hier genannten Maßnahmen in der Regel nur einmal, bei der grundsätzlichen Einrichtung einer Webseite, getroffen werden müssen und sie fast alle mit nur sehr wenig zeitlichem Aufwand umzusetzen sind – mit sehr positiven Effekten für die eigene Auffindbarkeit.

 

 

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Avatar for Lucie Möllerhenn
Lucie Möllerhenn

Hallo, ich bin Lucie. Ich blogge über Social Media, Gründer- und Digitalisierungs. Mein Background ist BWL mit Schwerpunkt Marketing (Hochschule Hof).

Keine Kommentare

Schreibe einen Kommentar

Kommentar
Name
E-Mail
Website

Gefällt dir, was du gelesen hast?
Dann abonniere jetzt unseren Newsletter