Duplicate Content vermeiden – aber wie?

Durch den Beitrag „Wordpress SEO – let’s do it all again“ bin ich auf das Problem des Duplicate Content aufmerksam geworden.

Was ist Duplicate Content eigentlich?
Google versucht bei der Anzeige seiner Suchergebnisse (SERPs) keine doppelten Einträge anzuzeigen. Das macht Google, indem es den doppelten Content (Duplicate Content) ausfiltert. Ein Blog sollte also aus SEO Sicht versuchen so wenig Duplicate Content wie möglich zu liefern.

Auch wenn Google Blogs aufgrund ihrer Verlinkung mag, so sollte jeder SEO immer darauf achten sowenig Müll wie möglich für Google zu produzieren. Als Müll bezeichne ich alle Seiten die keinen unique Content enthalten. Aber auch die einzelnen Seiten sollten nur soviel Müll wie nötig enthalten. (Quelle: Ehl&Ing Blog)

Dass der Duplicate Content tatsächlich zu massiven Problemen mit Google führen kann, sieht man auch bei dem Beitrag „wenn Google einen nicht mehr mag“.

Was hat das jetzt mit mir zu tun?
Durch das Archiv, die Kategorien und auch durch die Tags (Simple Tagging Plugin) wird massiver Duplicate Content geschaffen. Jeder Beitrag ist also über mehrere verschiedene URLs erreichbar. Außerdem kommt noch der RSS Feed dazu. Erschwerend kommt noch hinzu, dass dieses Blog über http://eniak.info/ und über http://www.eniak.info/ erreichbar ist. Also alles noch mal „mal zwei“.

Problem erkannt, Lösung fehlt.
Durch die Vielzahl der Beiträge zu diesem Thema bin ich total verwirrt. Da list man die unterschiedlichsten Tipps. Einige empfehlen, die Seiten (Archiv, Kategogien, Tags…) nicht indizieren zu lassen. Entweder über die robots.txt, oder ein Meta-Tag mit „noindex,follow“. Andere empfehlen ein „Search Engine Management“ Plugin. Gegen das „http://www“ Problem sollen zwei Einträge in der .htaccess Datei helfen. Den eigenen RSS Feed könnte man per nofollow oder auch per robots.txt aussperren.

Was mich daran am meisten verwirrt
ist, dass sich fast niemand an diese Tipps zu halten scheint. Oft realisieren die Blogs ihre eigenen Tipps nicht. Auch die SEO Blogs in meiner Nachbarschaft scheinen dieses nicht umgesetzt zu haben. Was also ist nun zu tun?

  • Alle Seiten mit tag, category und feed nicht indizieren lassen?
    • per Meta-Tag?
    • per robots.txt?
  • Umleitung per .htaccess von http://eniak.info/ auf http://www.eniak.info/ ?
  • Das Search Enigine Plugin installieren?

Oder ist alles Blödsinn und nichts von allem ist nötig?
Vielleicht kann ja einer der SEOs dort draußen in der Blogsphäre per Trackback helfen diese Verwirrung aufzulösen?

11 Antworten zu “Duplicate Content vermeiden – aber wie?”

  1. Max sagt:

    - www oder kein www: Einfach bei Google Sitemaps festlegen :-)
    - Archiv-Pages: Ich würd‘ den Metatag „noindex, follow“ setzen
    - Tags: Das Simple Tagging Plugin verwende ich auf einem Blog auch, da hat er mir aus ca. 1200 Seiten etwa über ne halbe Million gemacht. Mal schauen wie sich das auswirkt. Statt bei den Tags jedoch den ganzen Beitrag anzuzeigen, sollte man nur den Auszug ausliefern lassen.
    - den feed sollte man vllt wirklich für google verbieten, da dieser manchmal vor dem eigentlichen Beitrag auftaucht

  2. Philip May sagt:

    Hallo Max!

    Danke für die Antwort!

    Wie hast Du das Meta Tag gesetzt? Hast Du da mit PHP ein IF … ELSE drumgebaut?

    Sollte man nicht für die Tag Seiten auch ein „noindex, follow“ einbauen?

  3. Max sagt:

    Da gibt’s soweit ich weiß ein Plugin für. Mit PHP kenn ich mich selber nicht so gut aus … Ansonsten musst Du halt nur in die Sidebar schauen, dort werden bestimmte Sachen ja auch nur angezeigt, wenn es sich um Archive handelt, den entsprechenden Code einfach kopieren.

    Bei den Tags lasse ich die Seiten schon indexieren, die bringen dann doch recht viele Besucher. Aber halt wie gesagt nicht den ganzen Beitrag sondern nur den Ausschnitt anzeigen lassen. Dazu muss in dem Template die Funktion the_content mit the_excerpt ersetzt werden. Auf der Plugin Seite ist dies in einem Comment beschrieben.

  4. Philip May sagt:

    Ahh ok … vielen Dank Max!

    PS: Deine Antworten landen wegen Deiner trashmail.net E-Mail Adresse leider immer im Spam.

  5. […] Duplicate Content vermeiden – aber wie? […]

  6. […] einigen Tagen habe ich in dem Artikel „Duplicate Content vermeiden – aber wie?“ einige Fragen zu diesem Thema aufgeworfen. Größtes Problem dabei war, dass ich […]

  7. 2wid sagt:

    Ich versuche auch duplicate content zu vermeiden. Bei uns kann man auch http://www.2wid.net als auch http://2wid.net eingeben, landet dann aber immer bei http://www.2wid.net . Dies funktioniert über z.B. die .htaccess Datei beim apache webserver oder direkt in der httpd.conf Datei. Für letztere benötigt man meist mehr Rechte auf dem Server.

    Mehr zu Redirects auch unter:
    http://www.tinyweb.de/local/redirect.html

  8. hab ein Plugin gefunden welches Google anweist die Wordpress Kategorien und Archiv Seiten nicht zu indizieren. Das hilft schon mal DC zu vermeiden.

  9. […] dumm ist. Und faul. Zweimal das selbe zu lesen, ödet Google an. Und straft so etwas als “duplicate content” ab. Das ist ja im Prinzip ok, denn man muss bei Google ja nicht alles doppelt […]

  10. […] eniak.info: Duplicate Content vermeiden – aber wie? […]

  11. […] und Tagclouds aus SEO Sicht sind – nicht zuletzt wegen der Problematik des (internen) doppelten Contents – seit langem heiss diskutiert und nicht immer unumstritten. Für den Besucher hingegen […]

Eine Antwort hinterlassen