Duplicate Content vermeiden – die Lösung
Vor einigen Tagen habe ich in dem Artikel „Duplicate Content vermeiden – aber wie?“ einige Fragen zu diesem Thema aufgeworfen. Größtes Problem dabei war, dass ich zwei sich widersprechende Meinungen zu diesem Thema gefunden habe:
Tags und Kategorien indizieren lassen
Einige Blogger waren der Meinung, dass man Tags und Kategorien indizieren lassen soll, da sie „gut ranken“. Den Duplicate Content wollten sie dabei verhindern, indem man mit „the_excerpt“ einfach gekürzte Beiträge auf diesen Seiten anzeigen lässt. Diese Meinung fand ich ganz plausibel, da die Seiten eines bestimmten Tags bzw. einer Kategorie ja massiv guten Content zu einem bestimmten Thema enthalten, und so auch gut von Google und Co. bewertet werden.
Tags und Kategorien nicht indizieren lassen
Manche Blogger sagen, dass die Tag- und Kategorie-Seiten lieber nicht indiziert werden sollten, da sie Power von den eigentlichen Artikel-Seiten weg nehmen. Sie schlagen vor, dass man „noindex,follow“ in einem Meta Tag benutzt. Das signalisiert dem Crawler, dass er diesen Seiten zwar folgt, aber sie nicht indiziert. Diesen Standpunkt fand ich aus zwei Gründen plausibel: Die Tag- und Kategorie-Seiten bekommen fast nie Links von außen – was aber beim Ranking der Seiten ein wichtiges Kriterium ist. Man verlinkt einfach keine Kategorien oder Tags von anderen Blogs. Zum anderen ändert sich der Content der Seiten ja dauernd, da neue Artikel hinzu kommen und die älteren nach hinten rutschen.
Die Lösung Meine Lösung
Diese Fragestellung hat mir einige Kopfschmerzen bereitet – ich bin aber dennoch zu einer Entscheidung gekommen. Ich denke, dass die Argumente gegen das Indizieren stärker sind. Vor allem, weil sich der Content laufend ändert und keine Links von außen kommen.
Maßnahmen
Damit die Kategorie- und Archiv-Seiten nicht indiziert, aber trotzdem verfolgt werden, kann man den folgenden Code in die header.php Datei einfügen (am besten im „<head>“ Bereich):
<?php if (is_archive() || is_search() || ($paged > 1)) { ?>
<meta name="robots" content="noindex,follow"/>
<? } ?>
Dieses setzt „noindex,follow“ in allen Archiv Seiten (Kategorie, Autor und Datum basierte Seiten), allen Suchergebnissen und allen Seiten die weiter geblättert sind (bei $paged > 1).
Damit der Spider die Beiträge noch besser findet, kann man zusätzlich das Pagebar Plugin installieren.
Wichtiger Hinweis
Es sei hier ausdrücklich darauf hingewiesen, dass dieses nur meine persönliche Einschätzung ist. Ich bin kein professioneller SEO – kann mir also nur – mit gesundem Menschenverstand – eine eigene Meinung bilden. Ich plane dieses zu einem späteren Zeitpunkt mal zu überprüfen. Falls jemand von Euch diesen Tipp umsetzt und Änderungen in den Besucherzahlen von Google bemerkt, so würde ich mich freuen, wenn Ihr per Trackback oder Kommentar Eure Erfahrungen teilen könntet.
25. März 2007 um 12:41
hab ein Plugin dazu gefunden, welches verhindert das die Kategorie und Archivseiten indiziert werden. http://seologs.com/duplicate-content-cure/
Obwohl eine Page-Seite mit einem relevanten Keywordphrase eine gute Positionierung hat, werde ich das trotzdem mal testen.
19. April 2007 um 22:45
[…] des Duplicate Contents mithilfe von <meta name=”robots” … /> (Nachfrage ist da und […]
20. April 2007 um 13:49
„Deine“ Lösung ist gar nicht so falsch. Nach dem fast gleichen Prinzip hab ich auch das wpSEO-Plugin erweitert – so übernimmt die Software die Steuerung der Werte für META-Robots-Tag.
18. Juli 2007 um 15:19
Hi,
idealerweise solltest du auf jeden Fall noch die Feeds, vor allem aber die Kategorie bzw. Archiv und die Kommentarfeeds von der Indizierung ausschließen. Am besten natürlich per robots.txt mit:
Disallow:
*/feed/
Gruß
Fabian
04. Oktober 2007 um 19:36
Hallo, bin auch gerade am „Wordpress-Basteln“ und spekuliere über das Sperren von Kategrie und Archiv-Seiten. Wie hat sich das noindex ausgewirkt?
04. Oktober 2007 um 19:45
Ich weiss es ehrlich gesagt nicht. Um das zu analysieren habe ich nicht ausreichend große SEO Kenntnisse. eniak.INFO hat sich in letzter Zeit von den Besuchen und dem Ranking nicht besonders gut entwickelt. Das liegt aber vor Allem daran, dass ich nicht so besonders aktiv blogge. Ich halte die oben genannten Maßnahmen dennoch immernoch wür richtig.