Canonical Tag gegen doppelten Inhalt
Vor allem mit Shopsystemen hat man oft das Problem, dass Inhalte ganz unfreiwillig doppelt und dreifach veröffentlicht werden. Das ist zwar sehr ärgerlich, lässt sich aber manchmal nicht vermeiden. Es reicht schon ein Produkt in mehreren Kategorien zu haben und schon hat man doppelten Content.
Auch hier in WordPress kann man, mit der Anzeige des Archivs und anderen Content Viewer-Plugins, ganz schnell ganz viel duplizierten Inhalt erzeugen.
Es gab viel Diskusionen darüber, ob Google das nun abstraft oder nicht und in welchem Maße.
Anders als von vielen SEO “Merlins” dahergewettert, straft Google doppelten Inhalt nicht so rigeros ab wie es oft dargestellt wird, selbst wenn dieser auf verschiedenen Domains steht. In diesem Fall wird meistens die Rang höhere Domain genommen und deren DC gerankt. Problematisch wird DC bei sehr großen Seiten, wenn hier natürlich hunderttausend DC Seiten in den Index gedrückt werden, geht das nicht lange gut.
Um diesen Duplikaten aber entgegenwirken zu können, haben sich Google, Yahoo und MSN zusammengesetzt und das Canonical Tag eingeführt.
Der Canoncial Tag soll jetz mit den doppleten und dreifachen Inhalten Schluss machen, in dem er über den head Bereich eine bestimmte Seite als “die Mutter” des jeweiligen Inhalts klassifiziert.
Funktionieren soll das ganze folgendermaßen :
Man fügt in den head der Seite den Code so ein <link rel=”canonical” href=”http://www.meta-blogger.der/seo/canonical-tag” /> ein und hat somit eine Seite als Hauptseite bestimmt, so wissen die Crawler, welche URL zu den Inhalten gehört, auch wenn sie sie unter haufenweise anderen Parametern entdeckt haben.
Das funktioniert auch mit relativen Pfaden und mit anderen Domains.
CMS Systeme mit dynamischem Inhalt haben da natürlich so ihre Wehwehchen, da ja Seiten aus der Datenbank heraus und erst beim Abruf generiert werden. Es reicht natürlich keineswegs aus den canonical Tag in den head der index.php zu kopieren. Ja klingt lustig und wer macht den schon sowas, nicht lachen das ist bittere Wahrheit manche kommen wirklich auf die Idee. Ich habe selbst einige joomla und Drupal Auftritte gesehn, wo die Betreiber genau diesen Blödsin gemacht haben.
Für die CMS Systeme gibt es Plugins, die das Einbinden des Canonical Tags bewerkstelligen.
Für WordPress ist es z.B. das canonical-plugin


Und was macht man, wenn man diese Info zu spät gelesen hat und eine Joomla-Seite nun nicht mehr erreichbar ist?
Fly
Hallo Fly,
Was meinst du mit “nicht mehr erreichbar”?
Ich fände die Möglichkeit, die Sache z.B. über robots.txt zu regeln, sehr viel einfacher. Ist natürlich bei sehr großen Seiten sehr umständlich, bei kleineren Auftritten wäre es sehr sinnvoll.
Z.b. könnte man
Canonical http://meineurl.de/dieeinzigartigist.html
in die robots.txt einfügen.
Bitte nicht machen, ist ein Beispiel wie man das hätte zusätzlich besser lösen können. Ich verwende sowohl WordPress als auch Joomla, und mich nervts grad tierisch. Das bretteleben-Plugin für Joomla taugt nicht richtig, bzw. funzt nicht wirklich. Besonders wenn man viele Artikel hat. Davon, das rel-canonical-tag einfach per HTML in den Artikel einzufügen, ist abzuraten – bringt wohl nix. Ich suche wirklich verzweifelt nach einer Möglichkeit, das schnell und einfach zu regeln…
Hallo Mario,
ich habe bisher noch nirgends gesehn, dass das Cannoical Tag in der Robots.txt eingesätzt wird. Hast du dafür ein Beispiel?
Für die Umleitung von URLs gibt es eigene Befehle in der Robots.txt und sie ist ja auch nicht dafür gedacht um Angaben über Original-Content zu machen, sondern um bestimmte Bereiche zu sperren, umzuleiten oder URLs zu ändern (mod_rewrite)
Leave your response!
Kategorien
Letzte Artikel
seOpinion on Twitter
RSS FEED
Blogroll