Fressen Spammer Sitemaps?
Anscheinend. Glaubt man Berichten einiger Webmaster, sind ihre Seiten kurz nach der Verwendung von sog. Sitemaps aus dem Google-Index geflogen. Grund genug, ernsthaft darüber nachzudenken...
Was sind Sitemaps überhaupt? Kurz gesagt steckt eine Idee der großen Suchmaschinen dahinter, die uns damit die Möglichkeit geben, über eine Seite im maschinenlesbaren Format (XML) unsere Seitenstruktur "mitzuteilen". Diese XML-Datei enthält also neben ein paar anderen Daten vor allen alle Adressen aller einzelnen Seiten eines Webauftritts.
Dieses maschinenlesbare Dokument darf übrigens nicht verwechselt werden mit der "Sitemap", die einige Webauftritte zur besseren Orientierung für Besucher als Link auf der Startseite vorhalten.
Noch mal vorweg, weil es immer wieder gefragt und vermutet wird: Nein, für das Ranking selbst hat das Einstellen einer solchen Sitemap keinerlei Einfluss. Wohl aber auf die "Findbarkeit" von Webseiten, die über geflashte Inhalte (fragen Sie lieber nicht... ;-) oder z. B. Javascript-Navigation nicht unmittelbar für die Robots findbar sind.
Eine gute Sache also.
Warum donnert es dann plötzlich Seiten aus dem Index, die solche Sitemaps einsetzen? Bestrafen die Suchmaschinen die Webmaster nun plötzlich wieder? Sie hatten doch mit dem Zeug angefangen?
Nein - keineswegs. Es schnuchteln aber eben nicht nur die Robots der Suchmaschinen im Web umher, sondern auch die bösen Spammer. Sie ahnen es sicher schon. Genau diese Bösewichte suchen nun gezielt nach der Sitemapdatei (sie liegt immer im Rootverzeichnis, also z. B. http://www.ihre-website.de/sitemap.xml.gz) und lesen diese aus. Danach werden alle Seiten gezogen und auf eigene Spamwebseiten kopiert.
Sind diese Spamsites genügend bedeutend (mehr als Ihre Site reicht), dann entscheidet sich Google möglicherweise dazu, die nun doppelten Inhalte zu filtern, die Duplikate zu unterdrücken und nur noch eine Seite anzuzeigen. Alle Contentkopien verschwinden im sogennanten Supplemental Index. Findet G., dass die Spamseite irgenwie besser ist als Ihre (und daran arbeiten die Spammer mit Hochdruck - sonst macht es keinen Sinn!), "fliegen" Sie eben einfach raus.
Können die Spammer Ihre Seite auch ohne xml-Sitemap auslesen? Klar. Das ist aber deutlich komplizierter und dauert länger. Die Sitemap-Datei liegt ja quasi auf dem Silbertablett. Es ist wie bei der Auto-Mafia. Stehen zwei gleichwertige Fahrzeuge nebeneinander und eines hat eine Alarmanlage... Bleibt letzteres mit etwas Glück unversehrt stehen.
Ein kleiner Trick kann natürlich darin bestehen, die Sitemap einzustellen und nach dem sie von den großen Suchmaschinen geslurpt (nein, das ist kein Fachbegriff, das kommt aus der Eis-Ess-Szene) wurde, sie einfach wieder rausnehmen.
Wo können Sie sehen, ob Sie vielleicht schon frech kopiert wurden?
Am besten bei copyscape.com. Geben sie dort in den Suchschlitz einfach Ihre Domainadresse ein.
Und über Sitemaps und das Protokoll können Sie sich direkt hier bei Tante G. schlau machen.
Falls Sie das jetzt überhaupt noch einsetzen wollen...
Stichworte: Sitemaps
War der Artikel für Sie wertvoll? Wollen Sie den Beitrag als Bookmark merken?
Einfach RSS-Feed abonnieren oder das Lesezeichen mit anderen Lesern teilen:
Geschrieben von Mario Fischer am 15.05.2007 | Kategorie: Stolperfallen
Kommentare & Anmerkungen
zum Beitrag: »Fressen Spammer Sitemaps?«,
Trackback-URL: http://www.website-boosting.de/m4/mt-tb.cgi/889
Kommentare
Na wenigstens nutzen die sitemaps irgendwem :-) Wozu sollen die denn gut sein? Seiten, die die Bots ohne XML-sitemap nicht finden werden eh nicht ranken, wozu also Bot-Ressourcen daran verschwenden?
Und Google-Webmastertools lässt sich auch ohne Sitemap nutzen...
@ m-h-e-r:
Exakt! Über einen xml-Sitemap werden nur alle Seiten vom Robot gefunden - was aber für das Ranking und damit für suchende Menschen in der Regel überhaupt nichts bringt. Lediglich im "Long-Tail" Bereich, wo mit mehreren Begriffen gesucht wird und Google nur sehr wenige Treffer liefert, hat das Auswirkungen.








Da tut z.B. Bot-Trap seinen Dienst, um sowas zu verhindern: http://www.spider-trap.de/ oder http://www.bot-trap.de/