Wie gut sind die Spam-Algorithmen von Google?
Letzte Woche hat Google ein Tool für den Chrome Browser herausgegeben, mit dem man Spamdomains in seinem eigenen, persönlichen Suchergebnis blocken kann. Auf knapp 100.000 User kommt Google in den paar Tagen schon - aber viel interessanter ist, was man dort jetzt über die Qualität der Spammeldungen herausgefunden hat...
Ich hatte ja letzte Woche schon gleich nach dem Erscheinen des neuen Toos "Personal Blocklist" von Google darüber getwittert. Gestern hat nun Google im offiziellen Blog (Quelle) ein interessantes Detail bekannt gegeben:
However, we did compare the Blocklist data we gathered with the sites identified by our algorithm, and we were very pleased that the preferences our users expressed by using the extension are well represented. If you take the top several dozen or so most-blocked domains from the Chrome extension, then this algorithmic change addresses 84% of them, which is strong independent confirmation of the user benefits.
Die Ergebnisse aus der persönlichen Blockierliste haben -wie zu erwarten war-, nicht direkt zur Spamerkennung genutzt. Aber man hat überprüft, wie stark die Meldungen der User mit den eigenen, algorithmischen Erkenntnissen bzw. "Blacklists" übereinstimmen. Und siehe da, 84% können sich wirklich sehen lassen. Bleibt zu grübeln, ob man sich nicht doch irgendwann mal aus den Usermeldungen nährt, sprich: Die dort gemeldeten Spamadressen, wenn sie häufiger und von unterschiedlichen Accounts gemeldet werden einer intensiveren, automatisierten Prüfung unterzieht. Man kann getrost auch davon ausgehen, dass man uns das nicht einfach erzählen wird. Dann käme sicher sofort die -vielleicht berechtige- Diskussion auf, dass man (sprich SEO´s und Unternehmen, die ihren Mitbewerbern billig eins auswischen wollen) hier einen starken Manipulator zur Verfügung hätte. Wir können aber weiterhin mit Sicherheit davon ausgehen, dass man sich dieser Möglichkeit bei Google durchaus bewusst ist und entsprechende Sicherheitsmaßnahmen einflechtet.
Fazit: Wer auf die Strategie "ehrlich währt am längsten" gesetzt hat, kann sich zunehmend darauf verlassen, das dies richtig war. Wenn die Algorithmen tatsächlich bereits so gut sind, dass sie mit dem Uservotum so auffällig übereinstimmen, ist Google auf den richtigen Weg. Und mit den Spamlisten der User bekommt der Suchriese irgenwann, wenn mehr und mehr dieses Plug-in nutzen, zusätzliche, wertvolle Hinweise, wo die Maschine besonders genau hinsehen sollte...
Wer sich das Blockiertool noch nicht installiert hat, kann das ganz einfach tun. Im Chrome ein leeres Tab aufmachen, dann erscheint das Symbol des "App-Stores". Dort einfach "Personal Blocklist" als Suchbegriff eingeben und es erscheint:

Nach der Installation findet man oben im Chrome dann das nachfolgend abgebildete Symbol, über das sich alle von einem selbst blockierten URLs anzeigen lässt - und Blockaden auch wieder rückgängig gemacht werden können:

Blockieren kann man ganz einfach direkt im Suchergebnis, die nach der Installation um die Zeile "Spam melden" (ein Schelm, wer bei dieser Formulierung Schlechtes denkt) ergänzt sind. (Der Screenshot ist nur beispielhaft!)

Was meinen Sie? Wird Google wohl irgendwann diese Meldungen aktiv mit einbeziehen?
Stichworte: Chrome Tools, Personal Blocklist, Spamerkennung
War der Artikel für Sie wertvoll? Hier können Sie voten:
Geschrieben von Mario Fischer am 25.02.2011
Kategorie: Aktuell, Nützliche Tools
Kommentare & Anmerkungen
zum Beitrag: »Wie gut sind die Spam-Algorithmen von Google?«,
Trackback-URL: http://www.website-boosting.de/m4/mt-tb.cgi/957
Kommentare
Hallo,
if you take the top several dozen or so? Klingt ein Bisschen zurechtgedichtet. If you take another dozen, then this algorithmic change addresses only 50% of them?
Grüße
Gretus
Wie mir scheint, besteht die Gefahr, die Möglichkeit das Domain Blocking via Chrome mit "ehrlich währt am längsten" bzw. mit der impliziten Warnung von Webseitenbetreibern vor dem Kauf (bzw. Verkauf) von Links mehr oder weniger GLEICHzusetzen. Was User blocken, werden wohl überwiegend Seiten mit miesem Content und weniger Seiten mit ordentlichem Content und (einigen) gekauften Links sein. Der Algo filtert die erste Kategorie auch sicher ganz gut raus, die zweite Kategorie m. E. wohl noch lange nicht mit 84% Erfolgsquote.
Hallo,
also ich sehe das ähnlich wie Gretus. Wenn jemand sagt dass die "top several dozen" zu 84 Prozent vom Algorithmus erkannt wurden, klingt das nicht gerade vertrauenserweckend.
Fragen die sich mir stellen:
- Wieviele verschiedene Domains wurden gemeldet?
- Wieviele "high-quality" Domains wurden gemeldet?
- Wieviel Prozent aller Spammeldungen sind die "top serveral dozen"?
Ich bin auf jeden Fall schon Mal auf die ersten Kolleteralschäden gespannt und natürlich auf Veröffentlichung der Änderung im deutschen Index.
Grüße
Valentin
Ich sehe das wie Markus. Die Auswirkungen werden maßgeblich bei low-quality sites erkennbar erkennbar werden, die eben offensichtlich lediglich aus Werbung bestehen und/oder sinnlosem Content bestehen. Außerdem denke ich, dass schon einiges an Spam-Meldungen zu Stande kommen muss, bis Google aktiv etwas gegen die entsprechen Domain tut.
Vom Aufwand her würde ich mir da eher die Frage stellen, ob ich versuchen sollte meine Konkurrenz über Spam-Meldungen zu kicken oder eher die Clickstream oder Suggest Informationen zu meinen Gunsten zu manipulieren.
"Manipulieren"... Bööözes Wort! ;-)
Warten wir mal ab, was mit dem neuen Algo alles passiert, der grade ausgerollt wird. Vielleicht sehen wir in den nächsten Wochen schon ein Abstürzen minderwertiger Seiten...
Ich selbst verwende Chrome nicht....höchsten um Darstellung von Webseiten zu prüfen. Sollte es so eine Extension für FF geben, würde ich es durchaus testen. Vom Missbrauch "feindlicher" Agenturen mal abgesehen sollte sowas schon sinnvoll sein.
Gruß
Ich habe gerade den Artikel von Danny Sullivan zu dem Update gelesen und er hat wohl heute/gestern erst ein Interview mit Matt Cutts geführt, bei dem folgende Aussage gemacht wurde:
"Cutts, in my interview with him today, made a point to say that none of the data from that tool was used to make changes that are part of the Farmer Update. However, he went on to say that of the top 50 sites that were most reported as spam by users of the tool, 84% of them were impacted by the new ranking changes."
Quelle: http://searchengineland.com/google-forecloses-on-content-farms-with-farmer-algorithm-update-66071
Das dürfte zumindest die Aussage "if you take the top several dozen or so" aus dem googleblog Artikel auf eine etwas solidere Basis stellen.
Interessanterweise sind Seiten wie Ehow.com ohne Schelte davongekommen.
Dort finden man Quali wie http://www.ehow.com/how_12320_eat-pomegranate.html :)
84% scheint mir etwas zu hochgegriffen zu sein.
Es ist ein ewiges hin und her bleiben, Google zieht nach und die Spammer hinterher - so lange es diese Form von Internetrecherche in Zukunft geben wird. Ich glaube nicht daran, dass irgendwann der Algorithmus soweit ausgeklügelt ist, dass es ein selbstläufer ist den man nur noch minimal zu seinen Gunsten beeinflussen kann.
Viele Spam Seiten haben trotzdem gute wert bei google.
Ich lese das Buch, bin ziemlich am Anfang, aber es hat mich gepackt, ich komme nicht mehr los. Ich finde es super zu lesen und informativ. Danke
Hallo Herr Fischer,
Um sofort auf die Frage zu antworten: Ja.
Und das mit ziemlicher Sicherheit.
Google hat nunmal den Anspruch die hochwertigste und für den Suchenden optimalste Suchmaschine anzubieten.
Und über Jahre verteidigt Sie diese Stellung schon. Außerdem erinnere ich mich noch sehr gut an die Diskussion um den Chrome-Browser und dem Vorwurf es sei ein weiters "Analyse-Instrument" um weitere Informationen zu bekommen.
Was funktioniert denn Besetzer, als den User selbst mit einzubinden? Niemand mag Spam, also wird dieser Filter auch gerne genutzt werden, ebenso wie z.B. der Flashblocker für den Firefox.
Interessanter weise habe ich jetzt zum ersten Mal darüber nachgedacht, auch mal den Chrome auszuprobieren, bisland natürlich Firefox nutzer, sowieso schon allein, weil ich Publisher bin.
Mal sehen...
Mfg
Mario Burgard
Ach - und morgen wird eine neue Sau durchs Dorf getrieben ;) Nur keine Panik!
Ich denke mal, es handelt sich um einen prinzipiellen Testballon, um zu erfahren wie viel Prozent der abgegebenen Votings "ehrlich" respektive "vertrauenswürdig" sind. Das Ganze gleicht man dann mit den "Spam melden"-Ergebnissen der Webmastertools ab, und weiß dann, ob man sich das wirklich antun soll, bzw. dass derartige Ideen zu nichts führen.
So ein negatives oder positives Voting ist ja noch einfacher zu manipulieren, als Links ;-) Also, wenn die ein bisschen Hirn haben, werden sie diesen Unsinn sicherlich nicht fürs Ranking hernehmen, sondern damit einfach mal wieder ein wenig SEO-Szenenwirbel verursachen.
Und als SEO bei anderen SEOs Spam erkennen (in welcher Art und Weise auch immer), ist sicherlich kein Act... soll heissen "negativ sind immer die Wettbewerber" ... und das nicht nur in der SEO-Szene. Für mich sind solche Maßnahmen eher ein Armutszeugnis, denn was die nicht selber können (nämlich alle SEO Maßnahmen zuverlässig detektieren), dabei sollen nun die Neider und Wettbewerber helfen.
Mit viel Glück gelingt es dadurch vielleicht, einige wirkliche Schundseiten aus dem Index zu verbannen, mehr aber auch nicht. Im Erschließen von neuen Informationsquellen war Google schon immer recht innovativ.
Ich denke das das alles nicht viel Nutzen bringt. Es ist wie ein Wettrüsten! Findet Google einen guten Algorithmus stellen sich die Leute drauf ein - und fangen an neue Sachen zu produzieren... Dann findet Google wieder was dagegen und die leute machen die nächste Sache! MfG
Die Meldung von Google ist wirklich lustig. Als würden die zugeben, wenn ihr Algorithmus nichts taugt ;-).
Bei dieser Geschichte besteht natürlich immer die Gefahr d.auch Mitbewerber von dieser Funktion gebrauch machen, was üerspektivisch gesehen alles andere als Vorteilhaft wäre.
Der Anti-Spam Kampf (so er denn wirklich stattfindet) ist einfach nur als erfolglos zu bezeichnen.
Man sehe sich Domains wie z.B. whosaliveandwhosdead.com an - sicher sehr oft gemeldet, eindeutig regelwidrig und trotzdem mit Top-Ranking. Wenn es ein kleiner Spammer wäre, OK, sowas kann durchrutschen. Aber ein solches Kaliber?
Nein, ich glaube wirklich, Google meint es mit dem Bekämpfen von Spam nicht wirklich ernst. Schade.
Was User blocken, werden wohl überwiegend Seiten mit miesem Content und weniger Seiten mit ordentlichem Content und (einigen) gekauften Links sein.
Der Otto-Normal-Verbraucher weiß doch gar nicht, ob Links gekauft sind, oder dass so etwas bei google verboten ist. Zudem müsste er selbst dann ja noch prüfen, ob nen nofollow bei diesen Links gesetzt ist.
Die Geschichte ist rein subjektiv und die User sind da egoistisch und packen die Seiten in die Blacklist, die se für mies erachten, sei es nun wegen einer hässlichen Aufmachung, weil se die Seite politisch unkorrekt finden, oder wegen eines nichtssagenden, schlechten Content...
Die Frage ist doch, wie nachhaltig man erfolgeich sein möchte. Betreibt man ein seriöses Geschäft sollte man nicht versuchen Google bzw. die SERPs zu beeinflussen. Mit Geduld, Wissen und Fleiss (regelmäßig aktueller Content) kommt der Erfolg von allein.
Will man stattdessen kurzfristig abzocken, kann man eine Abstrafung in Kauf nehmen. Bevor google einen rausschmeist sind meistens schon genug Warnungen in relevanten Blogs und man muss sich eine neue Seite basteln.
Auch wenn das hier recht "flapsig" beschrieben ist, hoffe ich, dass der Beitrag verständlich war.
Erfolg ist immer relativ die Seo "Industrie" ist doch wohl eher auch da, das Ganze ggf. zu beschleunigen. Bei richtigem Ansatz der Maßnahmen (alles natürlich, nichts übertreiben obs Linkbuilding, Bookmarks oder aber Content sind), sind die Ergebnisse besser als wenn ein Projekt vor sich eine Weile hindümpelt.
Zum Spam Button:
Die Frage ist für mich inwiefern der Button dann auch zu Missbrauch führt. Welche Konkurrenz klickt nicht ab und zu mal gerne auf die sündhaft teuren Adwords Anzeigen Ihrer Konkurrenten. (ich mache sowas nicht). Erotik Seiten könnten dann sehr oft als Spam markiert werden, allein aus Zorn von Eltern. Fliegen die dann aus dem System :) ???
"Wer auf die Strategie "ehrlich währt am längsten" gesetzt hat, kann sich zunehmend darauf verlassen, das dies richtig war."
Da bin Ich mir eigentlich nicht so sicher. Zumindest vorläufig noch nicht. Es weden noch immer Links verkauft, artikel gesponnen und automatische Spamlinks gemacht und noch immer mit Erfolg. Wer sich an die Regeln hält ist dann im Nachteil und wird von Seiten mit massenhaft Spamlinks überholt. Google stellt Regeln auf, kann die Einhaltung dieser Regeln jedoch nicht erzwingen.
Naja, es ist wenigstens ein Anfang. Bleibt zu hoffen das die ganzen dummen Spammer und Content klauer irgendwann mal verschwinden....
Die nerven einen doch nur noch und haben absolut keine daseinsberechtigung mehr.
Für solche Seiten wünsch ich mir die virtuelle todesstrafe um das mal ganz krass auszudrücken.
Das spricht Maria ein heikles Thema an. Man könnte den Wettbewerb benachtzeiligen indem man für ihn spammt.
Scheint nett Version sein und ich werde es nutzen viele Zeit in der Zukunft.
Es ist ein nettes Feature! Ich bin froh, ein Mitglied dieser Gemeinschaft zu sein!
Hallo alle zusamen:-) Ich glaube Google wird diese Erkentnisse über Benutzerverhalten für sich und die Suchergebnisse übernehmen. Mit welchen Folgen auch immer...wir werden sehen.








Hm, dann sehen wir ja bald keinen einzigen Preisvergleich mehr in der Serps :) . Denn ich möchte nicht wissen was die großen Plattformen so im Monat für Linkmieten/käufe so ausgeben. Ein weiteres Gebiet wäre dann aus meiner sicht der Versicherungs,- Kredit und Pokermarkt wo sich dann die Serps massiv verändern müssten. Aber ich denke mal das es hier auch wieder in der Regel den kleinen Shopbetreiber treffen wird der irgendwo im Web für 100€ im Monat sich Links gemietet hat.