|
Die Google-Suche und Suchmaschinen-Spam |
Im Januar machten einige Storys über die Suchqualität bei Google die Runde. Solltet ihr in letzter Zeit einige dieser Artikel gelesen haben, fragt ihr euch vielleicht, ob die Suchqualität wirklich schlechter geworden ist. Kurz gesagt: Gemäß den Beurteilungsmetriken, die wir seit über zehn Jahren stetig verfeinert haben, ist die Suchqualität bei Google hinsichtlich der Relevanz, Aktualität und des Umfangs derzeit besser denn je. Der Spam in englischer Sprache in den Google-Suchergebnissen hat sich in den letzten fünf Jahren mehr als halbiert und in den meisten anderen Sprachen liegt der Spam-Anteil noch unter dem englischen. In den letzten Monaten verzeichneten wir leider einen leichten Anstieg des Spams. Als Reaktion darauf haben wir neue Maßnahmen eingeleitet, um unsere Suchqualität weiter zu verbessern.
Zur Erläuterung: Unter Web-Spam versteht man Junk-Einträge in den Suchergebnissen, mit denen Websites versuchen, sich höhere Positionierungen in Suchergebnissen zu erschleichen, oder auf sonstige Weise gegen die Qualitätsrichtlinien von Suchmaschinen verstoßen. Vor zehn Jahren war die Spam-Situation so schlecht, dass Suchmaschinen regelmäßig irrelevanten Web-Spam für zahlreiche verschiedene Suchanfragen wiedergaben. Google hat diese Art von "reinem Web-Spam" größtenteils erfolgreich bekämpft, obwohl einige Spammer mittlerweile auf noch raffiniertere und sogar illegale Taktiken wie das Hacken von Websites umgestiegen sind.
In den letzten Monaten haben wir sowohl den Umfang als auch die Aktualität unserer Ergebnisse erweitert und dabei sowohl sehr viel nützliche Inhalte als auch einen gewissen Spam-Anteil indexiert. Um dem Spam entgegenzutreten, haben wir vor Kurzem eine umgestaltete Klassifizierung auf Dokumentebene eingeführt, die es Spam-Inhalten auf einzelnen Webseiten erschwert, hohe Rankings zu erzielen. Die neue Klassifizierung kann Spam auf einzelnen Webseiten besser erkennen, z. B. Spam aus sich wiederholenden Wörtern oder Wortgruppen, die man häufig in automatisch erstellten Junk-Blog-Kommentaren findet. Darüber hinaus haben wir unsere Möglichkeiten zur Erkennung gehackter Websites entscheidend verbessert. Gehackte Websites waren im Jahr 2010 eine der größten Spam-Quellen. Außerdem evaluieren wir derzeit mehrere Veränderungen, mit denen der Spam-Anteil noch weiter reduziert werden kann. Eine der Maßnahmen zielt in erster Linie auf Websites ab, die die Inhalte von anderen kopieren und wenig Original-Inhalte enthalten. Wir entwickeln derzeit auch neue Möglichkeiten für Nutzer, um genaueres Feedback zu Spam-Websites oder qualitativ minderwertigen Websites zu geben.
Da der "reine Web-Spam" insgesamt eher zurückgegangen ist, hat sich die Aufmerksamkeit auf "Content-Farmen" verlagert. Hierbei handelt es sich um Websites, mit fragwürdigen oder qualitativ minderwertigen Inhalten. 2010 haben wir zwei größere Algorithmusänderungen eingeführt, die hauptsächlich Websites von geringer Qualität betrafen. Dennoch erhalten wir eindeutiges Feedback aus dem Web: Die Nutzer wünschen sich noch drastischere Maßnahmen gegen Content-Farmen und Websites, die in erster Linie aus Spam-Inhalten und Inhalten von geringer Qualität bestehen. Wir sind stolz auf die Google-Suche und unser Ziel ist es, dass jede Suchanfrage perfekte Ergebnisse liefert. Leider sind wir nicht ganz perfekt und in Kombination mit den haushohen Erwartungen, die an Google gestellt werden, erscheinen diese Unzulänglichkeiten größer, als sie in Wirklichkeit sind. Dennoch: Wir können es besser und müssen auch besser werden.
In den letzten Wochen kam auch das Gerücht auf, dass Google nicht gegen Spam-Inhalte in unserem Index vorgehen würde, wenn auf diesen Websites Google-Anzeigen geschaltet sind. Wir möchten Folgendes klarstellen:
- Google geht mit aller Entschiedenheit gegen Websites vor, die gegen unsere Qualitätsrichtlinien verstoßen, egal, ob dort Google-Anzeigen zu sehen sind oder nicht.
- Durch das Einblenden von Google-Anzeigen erhält eine Website kein höheres Ranking bei Google.
- Der Kauf von Google-Anzeigen führt nicht zu einem höheren Ranking der Website in den Google-Suchergebnissen.
Obwohl wir schon immer nach diesen Grundsätze verfahren, möchten wir an dieser Stelle noch einmal betonen, dass sie immer noch gelten.
Die Nutzer sind aber sehr an Google interessiert und teilen uns - zum Teil sehr leidenschaftlich - mit, was wir verbessern sollten. Dieses Feedback ist uns sehr wichtig. In Kombination mit unseren eigenen wissenschaftlichen Auswertungen können wir anhand des Nutzer-Feedbacks alle Möglichkeiten für mögliche Verbesserungen ausloten. Bitte teilt uns im Websuche-Forum mit, was wir besser machen können. Wir werden auch in Zukunft für hohe Qualität bei Google sorgen.
Google search and search engine spam (English version)
Post von Matt Cutts, Principal Engineer (Veröffentlichung von Jörg Pacher, Search Quality Strategist)
... weiterlesen |
|
|
Welche SEO-Fehlinformationen gibt es? |
Heute klärt Matt Cutts einige Missverständnisse, die bezüglich Google und SEO kursieren, und geht dabei auf Links und nofollow, Meta-Tags und das Google Webspam-Team näher ein.
Die heutige Frage kommt von Tom S. aus Seattle und lautet : "Nenne fünf Beispiele für falsche SEO-Informationen aus dem letzten Jahr, die aus seriösen Quellen stammen und dich an den Rand der Verzweiflung brachten. Du musst keine Namen nennen."
Okay. Mir fallen mindestens zwei Beispiele ein, denen ich noch weitere Trugschlüsse hinzufügen möchte. Am meisten kopfschütteln musste ich bei der Meinung, dass die Links automatisch zählen, wenn sich Kunden bei negativen Erfahrungen auf entsprechenden Websites beschweren. Diese Idee ist gefährlich: Je schlechter man seine Kunden behandelt, desto mehr Links erhält man und desto höher das Ranking bei Google. Das ist ganz eindeutig ein Trugschluss. Thor von getsatisfaction.com schrieb in einem Blog, dass diese Links ein "nofollow"-Attribut erhalten. Der "nofollow"-Mechanismus weist darauf hin, dass man diesen Link zu einem Drittanbieter nicht unbedingt befürwortet. Man kann damit also sagen: Auch wenn dies eine namhafte Website ist, vertrauen wir diesem "nofollow"-Link nicht unbedingt. Wir überspringen sie in unserem Link-Graph, damit sie keine Rolle beim Ranking spielt. Durch diesen Link fließt kein Ankertext. Daher hat keine der Beschwerde-Websites zu den Such-Rankings einer bestimmten Website beigetragen.
Ein weiterer Trugschluss ist, dass das Google-Webspam-Team dieses Jahr etwas nachlässiger sei. Nur weil manche SEOs nicht sehen, an was das Webspam-Team arbeitet, heißt das nicht, dass wir nicht aktiv sind. Eine der größten Herausforderungen im Jahr 2010 waren gehackte Websites. Es gibt viele Leute da draußen, die im Grunde illegale Aktivitäten tätigen. Manche versuchen, Websites zu hacken und eigene Links einzufügen, oder Malware, Viren und Trojaner zu verbreiten. Auf diese bösartigen Aktivitäten wollten wir uns konzentrieren und diese verhindern. Daran mussten viele Mitarbeiter mehrere Monate arbeiten und andere Veränderungen wurden nicht so richtig wahrgenommen. Solange wir gegen gehackte Spam-Websites vorgehen, sieht man vom normalen Kampf gegen Spam vielleicht nicht mehr viel. Die meisten Veränderungen wegen gehackter Websites sind mittlerweile eingeführt, sodass wir uns wieder dem normalen Web-Spam zuwenden können.
Ein weiterer Trugschluss ist, dass nur Links zählen. Manch einer denkt: "Ich brauche nur Links und sonst gar nichts." Guter Inhalt auf der Website spielt aber auch eine Rolle. Baut also nicht nur auf Links. Achtet auch auf die Architektur eurer Website, ihre Crawlbarkeit, wie gut durchsuchbar sie ist, ob ihr gute interne Links habt, ob die Begriffe auf eurer Seite stehen, nach denen die Nutzer wirklich suchen. All das ist wirklich wichtig.
Ein spezieller Trugschluss, auf den ich hinweisen will, ist, dass das Meta-Tag der Keywords im Such-Ranking von Google irgendeine Rolle spielen würde. Tut es einfach nicht. Wir verwenden das Meta-Keywords-Tag nicht.
Außerdem höre ich immer wieder, dass das Web-Spam-Team entweder nur mit Algorithmen oder nur manuell arbeitet. Wir behalten uns vor, Websites manuell zu entfernen, wenn wir Spam oder andere Probleme feststellen. Wir haben ein manuelles Team in vielen Sprachen auf der ganzen Welt. Wir sind stolz auf dieses Team, das tolle Arbeit leistet. Auch die anderen großen Suchmaschinen haben ein Team, das manuell nach Spam sucht. Die Teams entfernen nicht nur Spam, sondern geben auch Übungsdaten an Entwickler weiter, die an der Spam-Bekämpfung arbeiten. Es sind also nicht nur Entwickler und es sind nicht nur manuelle Prüfer, die sich mit Spam-Meldungen beschäftigen. Mit einer Kombination aus diesen beiden geht Google gegen Web-Spam vor.
Das waren also ein paar Dinge, die ich gerne richtigstellen wollte.
Veröffentlicht von Daniela Loesser, Search Quality Team
... weiterlesen |
|
Tipps zu Brancheinträgen in Google Places - Hilfreiche Beschreibungen und relevante Kategorien erstellen |
Mit diesem Blogpost möchten wir unsere dreiteilige Serie zu den Google Places-Qualitätsrichtlinien abschließen. Wir möchten heute darüber sprechen, wie ihr relevante Kategorien für euren Brancheneintrag auswählen und eine hilfreiche Beschreibung erstellen könnt. Für den Fall, dass ihr die ersten beiden Blogposts noch nicht gelesen habt: Hier ist der erste Post über Titel von Brancheneinträgen und hier der zweite über Businesstypen.
Erstellt eine hilfreiche Beschreibung
Wir empfehlen euch als Geschäftsinhaber oder Dienstleister zusätzliche Information zu eurer Firma in eurem Brancheneintrag hinzuzufügen. Ihr könnt dies tun, indem ihr im Feld ‘Beschreibung’ eine spezifische Beschreibung erstellt, die euren potenziellen Kunden einen besseren Überblick über euer Unternehmen und eure Produkte und Dienste verschafft. Zudem könnt ihr hier auch weitere Hinweise zum Standort eurer Firma angeben - dies kann eventuell hilfreich sein, wenn euer Geschäft schwierig zu finden ist, beispielsweise, weil es nur über einen Seiteneingang zugänglich ist.
Achtet darauf, die Beschreibung klar und einfach zu halten, damit sie für Nutzer hilfreich ist. Viele Wiederholungen von Keywords oder Kategorien können euren potenziellen Kunden eher negativ auffallen - eine kurze und treffende Zusammenfassung der von euch angebotenen Dienste kann Nutzern dagegen weitere Orientierung geben.

Wählt relevante Kategorien aus
Es ist wichtig, Kategorien sorgfältig auszuwählen - sie sollten zutreffend und akkurat sein, damit euer Eintrag mit relevanten Suchanfragen verknüpft wird. Wählt anstelle von allgemeinen Kategorien eher spezifische Kategorien, die euer Kerngeschäft gut beschreiben. Eine gute Methode um repräsentative Kategorien für euren Eintrag zu finden, ist es, euch selbst die Frage zu stellen: ‘Was ist meine Firma?’. Achtet darauf, dass ihr das erfasst, was euer Geschäft tatsächlich ist und nicht was ihr anbietet oder verkauft - demnach wäre “Bäckerei” eine gute Kategorie im Gegensatz zu “Kuchen” oder “Brot”.
Ihr solltet zudem auch keine standortbezogenen Angaben im Kategorie-Feld unterbringen. Für zusätzliche Information dieser Art könnt ihr das Feld ‘Beschreibung’ verwenden und, falls angebracht, auch die Funktion Einzugsgebiete nutzen.
Ihr werdet aufgefordert, mindestens die erste Kategorie aus der Liste unserer Standard-Kategorien auszuwählen - sobald ihr anfangt, im Kategorien-Feld zu tippen, werden euch automatisch erhältliche Kategorien vorgeschlagen.
 Wir empfehlen euch, dass ihr die am besten zutreffende und die zugleich spezifischste Kategorie für euren Eintrag auswählt - für jede speziellere Kategorie kann Google die allgemeinere Kategorie automatisch bestimmen. Das heißt, wenn ihr ein mexikanisches Restaurant habt, dann solltet ihr “Mexikanisches Restaurant” auswählen anstelle von nur “Restaurant” - Google weiß dann automatisch, dass ein mexikanisches Restaurant auch unter den breiteren Begriff Restaurant fällt.
Ihr könnt insgesamt bis zu fünf Kategorien eingeben. Um eine weitere Kategorie hinzuzufügen, klickt einfach auf ‘Weitere Kategorie hinzufügen’ und ihr erhaltet ein zusätzliches Eintragsfeld. Beschränkt euren Eintrag auf genau eine Kategorie pro Kategorie-Feld. Mehr als eine Kategorie pro Feld einzugeben verstößt gegen unsere Qualitätsrichtlinien und kann dazu führen, dass euer Eintrag gesperrt wird und nicht in Google Maps erscheint. Solltet ihr keine exakt zutreffende Standard-Kategorie finden, dann wählt einfach eine Kategorie aus, die euer Geschäft am besten beschreibt und fügt dann spezifischere, selbstgewählte Kategorien hinzu. Solltet ihr unsicher sein, wie ihr euer Geschäft am besten kategorisiert, dann könnt ihr auch in unserem Google Maps-Hilfeforum mit anderen Geschäftsinhabern diskutieren und dort Tipps erhalten.
 Wir hoffen, dass euch diese Information dabei hilft, treffende Kategorien auszuwählen und klare Beschreibungen für euren Brancheneintrag in Google Places zu erstellen. Falls ihr weitere Fragen habt, dann besucht auch gerne unser Google Maps-Hilfeforum.
Post von Sabine Borsay (Consumer Operations) und Claudia Pfalzer (Local Search Quality)
... weiterlesen |
|
Umgang mit der geplanten Downtime einer Website |
Hin und wieder bekommen wir die Frage gestellt, ob die Sichtbarkeit einer Website in den Suchergebnissen von Google negativ beeinflusst werden kann, wenn eine Site nicht erreichbar ist und der Googlebot vergeblich versucht diese zu crawlen. Manchmal sind Ausfallzeiten unvermeidlich: ein Webmaster könnte die Website vom Netz nehmen, um notwendige Wartungsarbeiten aufgrund rechtlicher oder kultureller Anforderungen durchzuführen. Geplante Ausfallzeiten, die nicht eindeutig als solche gekennzeichnet sind, können durchaus die Reputation einer Website negativ beeinträchtigen. Wir können das Crawlen, die Indexierung und das Ranking zwar nicht garantieren, es gibt aber Vorgehensweisen mit geplannten Ausfallzeiten umzugehen, ohne die Sichtbarkeit in den Suchergebnissen negativ zu beeinflussen.
Anstatt den HTTP-Statuscode 404 (nicht gefunden) zurückzugeben oder eine Fehlerseite mit dem Statuscode 200 (OK) anzuzeigen, ist es beispielsweise besser, den HTTP-Statuscode 503 (Service nicht verfügbar) zu verwenden. Dieser teilt Suchmaschinen-Crawlern mit, dass es sich um eine temporäre Downtime handelt. Des Weiteren haben Webmaster die Möglichkeit, Besuchern und Suchmaschinen-Crawlern ein voraussichtliches Datum mitzuteilen, an dem die Website wieder erreichbar ist. Hierbei kann ein optionales “Retry-After”-Header-Feld definiert werden, falls die sekundengenaue Dauer der Ausfallzeit oder das geschätzte Datum der erneuten Erreichbarkeit der Website bekannt sind. Der Googlebot kann diese Information dann ggf. verwenden, um den Zeitpunkt des erneuten Crawlens der URL zu bestimmen.
Die Rückgabe des Statuscodes 503 ist auch in einigen anderen Situationen sinnvoll. Wir begegnen häufig Problemen mit Websites, die den Statuscode 200 (OK) bei Serverproblemen, Ausfallzeiten, Bandbreitenüberschreitungen oder bei temporär nicht erreichbaren Websites (“Under Construction”) zurückgeben. Die Rückgabe des Statuscode 503 ist dabei die beste Lösung in allen zuvor genannten Situationen. Genauso wie bei geplanten Ausfallzeiten z. B. im Falle einer Hardwarewartung, ist es empfehlenswert einen zusätzlichen Server einzusetzen, welcher den Statuscode 503 zurückgibt. Jedoch ist es wichtig, dass der 503-Statuscode nicht als permanente Lösung eingesetzt wird: der langandauernde Einsatz kann ein Anzeichen dafür sein, dass eine URL dauerhaft nicht erreichbar ist und deshalb möglicherweise aus dem Google-Index entfernt wird.
header('HTTP/1.1 503 Service Temporarily Unavailable'); header('Retry-After: Sat, 8 Oct 2011 18:27:00 GMT'); Beispiel für 503 (Service nicht erreichbar) Serverantwort beim Einsatz von PHP Ähnlich wie beim Erstellen nützlicher 404-Seiten, ist es auch empfehlenswert eine individuelle 503-Fehlerseite bereitzustellen, die Benutzern die aktuelle Situation erklärt und darüber informiert, zu welchem Zeitpunkt die Site wieder erreichbar sein wird. Weitere Informationen bezüglich HTTP-Statuscodes findet ihr hier (Englisch): RFC 2616.
Veröffentlicht von Tomer Honen und Kaspar Szymanski, Search Quality Team, Dublin
... weiterlesen |
|
Wozu dienen die Google Webmaster-Tools? Ein Einstieg |
Wir freuen uns, dass wir in letzter Zeit viele neue Leser gewinnen konnten. Für alle Neulinge und alle, die sich vielleicht einfach noch nicht damit befasst haben, hier ein kleines Video, das unsere Webmaster-Tools noch einmal vorstellt.
Transkript:
Das Internet ist einfach toll. Ihr könnt eure Werke problemlos der ganzen Welt zeigen. Genau wie Alice, die einen Onlineshop für handgefertigten Schmuck eröffnet hat.
Nun möchte sie natürlich, dass ihre Website auf Google gefunden wird. Mit Google Webmaster-Tools kann Alice dafür sorgen, dass Google ihren Shop findet und als Suchergebnis anzeigt. Webmaster-Tools meldet ihr Fehler, die Google beim Lesen ihrer Website findet, sodass Alice diese korrigieren kann und alle ihre Seiten in den Suchergebnissen erscheinen.
Sobald Alice eine neue Produktseite erstellt, kann sie mit Webmaster-Tools prüfen, ob andere Websites auf sie verweisen und wie oft sie in den Suchergebnissen von Google erscheint. Anhand dieser Daten kann sie die erfolgreichsten Seiten und Produkte in ihrem Shop ausfindig machen, diese weiter fördern und die Zugriffszahlen auf ihre Website erhöhen.
Webmaster-Tools prüft ihre Website regelmäßig auf Malware und andere Probleme und sendet ihr sogar eine E-Mail, falls etwas gefunden wird. So kann Alice dank Google Webmaster-Tools sicher sein, dass mit ihrer Website alles in Ordnung ist.
Veröffentlicht von Daniela Loesser, Search Quality Team  
... weiterlesen |
|
Braucht man überhaupt noch HTML-Sitemaps? |
Heute erklärt Matt Cutts, warum eine Sitemap auf eurer Site trotz Übermittlung an Google immer noch sehr nützlich sein kann - für die User und für eure Rankings.
Die heutige Frage kommt aus Colorado. Sie lautet: Ist es wichtig, auch eine Sitemap für die Nutzer zu erstellen, wenn man schon mit den Webmaster-Tools eine XML-Sitemap an Google übermittelt hat? Anscheinend macht das gar keiner mehr. Ist das im Web 2.0 noch wichtig?
Tja, es kommt drauf an, ob ihr gute Suchmaschinen-Rankings im Web 2.0 erzielen wollt. Und wahrscheinlich wollt ihr das. Sitemaps sind nicht nur für Nutzer gut, mit Sitemaps auf eurer Seite oder mit HTML-Sitemaps habt ihr eine hervorragende Möglichkeit, um den PageRank über eure gesamte Website zu verteilen. Wenn ihr testen wollt, wie gut eure Website gecrawlt werden kann, klickt ihr am besten auf verschiedene Stellen auf eurer Website, und schaut, ob jede Seite erreichbar ist. Eine HTML-Sitemap ist quasi eine Garantie dafür, dass jede Seite aufgerufen werden kann.
Zur Erstellung gibt es verschiedene Möglichkeiten. Bei sehr vielen Seiten ist es vielleicht besser, die Sitemap chronologisch oder alphabetisch aufzuteilen, damit ihr nicht Tausende von Links auf einer einzelnen Seite habt. Eine Sitemap kann sehr hilfreich für die Nutzer sein. In vielen Fällen könnt ihr die wichtigsten Seiten ermitteln, oder, wenn ihr nicht jede einzelne Seite hervorheben wollt, könnt ihr die Kategorien auf oberster Ebene auf eurer Website hervorheben. Diese Faktoren sollten also berücksichtigt werden.
Meiner Meinung nach ist es immer gut, eine HTML-Sitemap zu haben. In meinem Blog habe ich zum Beispiel eine Seitenleiste mit allen Posts von jedem Monat, die bis zum Jahr 2005 zurückreichen, oder wann auch immer mein Blog gestartet wurde. So können die Nutzer ganz einfach in der Zeit zurückblättern und der Googlebot kann ebenfalls auf diese einzelnen Posts zugreifen.
Ich empfehle also dringend, neben der XML-Sitemap, die ihr an die Webmaster-Konsole von Google übermittelt, auch eine Sitemap für Nutzer zu erstellen. Sie ist sehr praktisch und nutzerfreundlich und kann richtig gut für eure Suchergebnisse sein.
Veröffentlicht von Daniela Loesser, Search Quality Team
... weiterlesen |
|
|