Tim Bray sagt, was für Leser, die ihre Teenager-Jahre hinter sich haben, schon offensichtlich ist, nämlich dass Facebook und indirekt und den Kommentaren zufolge andere soziale Netzwerk-Sites nicht mehr als reine Zeitverschwendung sind. Wer hätte das gedacht?
Google's Online Security Blog sucht Hilfe beim Entdecken von "Malware". Google könnte sich selbst [besser] helfen, wenn man Redirects anders behandeln würde. Und wenn man Seiteninhalte gründlicher analysieren würde.
Wenn Sie sich eine der letzte Woche wegen des Potentials der Infizierung mit "Üblem" entfernten Seiten angesehen haben, ist offensichtlich, dass diese nur absoluten Müll enthielten. Niemand redet oder schreibt so. Und wenn doch, sind solche Leute eingesperrt. Ich bin sicher, dass Google mehr als alle anderen in der Lage ist, zu entscheiden, was ausgedrückte Meinung ist, und was nur Wort- und Phrasenlisten aus unterschiedlichen und keineswegs verwandten Themenbereichen sind.
Wie überflüsig Meta Tags längst sind wird offensichtlich, wenn Sie bei Google den Vertipper produltproben suchen und die ca 50 Ergebnisse, die Google ausspuckt, prüfen. Sie werden die bekannte und gut verlinkte Seite, der ich das Wort entnahm, nicht finden, obwohl Sie Wortketten finden, die aussehen, wie eine grosszügig übernommene Kopie der Geizkragen.de Meta Tags.
Yahoo betrachtet Meta Keywords nebenbeibemerkt immer noch als sinnvolle Information.
Google sperrt eine mir bis dato unbekannte Site "The People's Cube" wegen Spam - versteckte Links und versteckter Text - und in politisch ähnlich angehauchten Foren wird lamentiert, die Site wäre wegen der politischen Richtung aus dem Google-Datenbestand verbannt. Dabei ist es heute meist wesentlich einfacher, als früher, Spam zu entdecken. Schalten Sie im Browser JavaScript aus, und schalten Sie CSS ab, dann sehen Sie genau die Seite, die ein Server liefert, und Sie sehen diese Seite ohne Kosmetik, ohne Schminke, nackte Tatsachen also. So können Sie u.a. auch feststellen, ob Ihr Webmaster ein solcher ist oder ob er nur vorgibt, sein Handwerk zu verstehen, weil es irgendwie in der Natur liegt, auf Tricks nicht verzichten zu können.
Google [und andere Suchmaschinen] zensieren nur, was vom jeweiligen Staat unterdrückt wird. Ganz wurde die Redefreiheit noch nicht abgeschafft, auch wenn die erstaunliche Ahnungslosigskeit vieler Zeitgenossen dies nahelegt.
Matt Cutts, quasi-offizielles Google-Sprachrohr in Sachen inoffizielle Bangemache, veröffentlicht in seinem Blog wieder ein paar Informationshappen zum nächsten Update [Spitzname: Big Daddy; meine Wahl "Dicke Berta" scheint mir aus mehr als einem Grund angebrachter]. Wobei zu berücksichtigen gilt, dass Updates heute eher selten erfolgen, da Google ein [berechtigtes] Interesse daran hat, alle, die glauben, im Frack Kaninchen aus dem Hut oder Doorwaypages aus selbstgemachten Scripts ziehen zu müssen, durch lange Wartezeiten von Update zu Update mürbe zu machen.
Die in Cutts Blog gebotenen IP-Adressen sind daher möglicherweise nur eine geschickte Art, die o.g. Zielgruppe davon abzuhalten, tatsächlich erfolgreiche Strategien einzusetzen. Denn solange diese Leute beschäftigt sind, können andere unbehindert dem Tagesgeschehen nachgehen. Wieso ich das ganze als Ablenkungsmanöver betrachte?
Ist schonmal jemand aufgefallen, dass bei jeder Suche auch der Standort des Suchenden, der aufgerufenen Google-Landesdomain und der potentiellen Fundstellen in die Gleichung eingeht. Soll heissen, ich sehe, abhängig davon, ob ich bei Google.COM, Google.CO.UK oder Google.DE suche, sehr unterschiedliche Ergebnisse für identische Anfragen.
Matt Cutts erinnert daran, dass Spam auf nicht-amerikanischen Sites ab 2006 [das ist ab heute] genauso verpönt ist, wie auf amerikanischen Präsenzen. Er liefert gleich ein Beispiel einer deutschen, sich u.a. dem Vertrieb von in Stuttgart gebauten Kraftfahrzeugen der oberen Preisklasse widmenden Site, die per JavaScript Seriösität simuliert.
Die Simulation basiert auf einem Code-Happen:
<!-- url="http://www.automobile.de/1googlecount usw... usf... //-->
Den Suchmaschinen will man dagegen Müll unterjubeln, der zu attraktivem Ranking verhelfen soll. Irgend eine Leuchte ist dabei doch tatsächlich auf die glorreiche Idee gekommen, das Kind beim Namen zu nennen: <div class="container_searchengine">.
Ich bin überrascht, dass man glaubt, Fahrzeuge für den gehobenen Anspruch [oder irgendetwas anderes] heute noch mit den billigsten Anfängertricks an den Mann bringen zu können.
Und wenn Sie's noch nicht getan haben und sich nicht gerne etwas vorgaukeln lassen, sollten Sie JavaScipt im Browser deaktivieren.
Froogle ist zwar nicht gerade neu, leidet aber trotzdem am heute bereits selbstverständlichen Netz-Symptom Nr 1: egal, was man baut, solange es kostenlos genutzt werden kann, wird es vor allem missbraucht. So findet man inzwischen auch bei Froogle für viele Suchanfragen, wie bei Comparison Engines samt Screenshots dokumentiert, oft Schrott. Das ist einerseits grobe Nachlässigkeit Googles, aber auch eben bedauerlicherweise eine Eigenschaft moderner "Unternehmer" [sich dadurch auszeichnend, dass man nicht mehr eigene sondern fremde Mittel riskiert und manchmal auch ruiniert].
Am 7. September des Jahres habe ich eine neue, private Site eingerichtet [Domainname wurde am 21.7. registriert]. Durch Beziehungen hatte die Site schnell einen Link von einer älteren Seite. Durch Betteln und schamloses Ausnutzen von Kontakten hat die Site inzwischen [mindestens] 2 zusätzliche gute Links, wenn man Yahoo befragt [Google erzählt allerdings reine Märchen]; die Startseite hat Pagerank 3, alle Unterseiten PR 2.
Seit dem 11. September ist die Site - aufgrund des ersten Links - im Google-Bestand. Am 28. September habe ich Yahoo einen Nachhilfe-Schubs gegeben und die Site dort angemeldet. Im Yahoo-Datenbestand ist sie trotz der dorthin weisenden Links und trotz Anmeldung immer noch nicht. Ist es ein Wunder, dass Google einen grösseren Marktanteil hat als alle Mitbewerber zusammen?
Insider wissen längst, dass das Reisegewerbe eine der am heissesten umkämpften Branchen ist. Einen Filter besonderer Art scheint Google bei englischsprachigen Suchen soeben eingeführt zu haben. Eingabe des gewünschten Abflugortes und der Destination genügt. Für Benutzer der Bahn geht das in Deutschland schon länger, wird mir gesagt.
Am Anfang waren Meta-Tags. Was als sinnvolle Unterstützung der ersten Suchmaschinen gedacht war, wurde schnell zum Meter- und dann zum Kilometer-Tag, in so ellenlangen wie irrelevanten Wortlisten resultierend. Diese werden zwar seit Jahren von Suchmaschinen ignoriert, was "Aufstrebende" aber nicht davon abhält, immer noch zu versuchen, über dieses - und viele andere - Abstellgleise gefunden zu werden.
Nach Foren- und Gästebuch-Einträgen, die oft automatisiert erstellt werden, in der Hoffnung, sie würden Linkpopularität künstlich aufblasen, ist Referer-Spam jetzt so offensichtlich, dass der Referer-Log der eigenen Site wertlos wurde.
Diese Art Spam soll gleich zwei Fliegen mit einem HTTP-Abruf erschlagen: Ein Teil aller Logaufzeichnungen ist, da nicht jeder Lesen kann oder will, immer noch ungeschützt, d.h. typische Logauswertungen geraten immer noch in die Suchmaschinen und werden ggfls - inkl Links auf die angeblichen Verweisstellen - auch gefunden. Und der ahnungslose Site-Betreiber, der seine Logauswertungen prüft und die angeblich verweisenden Seiten aufsucht, findet dort entweder Schmutz oder, falls er einen Windows-Rechner benutzt, eine Ladung "unerwünscht installierter Software". Ganz neu ist die Masche, eine Seite vorzufinden, die behauptet, die Site wäre wegen Missbrauch geschlossen, was wohl Beschwerden verhindern soll. Denn Wochen später leben diese Sites wieder auf.
Froogle, d.h. die Produkt-Suchmaschine aus dem Hause Google, kommt jetzt auch nach Deutschland - und keine Minute zu früh. Da die Aufnahme in Froogle kostenlos ist, und ausgegebene Produkt-Informationen vom Site-Betreiber - sprich Anbieter - kontrolliert werden können, erübrigt sich die angenommene Notwendigkeit der Seitenerstellung zur Algorithmus-Überlistung.
Froogle unterscheidet sich von Google dadurch, dass nur und ausschliesslich online zum Verkauf angebotene Produkte aufgenommen werden, und dass Sie Daten in mehreren Datei-Formaten hochladen können.
Manche beiläufig benutzten Formulierungen führen dazu, dass meine Site jetzt auch von Leuten besucht wird, die einen Ghettoblaster einer bestimmten Marke, Information zum Google Toolbar für Linux oder auch Mephisto Wanderschuhe suchen, aufgerufen wird. Manchmal werde ich das Gefühl nicht los, dass Google - trotz aller Patente, Veröffentlichungen und Beschwörungen - zu hohen Wert auf Aktualität und zu geringen auf Dokument-Eigenschaften legt.
Wenn man Googles Ergebnisse für derartige Suchformulierungen mit denen von AllTheWeb und AltaVista vergleicht, kann man sich andererseits nicht beklagen. ATW und auch AV liefern für den Ghettoblaster auf jeder der ersten Seiten ein Ebay-Ergebnis. Und in Sachen Toolbar, die einzige Formulierung, für die ich eine relevante Seite habe, finden ATW und AV und auch die Vollversion des Datenbestands, verwaltet von Yahoo.com, gar nichts, selbst per Phrasensuche.
Yahoo indexiert offenbar doch weniger als Google, und liefert nur Bruchteile dessen an die gekauften Stiefkinder.
Ich habe mich gestern etwas ausführlicher mit Yahoo! - COM, UK & DE - befasst und bin, vor allem, was die ersten beiden betrifft, angenehm überrascht. Wenn Yahoo in Deutschland die Standard-Einstellung der Suche auf "Weltweit" setzen würde - was ich nicht ohne Eigeninteresse sage - muss man Yahoo durchaus als ernsthaften Google-Mitbewerber einstufen.
Denn ganz im Stillen werden dort mehr und mehr Features, die man von Google kennt, ebenfalls geboten. So war ich überrascht, dass Yahoo.de jetzt auch zusammengesetzte Wörter wie Einzelbegriffe behandelt.
Was fehlt, ist ein Frühjahrsputz, Übernahme diverser Suchformen [Syntax], die Yahoo.COM schon lange bietet und auch Queries, die über die eigentliche Web-Suche hinausgehen. Und dann natürlich ein teilweise auszubauender Datenbestand [oder Schätzungen, die den Google-Schätzungen gleichkommen] sowie etwas Aufmerksamkeit.
Der DNS-Eintrag wurde gestern abend gegen 22:00h BST auf die neue IP gesetzt. Google spidert heute früh fleissig den alten Server, der noch online ist und eine Weile bleiben wird. Kurz vor Acht hat Herr Googlebot aber zumindest das robots.txt-File meiner Site vom neuen Server abgerufen. Da Googles Spider distribuiert d.h. von einer Vielzahl von Maschinen & IPs aus arbeiten, bin ich gespannt, wann der letzte Seitenabruf vom alten Server erfolgen wird.
Es ist möglich, dass eine DNS-Änderung vor ca 14 Tagen, die die TTL des Eintrags für den alten Server auf 1 Std reduzierte, geholfen haben kann. Nachdem man oft genug hört, dass Google Server-Umzüge auch noch nach 4 Wochen nicht bemerkt [weil IPs zwischengespeichert werden], werde ich ein Auge darauf bemühen.
Kleiner Qualitätsvergleichstest: Am Wochenende habe ich auf meinem Experimentier-Laptop Fedora Core 2 installiert, da ich mir die neue Version Gimp und ein paar andere mich interessierende Dinge ansehen wollte. Wireless Networking, was unter Redhat 9 und auch Fedora Core 1 sozusagen "aus der Box heraus" funktionierte, versagt. Da ich möglicherweise nicht der erste bin, der das Problem hat, habe ich nach einer Lösung gesucht. Die Eingabe:
fedora core pcmcia problem
bringt bei allen Suchmaschinen zahlreiche Mitleidende zum Vorschein, oft auf den oberen Rängen. Den Fix für das Problem findet man nur bei Google - auf Platz 1 - und auch, wenn man das Wort "Problem" weglässt. Und einen Link auf eine Diskussion verschiedener Lösungen findet man auf dem 1. Platz, wenn man bei Google.com nur "fedora pcmcia" eingibt.
Unüberlegter Journalismus hat dazu geführt, dass ein nur Wenigen bekanntes Google-"Feature", das ungerechtfertigte Vererbung von Pagerank ermöglicht, an die Öffentlichkeit kam. Während die Veröffentlichungen zwar nicht in allen Details korrekt sind und auch nicht die komplette Kette der von Schmarotzern zu erfüllenden Voraussetzungen nennen, sehe ich mich gezwungen, einen im Kundenbereich am 22.4. veröffentlichen Hinweis [damals begleitet durch einen Eintrag in meinem Blog vom gleichen Tag] nachfolgend zu wiederholen:
Pagerank-Klau verhindern
Einzelne Indizien habe ich im Laufe der letzten beiden Jahre mehrfach beobachtet. Über manche haben sich Besucher von Foren wie z.B. Suchmaschinentricks mehrfach negativ geäussert, ohne die Folgen vollends zu erkennen. Nachdem ich auf eine Site stiess, die angeblich mehr als 300 mal von meiner verlinkt wurde, ergab längere Korrespondenz mit einem Google-Techniker, dass auf diese Art Pagerank transferiert wird.
Dagegen schützen können Sie sich momentan nur, wenn Sie sog. voll qualifizierte Links in Ihren Seiten verwenden, oder wenn Sie allen Seiten ausdrücklicher einer Basis zuweisen.
Zur Erklärung:
| Link-Typ | Beispiel | Erklärung |
| relativ: | <a href="file.html"> | Datei im gleichen Verzeichnis |
| absolut: | <a href="/pfad/file.html"> | Datei auf dem gleichen Host |
| voll qualifiziert: | <a href="http://domain.de/pfad/file.html"> | vollständige URL |
Da es zu übergrossen Dateien führt, eigentlich unnötig und vor allem lästig ist, in jedem Fall voll qualifizierte URLs zu verwenden, bietet sich als Alternative die Möglichkeit, alle internen Links ausdrücklich und um jeden Zweifel zu vermeiden, einer einheitlichen Basis zuzuweisen. Dies geschieht durch Anbringung des BASE Elements im HEAD einer Seite:
<base href="http://ihre.domain.de/">
Damit wird jeder Link Ihrer Seiten, der nicht ausdrücklich auf einen externen Host führt, zweifelsfrei Ihrer Site zugeordnet und der unberechtigte Transfer von Pagerank an Trittbrettfahrer verhindert.
Bitte beachten Sie, dass in diesem Fall nach dem Domainnamen ein Schrägstrich [Ihr Stammverzeichnis verkörpernd] angegeben werden muss, da manche Spider [vor allem Yahoo/Inktomi] durch einen Bug im URL-Parser ohne den Schrägstrich im Kreis laufen. Anbringung des obigen Beispiels setzt ebenfalls voraus, dass Sie für interne Links stets absolute URLs verwenden. Bei Verwendung relativer URLs muss das BASE Element für diese Seiten dann auf das entsprechende Verzeichnis verweisen. Beispiele für beide Formen finden Sie, wenn Sie den Quellcode z.B. dieser Seite mit einer Seite aus meinem Suchmaschinen-Tutorial vergleichen.
Die, wenn man ihr glaubt, "originelle Suchmaschinen-Marketing Firma", [die wortwörtliche Übersetzung konnte ich mir nicht verkneifen] bestätigt jetzt, was erfahrene Anwender unterschwellig schon immer wussten.
So heisst es in einer Pressemeldung u.a., dass 72.3.% der Google-Anwender Suchergebnisse den Anzeigen vorziehen. Bei Yahoo-Anwendern sinkt der Anteil auf 60.8%. Bei AOL-Anwendern liegts bei halbe-halbe. Nur MSN-Anwender klicken lieber auf Werbung [71.2%] statt auf Echtes.
Nicht ganz so präzise hatte ich das mangels Zahlen vor gut drei Jahren in meinem Tutorial unter den Stichpunkten die wichtigsten Suchmaschinen und dann noch in Sachen GROSS- und kleinschreibung geschildert.
© Copyright 1998 - 2008 Klaus Schallhorn.