Eine neue Suchmaschine, die in ihrer PR mal ausnahmsweise nicht verspricht, Google zu ersetzen, scheint trotz angeblichem Datenbestand von 4 Mrd Seiten eh auf eine andere Zielgruppe abzuzielen. So wie hier gezeigt präsentiert sie sich Anwendern, die auf JavaScript, Flash und andere Überraschungen verzichten. Die Google-Börseneinführung ist möglicherweise nicht betroffen.
Seit dem Herbst letzten Jahres wird vermutet, dass Pagerank eine reduzierte Bedeutung bei Google besitzt. Ein neues Patent zeigt, dass diese Vermutung nicht berechtigt ist, sondern dass in einem zweistufigen Verfahren verbesserte Präzision angestrebt wird. Ob sie auch erreicht wird, ist eine andere Frage.
Ein neues Patent hat das Potential, alle online veröffentlichen Medien-Sites zu möglichen Veränderungen der radaktionellen Politik zu zwingen.
Heise berichtet heute ohne genaue Angabe einer Quelle [d.h. ohne diese zu verlinken], dass Lycos.com zum Verkauf steht. "Bereits im Sommer 2003 hatte es Gerüchte gegeben, wonach Telefonica sich von Lycos trennen wolle." Entsprechende Andeutungen wurden anlässlich der letzten Telefonica-Hauptversammlung gemacht, wo es hiess, Telefonica wolle sich jetzt nur noch um das Kerngeschäft [Telefonie & Datendienste] kümmern. Das ist meistens eine gute Strategie.
Während Google - wie andere auch - normalerweise nicht zwischen Gross- und Kleinschreibung unterscheidet, stösst man gelegentlich auf Suchformulierungen, bei denen unterschiedliche Schreibweisen zu genauso unterschiedlichen Ergebnisfolgen führen.
D.h., wenn man bei Google.DE sucht. Eine der Formulierungen ist z.B. nordic walken, eine weitere walking stöcke. Zweisprachige Anfragen oder eingedeutschte Begriffe sind aber nicht immer Auslöser. Auch im deutschen Sprachgebrauch selten vorkommende Wörter wie Platzierung können in Verbindung mit anderen als Trigger dienen.
Google zeigt auf der IP-Adresse 64.233.161.98 aktualisierte Linkzahlen. Die Veränderungen, so ein paar Stichproben, halten sich in Grenzen. Auch die angeblichen Links von meiner auf eine mir nicht bekannte Site und zerschossene Cache- bzw Archiv-Seiten [s.h. a. Ist Google korrupt?] sind noch im neuen Datenbestand.
Seitdem Google zusammengesetzte Wörter erkennt und dabei Zweideutigkeiten zwangsweise nicht eindeutig interpretiert, wurden nicht wenige Sites, die nichts mit dem Rotlichtbezirk zu tun haben, Opfer der Technik. So u.a. auch die Firma PartSexPress, die Parts per Express liefert. News.com schlussfolgert, Googles Keuschheitsgürtel sei zu eng. Aber nicht jede Filterkritik rechtfertigt Verschwörungstheorien. Manchmal liegt's einfach daran, dass ein Server nicht erreichbar ist.
http://news.com.com/2100-1032-5198125.html
Ein Blick hinter die Kulissen lässt vermuten, wie die von Microsoft hyperventilierte Suchmaschine arbeiten könnte.
Ähnlich wie Google bietet auch Yahoo [US] nahezu alles, was man im Leben suchen könnte. Was noch fehlt, sind die Lottozahlen der nächsten Woche.
In den letzten beiden Jahren gab es mehrfach robots.txt Probleme bei Google. Beim ersten mal wurden die Sperrdateien für SSL Server völlig ignoriert. Beim zweiten mal wurde ein voller Datenträger als Grund für das Spidern gesperrter Seiten angegeben.
Im Herbst letzten Jahres versuchte jemand, bei Ebay eine Domain zu verkaufen, deren hochwertiger Pagerank eindeutig [wie ein Blick auf den Cache zeigte] durch Daten-Korruption zustande kam. Ende letzten Jahres führte die Suche site:www.google.com -google zu Ergebnissen, die u.a. auch Adobe und mehrere .edu Domains enthielten.
Jetzt gibt es eine Domain, die gemäss Google mehr als 300 mal von Seiten meines Tutorials und meinem Newsletter-Archiv verlinkt wird, obwohl mir der Domainname der verlinkten Site bis zur Entdeckung der angeblichen Verlinkung nicht bekannt war. Und dann gibt es noch Seiten im Google-Cache [Archiv], die andere Seiten enthalten, so als hätte jemand per Copy & Paste willkürlich Seiten von anderen Domains in die Mitte eigener Seiten kopiert.
Da niemand so zerschosssene HTML erstellen kann - und bei Stichproben nur zwei von hunderten von Seiten der betroffenen Domain fehlerhafte Inhalte aufweisen - glaube ich nicht, dass es sich um eine Art des Cloakings handelt, sondern auch hier um Datenträger- oder Software-Probleme.
Das "Google File-System" wird hier so beschrieben, als handele es sich um eine fertige und vor allem stabile Lösung. Zweifel an den Vorschusslorbeeren sind offenbar nicht unberechtigt.
Auch Yahoo arbeitet mit teilweise unfertiger Software. Meinen Logfiles entnehme ich soeben eine Serie von Einträgen, bei denen man "nichts" abruft: "GET HTTP/1.0" [zwei Leerzeichen zwischen Get und HTTP].
Gemäss Startseite sucht Google in 4,285,199,774 Web-Seiten. "Ungefähr 5,710,000,000" davon enthalten das Wort the. Grenzt man die Suche auf deutsche Seiten ein, bleiben "ungefähr 6,710,000,000" übrig. Was jetzt noch fehlt, ist die Google Finanzverwaltung basierend auf den gleichen Prinzipien.
Nachdem ATW letzte Woche zum Yahoo-Clone wurde, hat es jetzt auch AltaVista erwischt. Optisch hat sich zwar nichts geändert, aber wie man an den Ergebnissen sieht, werden diese über einen Redirector bei Yahoo geschleust. Schade.
Gestern abend habe ich angefangen, meinen in den letzten Monaten selbst gestrickten Mail Spamschutz zu dokumentieren [ich werde älter]. Heute früh entnehme ich den Log Files, dass der bei Bedarf automatisch Sperren gegen Spam versendende IP Adressen auslösende Firewall über Nacht fast 44,000 unerwünschte Connections der Spam-Mafia verhindert hat. Genugtuung ist ein schönes Gefühl.
© Copyright 1998 - 2008 Klaus Schallhorn.