Lycos.de nabelt sich ab

31. März 2004. Permalink

Nachdem AllTheWeb letzte Woche begann, Daten von Yahoo zu liefern, hat Lycos.de - wo man bisher ATW-Daten verwertete - ebenfalls eine andere Datenbasis. Bei der internationalen Suche wird aus dem gleichen Topf gezehrt, der auch bei Fireball die internationale Suche speist. Bei der Suche in deutschsprachigen Seiten überlasse ich die Ermittlung der Datenquelle einem jüngeren Kollegen.

Schon wieder eine Mirago-Pressemitteilung

Mirago muss offenbar immer wieder auf sich aufmerksam machen, da Karsten.Krone@hotwirepr.com von Hotwirepr schon wieder eine Pressemeldung für die Suchmaschine, die auch mal genannt werden möchte, in Umlauf brachte. Da ich in Kürze meinen seit fast einem Jahr stabilen Spamfilter von Debug auf den normalen Modus umstellen möchte, entfallen dann die täglichen Reports der Absender und Betreffszeilen aller Junk-Mails.


Suchen mal ganz anders

30. März 2004. Permalink

Obwohl Google den Markt, den MSFT auch übernehmen möchte, dominiert, vergeht kaum ein Tag, an dem nicht eine neue Suchmaschine entweder als Google-Killer vorgestellt oder für die nahe oder ferne Zukunft angekündigt wird. Es geht auch anders, wie die recht kreative Suchmaschine Orase belegt.

Kreativ ist vor allem, dass man ein dynamisch unter Berücksichtigung der Anfrage-Formulierung erstelltes Set an Ausgangs-URLs in Echtzeit spidert, um Ergebnisse zu produzieren. Auf der Orase-Site heisst es zwar, man durchsuche "das Web", aber das ist wohl eine klitzekleine Übertreibung.

Werbe-Resistenz maximiert

Jetzt weiss ich auch, warum ich bisher auf keiner Site Googles AdSense Anzeigen gesehen habe. Erstens habe ich JavaScript in allen Browsern deaktiviert, und zweitens filtert Privoxy Werbung gnadenlos.


Google Persönlich

29. März 2004. Permalink

Nachdem Google kürzlich erst die Suche [für Amerikaner] lokalisierte, kommt jetzt die "persönliche" Suche, die die Interessen den Anwenders berücksichtigen soll. Voraussetzung dabei ist, dass der Anwender sich nicht dafür interessiert, wer was auf seinem Rechner macht, da die persönliche Suche Anwendern, die JavaScript im Browser deaktiviert haben, verweigert wird.

http://labs.google.com/personalized


AllOfYahoo

26. März 2004. Permalink

Wie zu erwarten, hat Yahoo als neuer Herr im Hause den AllTheWeb-Datenbestand kaltgestellt und durch Eigenes ersetzt. AllTheWeb präsentiert sich damit - momentan - als schlanker Yahoo-Clone ohne den üblichen Ballast. Schade, dass viele der fortschrittlichen Möglichkeiten der sog. erweiterten Suche bei ATW dadurch unmöglich wurden.

Wie ehrlich schätzt Google?

Dass die bei der Suche genannten Ergebniszahlen fast immer Schätzungen und nur in seltenen Fällen absolute Zahlen sind, wissen IR-Profis und Normalsterbliche, die z.B. Googles API-Informationen gelesen haben. Dass dabei schonmal Blüten entstehen, kann peinlich sein. Wer site:www.sun.com eintippt, erhält als Ergebniszahl knappe 80,000 Seiten. Wer die Suche auf Seiten einschränkt, die das Wort Sun enthalten, findet fast 50% mehr.

Interessant auch folgender Vergleich:

site:www.sun.com +patch site:www.microsoft.com +patch
site:www.sun.com +"security update" site:www.microsoft.com +"security update"

Blog-Leser entdeckt

24. März 2004. Permalink

Yahoos Blog- oder besser RSS Feed-Spider namens YahooFeedSeeker hinterlässt freundlicherweise bei jedem Besuch im Log File, wieviele Anwender wieviele Views über Yahoo ausgelöst haben. Schon schön, zu wissen, dass man nicht umsonst schreibt.

Mirago verschickt 150 Kb Pressemeldung

Originalton: Mirago's Softwaresysteme integrieren 'bezahlte' Ergebnisse in den Index über massgeschneiderte Featured Site, Trusted Feed und Platium Listing Programme.


MSN-Suche in den Startlöchern

23. März 2004. Permalink

Wer in den Startlöchern sitzt, kann schön windgeschützt Pressemeldungen verschiessen, die von den Medien fehlinterpretiert werden. So berichten mehrere PR-Verwerter heute, dass MSN im Juli eine neue Suchmaschine vorstellen wird. Die wichtigste Innovation: bezahlte Einträge sollen jetzt noch deutlicher als solche gekennzeichnet werden, und statt derer vier soll es nur noch dreie geben.

Tönt Karen Redetzki, MSN Product Manageress: "We're really close to finding out what really strikes consumers as the most relevant search results".

http://biz.yahoo.com/rc/040319/tech_microsoft_search_1.html


Yahoo bietet Toolbar

22. März 2004. Permalink

Ein noch in BETA befindlicher Toolbar, entwickelt für MSIE-Anwender, meldet an Yahoo die URL jeder besuchten Website und, so deuten die entsprechenden Hilfsseiten bei Yahoo an, ermittelt daraus die Popularität besuchter Präsenzen. Die Chose ähnelt damit dem Alexa-Toolbar.

Hotbot ohne AllTheWeb-Daten

Hotbot.com verzichtet ab sofort auf Daten von AllTheWeb und bietet nur noch "Hotbot" [Inktomi], Google & AskJeeves. Fortschritt muss sein.

Hotbot.de durchsucht Deep Web

Wer heute bei Hotbot in Deutschland nach "Suchmaschinen Syntax" sucht, könnte glauben, meine Startseite auf Position 38 zu finden. In Wirklichkeit steckt im Datenbestand eine drei Meter lange URL der T-Online Suchmaschine, die ein Redirect auf meine Startseite auslöst. Mich würde ja schon interessieren, wie es [bei Hotbot.de immer wieder] dazu kommt.

Neue Perle im MSN-Verbund?

In einem Artikel wird spekuliert, dass MSFT an Übernahme-Verhandlungen teilnahm, die den MSN-Verbund um eine wahre Perle bereichern könnte: money.cnn.com.

Google-Suchergebnisse manuell einstellen

Kann man bei Google die manuelle Beeinflussung der Suchergebnisse bewirken? Vielleicht, wenn man die richtigen Beziehungen nach oben hat.


Yahoo jetzt ganz ohne Google

18. März 2004. Permalink

Inzwischen liefert Yahoo auch eigene Ergebnisse, wenn man die Zahl der Links auf eine Site oder deren in den Datenbestand aufgenommene Seiten prüft. Bis vor ein paar Tagen lieferten solche Anfragen bei Yahoo.com noch von Google gelieferte Zahlen.


Google-Update

17. März 2004. Permalink

Google zeigt seit heute früh neue Pagerank- und Link-Zahlen, für Yahoo.com z.B. nur noch 442,000 - nachdem noch im 1. Halbjahr 2003 meist Werte um etwa 3/4 Mio genannt wurden. Auch das Google-Directory wurde schon wieder aktualisiert. Zusätzlich gibt es leichte "Relevanz-Verschiebungen".


xn--drck-1ra.com wird verdrückt

16. März 2004. Permalink

Das Echo des Startschusses für Unlautdomains ist noch nicht ganz verklungen, da etabliert sich bereits eine xn--gebrauchtbrse-rmb. Hat der Markt vielleicht xn--wachstumsstrungen-9zb?


Yahoo.DE: vorsichtig mit neuen Ergebnissen

11. März 2004. Permalink

Nachdem Yahoo in den USA kürzlich Googles Suchergebnisse [teilweise, sh.a. Yahoo noch unfertig] durch die selbstgestrickte Suche ablöste, liefert jetzt auch Yahoo.DE neue Suchergebnisse - offenbar abhängig von der Suchhäufigkeit der gesuchten Begriffe.

Für häufig gesuchte Wörter sieht man die alten wieder, wenn man statt der jetzt aktiven Standard-Einstellung "Seiten auf Deutsch" manuell "weltweit" selektiert [die Wahlmöglichkeit wird leider nicht auf der Yahoo-Startseite geboten]. Für seltener gefragte Formulierungen erhält man bei der Einstellung "weltweit" Ergebnisse, die oft völlig mit den von Yahoo.COM gelieferten übereinstimmen.


Suchbegriffsanalyse aktualisiert

10. März 2004. Permalink

Ob die Zerlegung zusammengesetzter Wörter durch meine selbstgestrickte Suchbegriffsanalyse ähnliche Ergebnisse bringt, wie die seit einiger Zeit beobachtete Zerlegung solcher Wörter bei Google.DE, bezweifle ich. Trotzdem kann die Demontage in ihre Einzelteile penibel getextete Worthäufigkeiten ganz schön auf den Kopf stellen: Suchbegriffs-Analyse.


Neuer Spider-Mythos

9. März 2004. Permalink

Craig Neville-Manning, Entwickler bei Google, soll auf der SES-Konferenz gesagt haben, Googles Spider sei in der Lage, nicht verlinkte Dateien auf einem Server zu entdecken. Es ist nicht auszuschliessen, dass die nicht den Realitäten entsprechende Behauptung die Runde machen und zum neuen Mythos wird.

In der Praxis haben Spider keine Möglichkeit, Seiten eigenständig zu "entdecken". Entweder man kennt eine URL, weil sie z.B. angemeldet oder in einer Webseite verlinkt wurde, oder man tappt im Dunkeln. Nur wenn der Webserver, auf dem eine zu "entdeckende" Seite liegt, so konfiguriert ist, dass er beim Aufruf der Stammdatei [meistens auf den Namen index.html lautend] in einem Verzeichnis ein solches dynamisch erstellt, wenn eine Datei gleichen Namens nicht existiert, "erfährt" ein Spider davon. In diesem Fall erfolgt das "Erfahren" aber durch die Bereitstellung der Information durch den Server und nicht etwa durch besonders ausgeklügelte Spidertechnologie.

In meinem Tutorial beschreibe ich ausführlich, wie Suchmaschinen-Spider funktionieren. Und Ed Felten erklärt in seinem Freedom to Tinker getauften Blog, warum Zugriffe auf Dateien, die zwar nicht geschützt aber auch nicht für die Öffentlichkeit gedacht sind, trotz mangelndem Schutzes möglicherweise gegen den Computer Fraud and Abuse Act (CFAA), verstossen könnten, wie jetzt wahlkämpfende Republikaner mit roten Ohren erkennen mussten.


Googlebot mit neuer Kennung

8. März 2004. Permalink

Auf den Namen "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" hört ein Spider, der seit etwa einer Woche sehr selektiv Seiten abruft. 99% aller Seitenabrufe erfolgen immer noch mit der gewohnten Kennung.

PureSearch wieder da

Das während der Nichterreichbarkeit von PureSearch, dem Suchschlitz für den reinen Inktomi-Datenbestand, in Umlauf gebrachte Gerücht, der Service würde eingestellt, war wohl eine Ente.

http://search.positiontech.com/

Noch mehr Wettbewerbs-Spekulation

4. März 2004. Permalink

Der sich verschärfende Wettbewerb, den die meisten Schreiberlinge durch Yahoos Wechsel auf gekaufte & selbstgestrickte Suchtechnologien einerseits und diverse vaporöse Gerüchte MSFTs um eine in Planung befindliche eigene Suchmaschine andererseits sehen, wurde wahrscheinlich bereits entschieden. Entscheidend ist einmal die Trägheit der Anwender, darüberhinaus aber auch Dinge wie das Yahoo-Eigentor der nicht völlig erklärten Einfach- und Doppelbezahler-Modelle für Anmeldung bzw Aufnahme, sowie die recht unterschiedliche Zusammensetzung der Datenbestände.

Der Inktomi-Datenbestand ist heuer vergleichsweise klein. Während er vielleicht wesentlich weniger Spam enthält, als Google, dürfte sich das sofort[!] ändern, sobald und falls kommerzielle Site-Betreiber feststellen, dass Zugriffszahlen von Yahoo auf ein attraktives Niveau steigen. Und wer käme je auf die Idee, bei MSN zu suchen, wo man trotz aller Aufgeblasenheit immer noch nicht in der Lage ist, zwischen schmuddleligen und jugendfreien Suchanfragen zu unterscheiden?


Yahoo noch unfertig

3. März 2004. Permalink

Ganz hat Yahoo.com die Leinen zum Google-Datenbestand noch nicht gekappt. Wer prüfen möchte, wieviele Links denn in der neuen Yahoo/Inktomi Suchmaschine auf die eigene Site führen, erhält derzeit Zahlen, die genau mit den von Google gemeldeten übereinstimmen.

Experten-Konsensus: Wir müssen was sagen

Nachdem Yahoo eigene Technologie hinter dem Suchschlitz bemüht, sind sich fast alle Experten einig, einen Vergleich mit Google anstellen zu müssen. Auf einer SES-Konferenz hiess es gar, dass das gefürchtete Google-Monopol jetzt verhindert wird. Unbedingt weitersagen, damit's auch jeder erfährt.

Google Relevanz-Probleme

In einem recht langen Artikel meint Brian Livingston, nachweisen zu können, dass Google Relevanz-Probleme hat. Grösser ist die Zahl der Schreiberlinge, die - statt journalistische Hausaufgaben zu machen - eine Wortsammlung in den Google-Schlitz tippen und angesichts einer grossen Ergebniszahl die Wichtigkeit der vermeintlich recherchierten These belegen. Beide latschen auf die Tretmine des sog. Best Match, bei dem bei Eingabe mehrerer Suchbegriffe die Seiten zu erst erscheinen, die möglichst viele der gesuchten Begriffe und möglichst eng zusammenstehend enthalten, und wobei der ellenlange Schwanz der restlichen Fundstellen immer wenigere der gesuchten Begriffe enthalten.

http://www.eweek.com/article2/0,4149,1530367,00.asp

Das ist nicht das gleiche, als wenn man Phrasen sucht, bei denen Begriffe aufeinanderfolgen müssen und alle Phrasen in einem Dokument enthalten sind. Ergebniszahlen für qualifizierte Suchanfragen sind oft nur mikroskopisch kleine Bruchteile für Suchen, in denen unqualifiziert gefragt wird.

Nachtrag: Seth Finkelstein nennt weitere journalistische "Recherche-Leistungen".

Licht aus für AllTheWeb & AltaVista

Pandia bedauert, ankündigen zu müssen, dass AllTheWeb und AltaVista ihre eigenen Technologien verlieren und zu Suchschlitzen für Yahoos Weiterentwicklung der aquirierten Inktomi-Suche werden. Angesichts einer fehlenden Quelle für diese Behauptung sollte man die Sache nicht ohne eine gewissen Skepsis lesen.

Verliert das ODP Stellenwert?

Glaubt man dem ODP Weblog, wird Google das etwas stiefväterlich behandelte Verzeichnis zwar nicht einstellen, aber auch nicht mehr so prominent verlinken, wie bisher. Auch auf die gelegentlich aus dem ODP gezogenen Zusatzbeschreibungen wie auch die bei vorhandenem Eintrag zusätzlich angegebene ODP- bzw Google-Verzeichnis-Kategorie soll verschwinden.


Yahoo meldet sich

2. März 2004. Permalink

Mit einer regelrechten Lawine an Pressemeldungen und Veröffentlichungen erinnert Yahoo ständig daran, dass die Inktomi-Aquisition zu einer neuen Suchmaschine umfunktioniert wurde, die jetzt jeden Tag mehr können soll.

Angefangen mit einer verwirrenden Vielfalt bezahlter Aufnahmemöglichkeiten, bei denen alte Verträge mit den früher eigenständigen Diensten AllTheWeb, Altavista und Inktomi teilweise kombiniert werden, bei dem aber bisherige Inktomi-Kunden nur bis zum 15.4. bei Yahoo sichtbar sind [nach dem Motto "Ohne Moos nichts los"], kommt jetzt auch ein Doppelbezahler-Programm. Hierbei darf man einmal $49 fuer die Begutachtung und mögliche Aufnahme einer Seite [1 Datei] entrichten, um dann pro Klick nochmals $0.15 oder $0.30 [je nach Kategorie] zu zahlen. Das alles hat natürlich keinen Einfluss auf die Position in den Ergebnissen, so sagt man. Andere munkeln, dass Ergebnisse, bei denen eine Suchmaschine an jedem Klick verdient, eine gewisse Tendenz haben, nach oben zu schweben.

Dafür soll Yahoo jetzt noch grösser werden. Neue Anstrengungen werden dazu führen, dass man tiefer als je zuvor ins Web kriecht. Bleibt zu hoffen, dass da Lesenswertes zu holen ist.

http://news.com.com/2100-1024-5167931.html

Gleichzeitig soll Yahoo noch klüger werden. Wenn jemand wiederholt nach "Newspaper" sucht, will Yahoo zukünftig allein entscheiden können, ob der Suchende die Washington Post oder die New York Times meint. Das ist fast schon so gut, als wenn Anwender sich die URL einer regelmässig besuchten Site merken.

Jetzt wird Google entthront...

In einer mutig formulierten Pressemeldung kündigt eine auf den vielversprechenden Namen "AOMI" lautende Suchmaschine an, revolutionäre Technologien zu entwickeln, die dazu führen wird, dass die meisten traditionellen Suchmaschinen obsolet werden. Einen Vorgeschmack auf die Revolution gibts bei www.aomi.com.

Und das gleich zweimal

In einer mutig formulierten Pressemeldung meldet eine "Agence Virtuelle" genannte PPC-Klicke einen potentiell dramatischen Abstieg des Suchmaschinen-Führers für 2004. Ein genaues Datum für den Abstieg wird nicht genannt.


PureSearch nicht gefunden

1. März 2004. Permalink

Es sieht so aus, als ob die Schnittstelle in den ungefilterten Inktomi-Datenbestand, bereitgestellt durch PositionTech.com unter der Adresse http://www.puresearch.com/ nicht mehr erreichbar ist. Schade.

Suchmaschinen Blog Archiv


© Copyright 1998 - 2008 Klaus Schallhorn.