Inktomi-News, Pleiten & modernes Verkaufen.

Inktomi erklaert

Was ist eigentlich Inktomi, wurde ich gefragt. Eine vom Ansatz her sicherlich gute Idee, die in der Praxis aber die gleichen Schwaechen zeigt, die bei nahezu allen Suchmaschinen beobachtet werden kann.

Inktomi betreibt eine "Suchmaschine" ohne Front-End, ohne Suchschlitz und ohne Anmeldeverfahren. Waehrend Inktomi das Web wie Suchmaschinen auch regelmaessig spidert und Seiten erfasst, werden die so erstellten Datenbank-Inhalte an Betreiber von Suchmaschinen verkauft. Wer eine Suchmaschine betreiben moechte, muss heute nicht mehr eigene Software entwickeln, sondern kann diese samt Daten von Inktomi uebernehmen.

Da ist so, als ob Sie eine massgeschneiderte Loesung erwerben, solange Sie sich fuer eine der von der Stange gebotenen Alternativen entscheiden koennen. Inktomi bietet verschiedene Methoden des Rankings, d.h. der Bewertung und damit Sortierfolge der Daten, sowie unterschiedlich grosse Bestaende, in denen gesucht wird.

Waehrend jeder Suchmaschinen-Betreiber heute behauptet, das ultimative Ranking-Verfahren zu besitzen und dies vielleicht auch, wenn entsprechender Aufwand bei der Software-Entwicklung betrieben wurde, glaubt, trifft dies auf Inktomi-Kunden nicht zu. Entwicklerstolz und der Glaube an die eigene Konzeption fehlen, weil das fuer eine Suchanfrage "beste Dokument" nicht eindeutig bestimmt wird.

So wird verstaendlich, dass der gleiche Suchbegriff bei vielen Inktomi-Kunden zu unterschiedlichen Ergebnissen fuehrt. Und wie bei den meisten Suchmaschinen, kann auch bei Inktomi-Daten beobachtet werden, dass die Position einer Seite fuer einen spezifischen Suchbegriff ein zyklisches Auf und Ab erlebt, klar zum Ausdruck bringend, dass der Wert oder die Qualitaet einer Seite eine schwankende Groesse ist, die nicht durch den Inhalt sondern die vermutete Notwendigkeit der Schaumschlaegerei gesteuert wird.

Dies ist nicht weiter tragisch, da im Informationszeitalter niemand mehr hohe Ansprueche zu haben scheint. Viele Betreiber von Suchmaschinen sehen als Zielgruppe ohnehin nur die Kaeufer von Bannerwerbung, deren intellektuelle Leistungsspitze das Binden von Kravatte und Pferdeschwanz ist. Der Suchende kommt ueberall zu kurz, da Masse, und nicht Qualitaet zaehlt.

Quantitaet statt Qualitaet

In einem Research Paper las ich kuerzlich, dass 99% aller Seiten fuer 99% aller Anwender uninteressant sind. Das muss als Understatement des Jahres gelten. Die Zahl der Web Seiten kennt heute niemand. Die Qualitaet schon. An den Universitaeten und auch in ein paar privaten Research Labs weiss man, dass mehr als 90% aller Web-Inhalte wertlos sind, keine Information enthalten, und nur erstellt wurden, um offensichtliche oder vermutete Schwaechen der Suchmaschinen zu missbrauchen, um Besucher auf die Site zu locken. Die Hits muessen nach oben.

Der Porno-Adel ist hier besonders aktiv. Es gibt kein im Sprachgebrauch haeufig vorkommendes Wort, fuer das die Branche keine optimierten Seiten erstellt. Ganz gleich, ob Anwender nach Managementkursen oder +Hamster +Wartung suchen, meist ist unter den gebotenen Ergebnissen ein Redirekt auf sog. WebDreck.

Selbst Leute, die das Internet noch nie benutzt haben, wissen, dass man nur gewisse Begriffe eingeben muss, um auf dem Bildschirm zu sehen, was im Zeitungsladen - zumindest hier - nur auf den oberen Regalen zu finden ist.

Kurzfristiges Denken fuehrt zu staendigem Qualitaetsverlust. Bei Anbietern, Inhalten und Anwendern. Kaum ein Unternehmen ist bereit, intensive Entwicklung zu betreiben. Eine Situation wie in den 70ern bei AT&T, die zur ungeplanten Entwicklung von Unix und der Sprache C fuehrten, sind heute undenkbar. Kommerzielle Entwicklungen muessen heute auf den Markt, bevor sie fertig sind - niemand darf uns mit einem aehnlich unfertigen Produkt zuvorkommen.

Das gleiche kurzfristige Denken fuehrt zur Erstellung von Seiten, die keinen Wert haben, oder zu Verfahrensweisen, die schon kurzfristig zum Bumerang werden. Obwohl meine Haltung bekannt sein sollte, konnte ich einen Kunden nicht davon abhalten, Web Server und Inhalte so zu gestalten, dass durch Passwort geschuetzte Seiten von Suchmaschinen-Spidern, nicht aber von Normalsterblichen erreicht werden konnten. Auch der Hinweis darauf, dass mehrere Suchmaschinen heute als User-Agent einen Microsoft-Browser vorgeben und auch manuelle Stichproben durchfuehren, konnte den Taeuschungsversuch unterbinden. Die Geschaeftsfuehrung besteht darauf und muss sich mit gemeinen Taschendieben und Wegelagerern ueber einen Kamm scheren lassen. Hilfestellung zu erwarten, betrachte ich als Unverschaemtheit.

Erste UK-Dot.Com-Pleite

England hat kuerzlich die erste "Dot-Com" Pleite erlebt. Weil mehr als 80 Mio Pfund, ca 250 Mio DM, "Marketing" nicht verhindern konnten, dass niemand kam, geriet die Sache in die Medien, erstmals daran erinnernd, dass auch auf dem Web nur mit Wasser gekocht wird.

Da es sich bei den 80 Mio, die fuer Marketing verblasen wurden, und den zwei oder drei Millionen fuer Infrastruktur, Personal, Autos und Bueroeinrichtung vom Feinsten, um das von Aktionaeren bereitgestellte Kapital und nicht etwa Eigenmittel der Gruender handelte, war der Verlust nicht weiter tragisch. Aktionaere sind selber schuld, und die Gruender haben schon eine neue Idee - auch wenn der Zeitpunkt momentan etwas unguenstig erscheint.

Davon laesst sich nicht jeder abhalten. Diese Woche hoerte ich von einem neuen "Start Up". Jemand hat tatsaechlich die glorreiche Idee, ueber das Web zu verkaufen. Die Einrichtung des Servers kostet "ein paar hundert Pfund", das Startkapital kommt aus irgendwelchen Foerdermitteln, die die EU bereitstellt, d.h. von Ihnen und mir, und die Finanzplanung steht. Was man vorhat, online zu verkaufen? Katzenstreu.

Modernes Verkaufen

Letzte Woche war ich unterwegs, um mir eine Hose zu kaufen. Recht entgeistert betrachtete mich der Verkaeufer, als ich ihm auf die Frage, ob ich eine Hose mit "funktionalen Fasern", eine fuer Indoors oder Outdoors suche, antwortete, dass mir eine passive Hose, die ich In- _UND_ Outdoors tragen kann, noch am Liebsten waere. Erst als ich die in einem anderen Laden gekaufte Hose zu Hause vorstellte und dabei die Brille aufsetzte, stellte ich fest, dass die neue einen Sonnenschutzfaktor besitzt. Muss ich jetzt meinen Arzt aufsuchen? Ich habe mein Leben lang Hosen ohne eingebauten Sonnenschutz getragen. Sie wissen ja, Hautkrebs und so...

Die Erfahrung verleitet mich dazu, zu behaupten, dass Natural Language Processing eine aehnliche Zukunft erleben wird, wie kuenstliche Intelligenz. Naemlich keine. Beide basieren auf einer staendig gepflegten Know How-Basis, die heute nicht mehr erstellt und schon gar nicht gewartet werden kann. Nicht nur, weil funktionale Fasern das Stillsitzen verhindern, sondern vor allem, weil Sprache heute so "lebendig" ist, dass Formulierungen je nach Alter des Angesprochenen recht differenzierte Bedeutung erlangen.

Man kann also davon ausgehen, dass die Zukunft nur neue Versprechungen, nicht aber neue Entwicklungen bringen wird. Erkennbar wird dies bei juengsten Forschungen, bei denen man sich auf die Urspruenge des Information Retrieval besinnt.

Laufende Bemuehungen in den USA zielen darauf, die jedem Dokument inhaerente Qualitaet als Masstab der Bewertung zu nehmen, weil alternative Ansaetze, wie z.B. Googles Methode der Link-Popularitaet nicht nur bereits bekannte Seiten weiter foerdern und nicht bekannte benachteiligen, sondern vor allem grosse [aber nicht so bekannte] Schwaechen haben: zwei Seiten, die jede auf die andere linken, aber keine Links nach aussen haben und die nur ueber einen Link von aussen erreicht werden koennen, fuehren zu, sagen wir mal, CPU-intensiven und "eigenartigen" Ergebnissen. Wie alle, wurde auch diese Macke erst in der Praxis entdeckt.

Nahezu jedes System der Spam-Bekaempfung kann missbraucht werden, wenn bekannt wird, wie eine Suchmaschine bewertet. Nur gruendliche Auseinandersetzung mit den messbaren Eigenschaften einer Seite kann Missbrauch zu einem Grossteil verhindern.

Suchmaschinen-Technologie unterliegt, weil sie heute durch Marketing gelenkt wird, groesstenteils der Mode. Nachdem jede die Groesste wurde und jede in irgendeiner Form die Zahl der auf eine Seite fuehrenden Links beim Ranking bewertete, ist es an der Zeit, die Qualitaet bereitgestellter Seiten zu verbessern. Wenn die erste Suchmaschine verkuendet, "Qualitaet" als ausschlaggebendes Kriterium zu bewerten, dauert es nicht lange, bis andere nachziehen, durch neue PR-Meldungen oder auch durch neue Software. Ihre Besucher haben nichts gegen bessere Seiten einzuwenden.

Newsletter Archiv

© Copyright 1998 - 2008 Klaus Schallhorn.