HotBot, Speedfind, Fireball & AOL.

Innovative Innovationsspruenge

Nicht nur Suchmaschinen, das Web, die Elektronik und Formen der Kommunikation, sondern unsere Zukunft als Ganzes wird durch Innovation vorangetrieben. Mit Innovation befasst sich der Innovatio-Verlag [Medien-Tenor]: "Seit 1985 sind wir bei der Gestaltung von Veränderungsprozessen ein Partner zu den Schwerpunkten...", folgt die uebliche Bullshitter- Litanei derer, die nicht koennen und deshalb darueber schreiben muessen.

Eine vom Innovatio-Verlag genutzte Innovation: wer den email- Newsletter der Moechtegerne abonniert, wird ihn nie wieder los: Abmeldung auf der Web Site wird ignoriert, Reklamationen per email werden offenbar von niemandem gelesen.

Suchmaschinen-Neuerungen

Die wichtigsten Neuerungen bei den Suchmaschinen waren ein paar Umzuege [HotBot wohnt jetzt bei Lycos und AOL wurde von netfind.aol.com auf search.aol.com verlegt] sowie eine Ladung Spam von Lycos. Besonders clever, denn wer der Einladung folgen will, wird, wenn er nicht ueber einen Provider in der Neuen Welt auftritt, an eine Lycoliale in der Alten dirigiert. Was waere die Welt ohne Marketing.

Weil ich Verzeichnisse nur selten nutze, ist mir erst diese Woche aufgefallen, dass auch Yahoo! mobil ist. Mehrere europaeische Server, z.B. www.yahoo.co.uk und www.yahoo.de, wurden nach Schweden verlegt und sind jetzt ueber das jeweilige "domain-kuerzel".yahoo.com, z.B. de.yahoo.com, erreichbar.

Bei Speedfind heisst es, "Es werden alle Seiten auf den Toplevel-Domains .de, .ch, .at erfasst". Das ist nicht korrekt. Wenn ich mit der zitierten Phrase suche, erhalte ich: "Keine weiteren Dokumente gefunden". Dto fuer andere Phrasen, von denen man weiss, dass sie im Datenbestand vorhanden sind [wenn man diese z.B. nach einer einfachen Suche aus den Ergebnissen in den Suchschlitz kopiert. Dass es sich um eine "komplette Neuentwicklung" handelt, ist vielleicht etwas grosszuegig ausgelegt. Eher die alte Intersearch - "warts an' all", wie man hier so sagt.

Spieglein, Spieglein an der Wand

Der "meiner ist der laengste"-Wettbewerb, d.h. die Behauptung, man habe den groessten Datenbestand aller Suchmaschinen, ist momentan ausgesetzt. Suchmaschinen haben jetzt das Directory, d.h. den Verzeichnis-Typ, auf die Marketing-Pfanne gesetzt.

Fireball bietet seit einiger Zeit ein maschinell erstelltes Verzeichnis, andere Suchmaschinen machen es sich einfacher und nutzen schamlos das Open Directory.

http://www.dmoz.org/

Oft werden Suchergebnisse mit Eintraegen aus dem OD gemischt, angereichert oder einfach hinten dran gehaengt, so zum Beispiel bei AltaVista [com], wenn man die laute Version benutzt, weil man die Text Only-Version vielleicht nicht kennt:

http://www.altavista.com/cgi-bin/query?text

Zeitzeichen

Verzeichnisse, so glaubt man [momentan - auf dem Web ist keine Erkenntnis von Dauer], sind fuer den Anwender einfacher zu nutzen und scheinen eine hoehere Qualitaet zu besitzen. Ein besonders ueberzeugendes Beispiel hierfuer zeigt Snap, wenn Sie [im 2. Suchschlitz, der erste ist fuer US Zip-Codes] dort nach Suchmaschinen suchen:

http://www.snap.com/

Damit sind wir quasi wieder da, wo wir angefangen haben. Bevor sich ein paar Studenten aufrafften, und Yahoo! aus dem Boden stampften, gab's jede Menge Verzeichnisse... in Form von Lesezeichen, die veroeffentlicht wurden. Yahoo! war das erste allumfassende Verzeichnis, solange Yahoo noch halbwegs mit den selbst entdeckten Juwelen und der viel groesseren Zahl der angemeldeten Seiten mithalten konnte.

Trotzdem wurde das Verzeichnis schnell als das erkannt, was es ist: eine mehr oder weniger zufaellige Auswahl, die stets nur Bruchteile des Ganzen bieten kann. Denn haette Yahoo! wirklich allen Anspruechen genuegt, wuerde niemand eine Suchmaschine brauchen.

Der unvergleichliche Aufstieg AltaVistas zeigt, dass Anwender mehr verlangen, als zu "yahoo!en". Und AltaVista war nicht die letzte Suchmaschine, die besseres versprach.

Es sollte offensichtlich sein, dass kein Verzeichnis allen Anwendern gerecht wird [oder je werden kann]. Jeder, der in der Lage ist, bei einem kostenlosen Provider eine "Homepaetsch" mit gebotenen Online Tools oder einer vom Freund geliehenen Version Frontpage zusammenzuschrauben, hat nur einen Wunsch: diese Seite in allen Suchmaschinen und Verzeichnissen zu finden. Moeglichst fuer jeden nur denkbaren und undenkbaren Suchbegriff. Auf dem ersten Platz natuerlich.

Diese "Informationsflut" [viele Seiten enthalten tatsaechlich Woerter] laesst sich natuerlich nur mit Manpower, Womanpower oder Hard- und Software loesen. Reine Verzeichnisse sind damit permanent auf eine Nebenrolle angewiesen, da die erforderliche Leistung nicht erbracht werden kann. Selbst die vielen ODP-Volontaere werden der Anmeldeflut nie Herr, zu Frustration und Bevorzugung automatisch arbeitender Systeme fuehrend, auch wenn diese laengst nicht perfekt sind.

Selbstverstaendlich sollten Sie Ihre Seiten in Yahoo! und andere Verzeichnisse eintragen. Die heute oefters vorgebrachte Argumentation, dass Suchmaschinen sich ploetzlich selbst zu Verzeichnissen wandeln, ist aber nichts anderes als Marketing- Strategie des Monats. Und damit nicht die erste, die schon kurze Zeit spaeter unter "waer schoen gewesen, ..." abgeheftet wird.

HTML-Kniffe

Manche Fragen zeigen, dass Autoren noch nie eine Web Seite "von innen" gesehen sprich HTML-Quellcode [es ist ja nicht mehr, als einfacher Text] gelesen haben.

Typische Beispiele: "Lesen Suchmaschinen Tabellen von links nach rechts oder spaltenweise?" "Kann ich verstecken, dass meine Seiten Server Side-Includes haben?"

Um die erste Frage zu beantworten: Seiten werden in der Regel sequentiell abgearbeitet, d.h. der darin enthaltene Text - und dazu zaehlen auch Ziffernfolgen und andere in ISO 8859-1 darstellbare Zeichenketten - wird von links nach rechts oder so wie er kommt bearbeitet. Verschiedene Suchmaschinen teilen einzelne Textbloecke in "Container" auf, bei denen Textteile entsprechend HTML-Tag unterschiedlich gewichtet werden.

Wie die Seite im Browser aussieht, und wie Tabellen in diesem dargestellt werden, weiss nur der Leser - nicht der Autor! - der Seite. Wieso?

Jeder Browser arbeitet anders. Entscheidend sind hier der Hersteller, die Version, das Betriebssystem, die Konfiguration und der Zustand interner Puffer und Variablen, d.h. inwieweit diese durch Software-Fehler, mangelhafte im Browser ausgefuehrte Scripte und fehlerhafte HTML unbeabsichtigt ueberschrieben wurden.

Manche behandeln Tabellen wie <P>-Tags, ein paar weit verbreitete haben selten Probleme mit dem Rendering von Tabellen, waehrend wieder andere abstuerzen. Mit anderen Worten: die Darstellung einer Seite auf Ihrem Bildschirm ist ein Unikat, das, waere es gemalt und von einem hungernden Autor erstellt, spaeter mal fuer viel Geld versteigert werden koennte. Auf die Reihenfolge der Bearbeitung hat das Layout keinen Einfluss.

Ganz anders sieht es mit auf dem Server ausgefuehrten Scripts wie z.B. SSI aus. Was hier passiert, sehen andere nur, wenn etwas nicht richtig passiert. Soll heissen, korrekt arbeitende Server und Server-Scripts modifizieren den ausgelieferten Inhalt und geben sich nicht als solche zu erkennen. Die Datei- Endung .shtml ist nicht mehr als ein [gut begruendeter] Brauch und garantiert nicht, dass es sich um eine Seite handelt, deren Inhalt dynamisch erzeugt wurde [auch wenn die Vermutung angebracht ist].

Gelegentliche Betrachtung des Quell-Codes bringt, je nach Autoren-"Werkzeug" [nicht alle verdienen die Bezeichnung], oft Interessantes hervor, z.B. Gruende, warum manche Seiten in den Suchmaschinen nie eine attraktive Position erreichen.

HTML Probleme

AOL-Alleingang

Wir wissen, dass AOL-Anwender wie AOL auch ein elitaeres Grueppchen sind. AOL hat sich bereits mehrfach um genaue Segmentierung und Klassifizierung grosser Bevoelkerungschichten verdient gemacht, in vielen Unternehmen zu Arbeitseinsparungen bei der email-Bearbeitung fuehrend.

Jetzt wagt AOL einen Schritt, der allen Markenartiklern und Grossunternehmen zeigt, wie man's macht. AOL bietet beim Versand von Spam an AOL-Kunden, wie jeder serioese Bulk Mailer, dem Empfaenger die "Opt Out-Moeglichkeit", d.h. sich als NICHT-Empfaenger registrieren zu lassen. Mit dem kleinen aber feinen Unterschied, dass diese Registrierung nach einem Jahr erneuert werden muss.

http://www.mercurycenter.com/svtech/news/indepth/docs/dg113099.htm

Sparmassnahmen

Bei dieser Gelegenheit faellt mir ein: Ich muss sparen. Mittel sind nicht unendlich streckbar. Eines, das sich kontrollieren laesst, ist Zeit. Ich habe daher entschieden, email, die als HTML hier ankommt, ungelesen zu loeschen. Ich mache das bereits seit etwa 14 Tagen und solange, bis ich die Zeit finde, einen automatischen Filter zu installieren.

Dabei gibt es selbst fuer jeden Arbeitsplatz effiziente und oft kostenlose Mail-Programme. Eines der ersten und solidesten wird leider nicht weiterentwickelt, weil Darstellung, die sexy sein soll, heute Vorrang vor Funktionalitaet und Sicherheit hat:

http://www.intern.de/news/134.html

Gnumor

Wer unter Unix und / oder in C programmiert, sollte sich mit ein paar wichtigen neuen Error-Codes vertraut machen, auch wenn POSIX-Konformitaet noch nicht gegeben ist:

http://www.gnu.org/fun/jokes/errno.2.html

Aus dem gleichen Hause fast schon ein Style Guide fuer C:

http://www.gnu.org/fun/jokes/declarations.html

Newsletter Archiv

© Copyright 1998 - 2009 Klaus Schallhorn.