Na dann Gute Nacht!

30. Juni 2004. Permalink

Wenn Sie Ihren Kindern etwas Gutes tun wollen, sollten Sie ihnen einen Sprachkurs finanzieren. Die indische oder asiatische Sprachen sind besonders zukunftsfest. Yahoo, allwissende Mutter von AllTheWeb und einem Zoo diverser in den letzten Jahren gekaufter Suchmaschinen hat jetzt auch den sog. URL Investigator bei ATW abgeschaltet. Eine Suchmaschine mit dem leicht zu merkenden Namen Ujiko hat, fast zeitgleich mit FindSVP, Suche neudefiniert. Da muss man - wenn man die Fernsteuerung des PC durch Fremde abgeschaltet hat - sogar den Suchschlitz [vergebens] suchen.

Ganz unverständlich ist mir nicht, wieso "Executives" heute noch die Lektion, die Google der Welt jeden Tag hunderte von Millionen mal erteilt, nicht verstehen. Wer einen Strick um den Hals trägt, darf sich über mangelnde Durchblutung nicht beschweren.

FindSVP hat nicht ganz Unrecht, wenn man in einer Pressemitteilung beklagt, dass beim Suchen p.a. $US31 Mrd unproduktiv verblasen werden. Leider erfolgt die PR-Meldung aber nur, um schlecht Durchbluteten ein eigenes Produkt anzubiedern, statt auf die Hilfsseiten der Suchmaschinen zu verweisen. Dort wird Syntax [ganz ohne Fremdwörter geht es manchmal nicht] erklärt, die bei Anwendung eine für Viele ganz neue Welt aus dem Datenwust hervorzukitzeln vermag.

In diesem Zusammenhang: Intern.de nennt hier einen nur durch die Vermögensverhältnisse des Anwenders begrenzten Kostenfaktor, der in der idiotischen Diskussion, ob Linux oder Windows langfristig teurer ist, nicht auftaucht.


Google Update

23. Juni 2004. Permalink

Google hat soeben wieder ein Update gefahren. Mit Ausnahme von Yahoo, wo sich die Situation kaum verändert hat, haben viele Präsenzen seit Monaten wieder mal eine - teilweise drastisch - gestiegene Zahl eingehender Links.

Adoptierte Stiefkinder

Werden Altavista und AllTheWeb ganz eingestellt? Wer sich die gelieferten HTTP Headers ansieht, kann die Idee nicht unbedingt von der Hand weisen [Zeilen-Umbrüche zwecks besserer Lesbarkeit eingefügt]:


HTTP/1.1 200 OK
Date: Wed, 23 Jun 2004 08:50:24 GMT
P3P: policyref="http://p3p.yahoo.com/w3c/p3p.xml", CP="CAO DSP COR CUR ADM DEV
	TAI PSA PSD IVAi IVDi CONi TELo OTPi OUR DELi SAMi OTRi UNRi PUBi IND
	PHY ONL UNI PUR FIN COM NAV INT DEM CNT STA POL HEA PRE GOV"
Expires: Thu, 01 Jan 2004 00:00:00 GMT
Last-Modifed": Wed, 23 Jun 2004 08:50:24 GMT
Cache-Control: no-store,no-cache,must-revalidate
Cache-Control: post-check=0, pre-check=0
pragma: no-cache
Connection: close
Content-Type: text/html; charset=ISO-8859-1
Set-Cookie: B=4rudhd50dih2g&b=2; expires=Thu, 15 Apr 2010 20:00:00 GMT;
	path=/; domain=.yahoo.com

Antike Perlen

21. Juni 2004. Permalink

Wer immer noch glaubt, Online Information Retrieval [teutonisch: Suche] wäre eine Erfindung, die erst durch das Web möglich wurde, wird in einer [englischsprachigen] Serie in sieben Teilen eines Besseren belehrt. Pioniere der Branche plaudern dort über Erfahrungen und Fortschritte seit den [19]60ern.

http://www.infotoday.com/searcher/jun03/ardito_bjorner.shtml

Gewusst, wo!

Wer Verlinkung gegen Bares an den Mann bringen will, braucht für die Distribution nur das richtige Werbe-Medium.


Pagerank-Diebstahl verhindern

16. Juni 2004. Permalink

Unüberlegter Journalismus hat dazu geführt, dass ein nur Wenigen bekanntes Google-"Feature", das ungerechtfertigte Vererbung von Pagerank ermöglicht, an die Öffentlichkeit kam. Während die Veröffentlichungen zwar nicht in allen Details korrekt sind und auch nicht die komplette Kette der von Schmarotzern zu erfüllenden Voraussetzungen nennen, sehe ich mich gezwungen, einen im Kundenbereich am 22.4. veröffentlichen Hinweis [damals begleitet durch einen Eintrag in meinem Blog vom gleichen Tag] nachfolgend zu wiederholen:

Pagerank-Klau verhindern

Einzelne Indizien habe ich im Laufe der letzten beiden Jahre mehrfach beobachtet. Über manche haben sich Besucher von Foren wie z.B. Suchmaschinentricks mehrfach negativ geäussert, ohne die Folgen vollends zu erkennen. Nachdem ich auf eine Site stiess, die angeblich mehr als 300 mal von meiner verlinkt wurde, ergab längere Korrespondenz mit einem Google-Techniker, dass auf diese Art Pagerank transferiert wird.

Dagegen schützen können Sie sich momentan nur, wenn Sie sog. voll qualifizierte Links in Ihren Seiten verwenden, oder wenn Sie allen Seiten ausdrücklicher einer Basis zuweisen.

Zur Erklärung:

Link-TypBeispielErklärung
relativ:<a href="file.html">Datei im gleichen Verzeichnis
absolut:<a href="/pfad/file.html">Datei auf dem gleichen Host
voll qualifiziert:<a href="http://domain.de/pfad/file.html">vollständige URL

Da es zu übergrossen Dateien führt, eigentlich unnötig und vor allem lästig ist, in jedem Fall voll qualifizierte URLs zu verwenden, bietet sich als Alternative die Möglichkeit, alle internen Links ausdrücklich und um jeden Zweifel zu vermeiden, einer einheitlichen Basis zuzuweisen. Dies geschieht durch Anbringung des BASE Elements im HEAD einer Seite:

<base href="http://ihre.domain.de/">

Damit wird jeder Link Ihrer Seiten, der nicht ausdrücklich auf einen externen Host führt, zweifelsfrei Ihrer Site zugeordnet und der unberechtigte Transfer von Pagerank an Trittbrettfahrer verhindert.

Bitte beachten Sie, dass in diesem Fall nach dem Domainnamen ein Schrägstrich [Ihr Stammverzeichnis verkörpernd] angegeben werden muss, da manche Spider [vor allem Yahoo/Inktomi] durch einen Bug im URL-Parser ohne den Schrägstrich im Kreis laufen. Anbringung des obigen Beispiels setzt ebenfalls voraus, dass Sie für interne Links stets absolute URLs verwenden. Bei Verwendung relativer URLs muss das BASE Element für diese Seiten dann auf das entsprechende Verzeichnis verweisen. Beispiele für beide Formen finden Sie, wenn Sie den Quellcode z.B. dieser Seite mit einer Seite aus meinem Suchmaschinen-Tutorial vergleichen.


Schlechte Gesellschaft

15. Juni 2004. Permalink

Wenn ich meinen Server-Aufzeichnungen Glauben schenke, ist fast jeder zehnte Referrer meiner Site im Rotlicht-Bereich angesiedelt. Wer die Hose noch mit der Kneifzange anzieht, wandert natürlich schnurstracks auf diese Seiten, um den Link auf die eigenen Site zu sehen. Was fehlschlägt, da man statt dessen dem Fleischbeschau der Pornographen ausgeliefert ist. Gehen die Geschäfte so schlecht?

Auch der Versuch, eine Site, die den Mailbox-Spammern das Leben schwer zu machen verspricht, über Log-Spam bekannt zu machen, geht nach hinten los. Auf der Spampoison getauften Site wird man aufgerufen, einen Link von der eigenen auf deren Site zu setzen, damit Spam-Robots dort mit einer unendlichen Vielfalt fiktiver Email-Adressen konfrontiert werden. Haben diese Leute noch nicht gehört, dass die Unzustellbaren, durch die man die Spammer zu "überfluten" gedenkt, nur unschuldige Dritte treffen?

Instant Support

Es ist sicher kein Zufall, dass jemand diese Site so benannt hat.


Der Riese schläft

11. Juni 2004. Permalink

In einem Report, der von der für Offene Systeme mit globaler Fernbedienung bekannten Firma Microsoft veröffentlicht wurde, beklagt man, dass 8% aller Web-Seiten reiner Spam sind. Und, so empört man sich, man habe bei einer Analyse von 1 Milliarde von Seiten gar eine Site in Deutschland entdeckt, die dabei besonders erstaunliche Techniken anwendet, nämlich die dynamische Verwendung von Texten, die anderen Seiten entnommen werden.

Während man bei Rotten lesen kann, dass ein gewisser Herr Bush ausser Stande ist, ein seine jeweilige Einstellung widerspiegelndes verächtliches Grinsen zu verhindern, kann ich mir gut vorstellen, dass Suchmaschinen-Entwickler und Spider-Erfahrene in aller Welt beim Lesen der obigen Aussage genau dieses Grinsen aufsetzen.


Sprachbarriere

8. Juni 2004. Permalink

Gates, der sich selbst im Zeugenstand um die eindeutige Definierung der Bedeutung bestimmter Wörter verdient gemacht hat, und der oft genug vor dem Mikrofon die eigene Eloquenz unter Beweis stellt, verspricht jetzt für die neue, möglicherweise Gedanken lesen könnende Suchmaschine, über die man im Hause Microsoft phantasiert - statt sich dringenderen Dingen zu widmen - das Verstehen natürlicher Sprache.

http://www.heise.de/newsticker/meldung/48016

Wer nicht nur die Umgangssprache beherrscht, muss erkennen, dass das Anliegen gewisse Schwierigkeiten aufwirft. Wie ich in meinem letzten Newsletter erwähnte, erinnert Tim Bray daran, dass eine Suchmaschine, die derart intelligent ist, Anspruch auf Staatsbürgerschaft haben müsste. Und Andreas Schaale berichtete mir mal über die zum Schiessen komischen Ergebnisse, wenn man solche Systeme mit dem Wort "Wellington" konfrontiert.

GIGO

Parser-Probleme bei Google.


Link-Flaute

4. Juni 2004. Permalink

Das Anfang der Woche stattgefundene Google-Update hat bei genauerer Betrachtung wieder eine Reihe von grossen Präsenzen "getroffen". Ich frage mich, ob man die Sites, die [teilweise u.a.] vom Link-Verkauf leben, algorithmisch ermittelt, oder ob man zur Entdeckung manuell die deutschen Ebay-Seiten besucht.

Aus zwei mach eins

Durch Kombination der Bildersuche der ehemaligen AltaVista- und AllTheWeb-Bestände hat der neue Eigentümer Yahoo aus zwei Alternativen eine geschrumpfte Kombination erstellt. Gemunkelt wird ausserdem, dass hunderte von Nachrichten-Quellen nicht mehr ausgewertet werden.


Google-Korrektur

2. Juni 2004. Permalink

Als ich am 22. April feststellte, "Jetzt gibt es eine Domain, die gemäss Google mehr als 300 mal von Seiten meines Tutorials und meinem Newsletter-Archiv verlinkt wird, obwohl mir der Domainname der verlinkten Site bis zur Entdeckung der angeblichen Verlinkung nicht bekannt war...", wurde dies [möglicherweise, weil ich - bewusst - keine Namen nannte] angezweifelt. Beim jetzigen Google-Update sind die Links verschwunden, der Pagerank der Site, die von nicht existierenden Links profitierte, ist von 6 auf jetzt 2 geschrumpft.


Fakt

1. Juni 2004. Permalink

Yahoo innoviert weiter. Ein paar zusätzliche Suchmodi nennen jetzt die Zeit in anderen Zeitzonen, erlauben die Umrechnung diverser Masseinheiten und auch Wechselkurse für zahlreiche Währungen. Viele der erweiterten Such-Möglichkeiten gibt's nur bei Yahoo.COM: Yahoo erweiterte Suche.

Fiktion

Jeder Zweite geht leer aus, glaubt man einem gewissen Herrn Mehdi, ein bei MSFT [bekannt für Open System Software] im Sold stehender Blasen-Redner. So will er beobachtet haben, dass jede zweite Suchanfrage nicht beantwortet wird, weshalb man die eigenen Angebote verfeinern will. Wer so lange nicht warten kann, wird vielleicht hier fündig.

http://www.microsoft-watch.comärticle2/0,1995,1602807,00.asp

Suchmaschinen Blog Archiv


© Copyright 1998 - 2008 Klaus Schallhorn.