Suchmaschinen basieren auf komplexen Software-Systemen. Manueller Aufwand wird hier bei der Entwicklung von Software, nicht bei der Begutachtung von Seiten, betrieben.
Sog. Spider oder Crawler der Suchmaschinen arbeiten wie automatisierte Browser, die eine nahezu unendliche Liste von Seiten bearbeiten. Diese Liste enthält URLs, die beim Spidern den abgerufenen Seiten entnommen werden und solche, die durch Suchmaschinen-Eintrag der Site-Betreiber ebenfalls - nach einer Prüfung - in die Warteschlange kommen.
Nachdem eine in der Liste enthaltene Seite vom entsprechenden Web Server auf die Hardware der Suchmaschine übertragen wurde, kommen in dieser Seite gefundene Links in ein Körbchen und der in dieser Seite enthaltene Text in ein zweites.
Gefundene Links werden, wenn sie in der zu bearbeitenden Liste noch nicht enthalten sind und eine interne Sperrliste oder andere Einschränkungen nicht dagegen sprechen, an das Ende der Liste der zu bearbeitenden URLs gefügt. Der Text der Seite wird bewertet, gewichtet und dann in die Datenbank der Suchmaschine übernommen.
Beide Vorgänge werden von einem Grossteil der Web-Entwickler falsch verstanden und führen immer wieder zu vermeidbaren Problemen, die aber verhindern, dass Suchmaschinen Seiten finden, auch wenn der Suchmaschinen-Eintrag mehrfach erfolgt.
Suchmaschinen-Tutorial:
Inhalt
Weiter: Wie Suchmaschinen-Spider
Seiten finden
© Copyright 1998 - 2008 Klaus Schallhorn.