Typische Standard-Einstellungen neu installierter Web Server gehen davon aus, dass alle im Stammverzeichnis des Servers und tiefer abgelegte Dateien für die Öffentlichkeit gedacht sind.
Unüberlegte Konfigurationen legen Protokoll-Dateien gleichzeitig ungeschützt im Zugriffsbereich des Web Servers ab, damit Log Files vom Site-Betreiber mit dem Browser abgerufen werden können.
Wenn die Konfiguration des Web Servers obendrein dynamische Verzeichnis-Übersichten [meist index.html genannt] erstellt, kann so jede nicht durch Passwort geschützte Datei von jedem Anwender weltweit abgerufen werden.
Manche Suchmaschinen-Spider rufen nicht nur als Link gefundene URLs ab, sondern versuchen auch, vollständige Verzeichnisbäume zu untersuchen. Hierbei wird jede URL um den letzten Teil, die jeweilige Datei also, gekürzt, so dass aus z.B. www.xyz.com/pfad/datei.html die URL www.xyz.com/pfad/ wird.
Liefert der Web Server ein Inhaltsverzeichnis für diese URL, sind alle darin enthaltenen Dateien sichtbar, d.h. automatisch verlinkt, auch wenn Ihre eigenen HTML-Seiten keine Links auf diese aufweisen.
So kommt es, dass Protokoll-Dateien und auch Vertrauliches schonmal in die Suchmaschinen rutschen. Die Annahme, dass niemand von der Existenz dieser Dateien weiss, schützt vor Überraschungen nicht.
Bereiche, die nur einem begrenzten Personenkreis zugänglich sein sollten, müssen daher durch besondere Massnahmen geschützt werden, so dass der Webserver den Zugriff auf Daten in diesen Verzeichnissen verweigert. Genauere Informationen entnehmen Sie Ihrer Server-Dokumentation.
Suchmaschinen-Tutorial:
Inhalt
Weiter: Suchmaschinen und HTTP-Header
© Copyright 1998 - 2008 Klaus Schallhorn.