Sitemap

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

Eine Sitemap ist eine vollständige und hierarchisch strukturierte Auflistung aller Einzelseiten einer Webpräsenz. Neben der als Navigationshilfe und für die direkte Betrachtung durch menschliche Nutzer gedachten Sitemaps gibt es das Sitemaps-Protokoll, das in UTF-8-codierten XML-Dateien die Struktur einer Webseite für Suchmaschinen zugänglich machen soll.

Suchmaschinen

Sitemaps ermöglichen es Suchmaschinen einen schnellen Abgleich zwischen bereits indexierten und vorhanden Seiten zu machen. Über Zusatzinformationen können weitere Prioriätskriterien der Suchmaschine mitgeteilt werden [1].

Im Allgemeinen ist es daher sinnvoll Sitemaps für Suchmaschinen an zu bieten, da die übliche CMS-Software sowieso eine Unterstützung mitbringt. Für kleine oder einfache Projekte ist ein Bot aber auch ohne Sitemap-Unterstützung in der Lage die Webseite vollständig zu indexieren.

Übliche Formate sind:

Sicherheit

Vertraulichkeit

Es kommt öfters vor, dass durch Sitemaps ungewollt vertrauliche Informationen veröffentlicht werden obwohl diese eigentlich nicht öffentlich zugänglich sind.

Beispiele hierfür sind:

  • Eingesetzte Software /admin/angreifbare/software/readme.v.0.0.1.html
  • Pfade welche Nutzerinformationen enthalten /privat/max.muster/

Scripte welche die Sitemap automatisiert erstellen sollten daher sorgfältig geprüft werden.

Verfügbarkeit

Die Sitemap sollte nicht bei jedem Aufruf aktualisiert werden, da es bei umfangreichen Projekten viele Ressourcen binden kann. Dadurch vielfache parallele Anfragen ist sonst ein Angreifer in der Position einen hohen Ressourcenverbrauch provozieren und die Verfügbarkeit der Webseite zu gefährden.

Siehe auch

Weblinks

  • sitemaps.org: sitemaps-protokoll