HTML/Regeln/Konventionen für Dateinamen

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

In Bezug auf Dateinamen, -endungen und die Hierachie von Dokumenten innerhalb einer Domain haben sich Konventionen entwickelt, die man beachten sollte.

Dateinamen[Bearbeiten]

Die meisten Server-Rechner im heutigen Web haben ein Unix- oder von Unix abgeleitetes Betriebssystem. Unix unterscheidet strikt zwischen Groß- und Kleinschreibung bei Dateinamen. Wer sein Web-Projekt beispielsweise in einer DOS-/Windows-Umgebung erstellt, wo dies keine Rolle spielt, kann bittere Erfahrungen machen, wenn plötzlich die lokal funktionierenden Verweise und Grafikreferenzen nach dem Hochladen auf den Server-Rechner nicht mehr funktionieren. Der Grund ist in solchen Fällen, dass beispielsweise in den HTML-Dateien kleingeschriebene Verweisziele oder Grafikdateinamen notiert wurden, während das DOS-/Windows-System großgeschriebene Dateinamen (oder die Endung .JPG) an den Server übertragen hat.

Es bleibt Ihnen in einem solchen Fall kaum eine andere Möglichkeit, als entweder die Dateien auf dem Server-Rechner mit Hilfe von FTP so umzubenennen, wie sie in den Verweisen und Grafikreferenzen notiert sind, oder die Verweise und Grafikreferenzen so anzupassen, dass die referenzierten Ziele korrekt gefunden werden. Wenn Sie mit einem System arbeiten, das Groß-/Kleinschreibung bei Dateinamen zwar für die Optik, aber nicht intern unterscheidet (z.B. Windows), ist es am sichersten, Sie erzeugen Dateinamen, die nur aus Kleinbuchstaben bestehen, und in Verweisen und Grafikreferenzen notieren Sie ebenfalls alle Dateinamen in Kleinbuchstaben.

Sollten Sie andererseits selbst ein Unix-System verwenden, so sollten Sie es vermeiden, innerhalb eines Verzeichnisses Dateinamen zu vergeben, die sich nur im Hinblick auf Groß- und Kleinschreibung unterscheiden (z.B. index.html, Index.html, INDEX.HTML). Eine derartige Benennung wäre nicht nur äußerst ungewöhnlich, sondern Sie könnten die Dateien mit solchen Namen auch nicht mehr auf einem Server mit einem Windows-Dateisystem ablegen. Auch kann ein Windowsanwender die Dateien in der obigen Form nicht lokal auf seinem System speichern.

Empfehlung: Verwenden Sie …
  • konsequente Kleinschreibung für Dateinamen und -endungen, um Missververändnissen vorzubeugen
  • Dateinamen nur bis zu 256 Zeichen Länge, auch wenn einige Systeme längere Namen erlauben.
  • Vermeiden Sie aber nach Möglichkeit deutsche Umlaute und ß in den Dateinamen, obwohl dies dank URL-Codierung und UTF-8 nicht mehr so problematisch ist. (Auch die URL dieser Seite enthält einen Umlaut im für.) Für ein internationales, nicht-deutschsprachiges Publikum und zum Abtippen bestimmter URLs sollten aber lieber alphanummerische ASCII-Zeichen ohne Großbuchstaben verwendet werden.
  • Als Sonderzeichen ist in jedem Fall der Unterstrich "_" erlaubt. Andere Satzzeichen sollten Sie vermeiden. *Fragezeichen "?" und Sternzeichen "*" sollten Sie auf jeden Fall vermeiden, da diese Zeichen bei fast allen Systemen eine besondere Bedeutung haben. Auch auf Leerzeichen sollten Sie unbedingt verzichten. (Diese werden z.B. von der Mediawiki-Software in Unterstriche umgewandelt.)

Dateiendungen[Bearbeiten]

Hierbei gilt generell: halten Sie unbedingt die üblichen Dateiendungen ein. Der Webserver muss anhand der Dateiendung entscheiden, welchen MIME-Type er dem Browser sendet. Und der Browser entscheidet anhand des MIME-Typs, wie er die Datei behandelt. Hier einige Beispiele:

  • Gewöhnliche HTML-Dateien erhalten entweder die Endung .html oder .htm.
  • HTML-Dateien mit enthaltenen Server Side Includes erhalten die Endung .shtml oder .shtm.
  • HTML-Dateien mit enthaltenen PHP-Abschnitten erhalten die Endung .php.
  • HTML-Dateien mit enthaltenen ASP-Abschnitten erhalten die Endung .asp.

Webserver: Standarddatei für Verzeichnisse[Bearbeiten]

Viele Webadressen enden mit einem Schrägstrich, zum Beispiel http://www.example.org/verzeichnis/ – sie verweisen auf ein Verzeichnis, ohne weitere Angabe einer bestimmten HTML-Datei hinter dem Schrägstrich. Insbesondere, falls nur auf eine Domain verwiesen wird, etwa http://www.example.org, fehlt der Schrägstrich meist gänzlich; er wird dann vom Browser automatisch angefügt.

Um solche Anfragen sinnvoll beantworten zu können, suchen Webserver nach bestimmten Dateien in dem betreffenden Verzeichnis und geben die erste gefundene aus. Als Dateiname ist index.html üblich, bei auf Windows basierenden Servern auch index.htm; sehr selten werden andere Namen wie welcome.html oder default.html akzeptiert.
Beim Aufruf von http://www.example.org/verzeichnis/ aus dem obigen Beispiel würde der Webserver also in aller Regel die Datei /verzeichnis/index.html ausgeben.

Die zu prüfenden Dateinamen werden in der Webserver-Konfiguration festgelegt. Beim Apache-Webserver, am weitesten verbreitet, lautet die Einstellung DirectoryIndex; einige Hostern erlauben auch das Ändern über eine Weboberfläche.

Grundsätzlich sollten als index benannte Dateien, egal ob index.html, index.txt oder anderes, für diesen Zweck reserviert bleiben. Ein einheitlicher Name erleichtert die Verwaltung und eventuelle Serverumzüge des Projektes erheblich.

Es muss sich bei dieser Datei übrigens nicht um eine HTML-Datei handeln. Wird als Standarddatei zum Beispiel index.txt oder index.jpg eingestellt, kann bei Aufruf eines Verzeichnisses auch eine einfache Textdatei oder ein Bild ausgegeben werden.

Ist eine Datei namens index.html als solche für die Struktur des Projektes sinnvoll, soll aber nicht bei Aufruf von Verzeichnissen ausgegeben werden, kann auch ein gänzlich anderer Name als Standarddatei eingestellt werden. Dieses Abweichen von der Konvention sollte aber auf das betreffende Verzeichnis beschränkt bleiben.

Dateiorganisation[Bearbeiten]

Hypertext schreiben - Information verteilen[Bearbeiten]

HTML steht für Hypertext Markup Language. Die Sprache ist ausgelegt für hypertext-gerechte Informationsverteilung. Der Anwender soll zwischen Informationen "navigieren", die ihn interessieren. Wenn Sie dieser Themenkomplex näher interessiert, sollten Sie das Unterkapitel über Hypertext im Kurs über Verweise lesen.

Bei der Hypertext-Informationsverteilung ist es nötig, dass die angebotene Information auf kleine, in sich abgeschlossene Informationseinheiten verteilt wird, die untereinander auf eine nachvollziehbare und einsichtige Weise vernetzt sind.

Wenn Sie beispielsweise Ihren Fußballverein im WWW präsentieren wollen, gehört dazu die übliche Einstiegsseite mit Verweisen zu den Unterseiten. Die Unterseiten sollten jeweils an gleicher Stelle einen Rückverweis auf die Einstiegsseite enthalten. Je eine Unterseite könnten Sie in diesem Beispiel etwa für die Geschichte, für die Vereinsberichte, für die aktuellen Tabellenstände, und für die derzeitigen Spieler spendieren. Die Seite für Spieler könnte nochmals Verweise zu Seiten enthalten, auf denen jeweils ein einzelner der Spieler vorgestellt wird.

Bei solchen Unter-Unter-Seiten ist ein Rückverweis zur nächsthöheren Ebene wie auch zur Einstiegsseite angebracht. Wichtig sind auch die Querverweise. Wenn ein Spieler bereits lange dabei ist, findet sich bestimmt auch ein Querverweis zu einem wichtigen Ereignis der Vereinsgeschichte. Bei den Erläuterungen zum aktuellen Tabellenstand sind wiederum Querverweise zu den besten Torschützen usw. denkbar.

So entsteht ein sinnvolles Netz aus Einzelinformationen. Zusätzliche Verlinkungen sollten die Navigationsmöglichkeiten ergänzen. So ist es in vielen Fällen sinnvoll, so genannte Guided Tours anzubieten, also eine Abfolge von Seiten, die der Anwender bequem durchblättern kann. Egal welche Art von Projekt Sie in Angriff nehmen: immer sollten Sie den hier skizzierten Blick für die Strukturierung und Vernetzung der Information im Auge behalten.

Was hier als "Seite" oder "Unterseite" bezeichnet wird, sollte in einem Web-Projekt jeweils eine HTML-Datei sein. Schrecken Sie nicht vor der Anzahl der entstehenden Dateien zurück. Die saubere Strukturierung der Information sollte oberstes Gebot sein.

Die Technik der Vernetzung zwischen Projektdateien mit HTML wird im Abschnitt über HTML/Tutorials/Links beschrieben. Weitere Tipps für die Konzeption Ihres WWW-Projekts erhalten Sie im Abschnitt Web-Projekte planen.

Unterverzeichnisse[Bearbeiten]

Bei jedem etwas größeren Projekt werden Sie schnell feststellen, wie viele HTML-, Grafik- und andere Dateien sich dabei ansammeln. Um den Überblick zu behalten, sollten Sie sich entweder ein sinnvolles Dateinamenschema überlegen, oder Sie legen Unterverzeichnisse an, etwa für Dateien zu einem Themengebiet, oder für Grafiken usw. Wenn Sie Ihr Projekt im Web veröffentlichen wollen, müssen Sie beim Einsatz von Unterverzeichnissen vorher klären, ob Sie auf dem Server, wo das Projekt einmal abgelegt werden soll, die Berechtigung bzw. Möglichkeit haben, Unterverzeichnisse anzulegen. Denn Sie werden in diesem Fall auf dem Server-Rechner die gleiche Verzeichnisstruktur erstellen müssen, die Sie lokal beim Erstellen gewählt haben, damit alle Verweise und Referenzen funktionieren.

Cool URIs don't change![Bearbeiten]

Damit die Adressen von Webseiten später möglichst nicht geändert werden müssen (denn dies führt dazu, dass Verweise von anderen Seiten schlagartig ins Leere führen, bis die jeweiligen Autoren ihre Verweise anpassen), schlägt ein Mitglied des W3-Konsortiums vor, Verzeichnis- und Dateinamen von Anfang an so allgemein auszulegen, dass diese niemals ungültig werden.

Dies erfordert, dass Verzeichnis- und Dateinamen keine Informationen enthalten dürften, die sich später ändern könnten. Hauptsächlich bleibt als unveränderliche Information das ursprüngliche Erstellungsdatum des Dokuments.

So verweist http://www.w3.org/1998/12/01/chairs auf ein Dokument über ein Treffen des W3-Vorsitzes (chair = Vorsitz) am 1.12.1998.

Empfehlung:
  • Verwenden Sie für Ihre Webseiten eindeutige „sprechende“ Namen, die dem Nutzer sofort verständlich sind.
  • Verändern Sie diese nicht, damit Nutzer nicht später auf eine Fehlermeldung anstelle der gewünschten Inhalte stoßen.

Weitere Informationen zu diesem Thema finden Sie auf Englisch unter Hypertext Style: Cool URIs don't change.