HTML-Code aufräumen

HTML ist das Gerüst jeder Webseite. In der Praxis hat kaum eine Seite validen, fehlerfreien HTML-Code. Zusätzlich ist er mit unnötigen Leerzeichen, Tabulatoren, Zeilenumbrüchen, Kommentaren und weiterem Code-Müll aufgebläht. Aber das muss nicht sein. In dieser Episode geht es darum, wie man schlechten Code erkennt und wie man ihn optimiert.
Shownotes:
Die erste Webseite als Maßstab
Tim Berners-Lee hat 1990 die erste Webseite mit 3 KB HTML-Code gelauncht. Spiegel Online hat auf der Startseite 1,7 MB HTML-Code – unkomprimiert. 14.000 Zeilen. Über 1.000 Validierungsfehler.
HTML ist kein Selbstzweck. Es ist das Gerüst, auf dem alles andere aufbaut. Fehler darin können Suchmaschinen verwirren, Barrierefreiheit blockieren und unnötige Kilobytes erzeugen.
Was überflüssig ist
Drei Dinge finde ich auf fast jeder Website: Kommentare im HTML-Code (“hier beginnt der Footer”), die für Besucher unsichtbar sind, aber jede Seite schwerer machen. Absolute Links innerhalb derselben Domain (“https://example.com/ueber-mich" statt “/ueber-mich”). Und überflüssige Leerzeilen, Whitespace und alte Metatags wie “revisit-after”, die seit 15 Jahren keine Wirkung mehr haben.
Allein das Entfernen von überflüssigem Whitespace kann 5-10% des HTML-Volumens sparen. Bei zehntausenden Seitenaufrufen pro Monat ist das messbar.
Die Barrierefreiheits-Verbindung
Valider HTML5-Code ist nicht nur für SEO wichtig. Wenn semantische Auszeichnungen wie <header>, <nav>, <main> und <footer> fehlen oder falsch gesetzt sind, kann ein Screenreader die Seite nicht sinnvoll vorlesen. Ab 2025 gilt der EU Accessibility Act auch für viele private Websites. Das ist kein Argument zum Wegsehen.