syntax.htm | Die Syntaxänderungen

HTML5 kann und wird in zwei verschiedenen Syntax schreib- und verwendbar sein:

Die jeweilige Syntax wird am Anfang eines Dokuments mittels des media type festgelegt. Man benötigt für die HTML-Syntax text/html und für die XML-Syntax application/xhtml+xml oder application/xml. Bei der Verwendung der XML-Syntax ist zusätzlich noch der namespace http://www.w3.org/1999/xhtml anzugeben.
Die folgenden zwei Beispiele verdeutlichen die korrekte Auszeichnung:

HTML-Syntax

<!doctype html>
<html>
  <head>
    <meta charset="UTF-8">
    <title>Example document</title>
  </head>
  <body>
    <p>Example paragraph</p>
  </body>
</html>
				

XML-Syntax

<?xml version="1.0" encoding="UTF-8"?>
<html xmlns="http://www.w3.org/1999/xhtml">
  <head>
    <title>Example document</title>
  </head>
  <body>
    <p>Example paragraph</p>
  </body>
</html>
				

Character Encoding

Bei der HTML-Syntax von HTML 5 haben Webautoren drei unterschiedliche Möglichkeiten der Zeichen(satz)codierung:

  • Auf der Transportschicht, bspw. unter Verwendung des Content-Type im HTTP-header.
  • Durch Verwendung des Unicode-Steuerzeichens (Unicode Byte Order Mark [BOM]) am Anfang des HTML-Dokuments.
  • Oder durch die Verwendung eines meta-Elements mit einem charset-Attribut, welches das Encoding innerhalb der ersten 512 Bytes des Dokuments festlegt. So kann <meta charset="UTF-8"> für die Deklarierung eines Dokumentes mit "UTF-8"-Zeichensatz verwendet werden. Dies ersetzt die Notwendigkeit von <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> im header des Dokuments, welches allerdings weiterhin erlaubt ist.

For the XML syntax authors have to use the rules as set forth in the XML specifications to set the character encoding.

Top ↑

Der DOCTYPE

Bei der HTML-Syntax von HTML5 muss ein DOCTYPE spezifiziert werden, der dafür sorgt, dass der Browser die Seite im Standardmodus wiedergibt. Der DOCTYPE hat keine andere Aufgabe und wird deshalb nur für XML verwendet. Dokumente mit einem XML-Medientyp werden immer im Standardmodus behandelt.

Die DOCTYPE-Deklarierung lautet <!DOCTYPE html>, wobei die Groß- und Kleinschreibung in der HTML-Syntax nicht beachtet werden muss. DOCTYPEs aus früheren HTML-Versionen waren aufgrund der SGML-gestützten HTML-Sprache länger, weshalb man den Bezug zu einer DTD brauchte. Dies ist mit HTML5 hinfällig geworden; der DOCTYPE wird nurmehr benötigt, um den Standardmodus für Dokumente zu gewährleisten, die mit Hilfe der HTML-Syntax geschrieben wurden. Mit <!DOCTYPE html> machen Browser dies automatisch.

Top ↑

Verschiedenes

Zwei weitere Syntaxänderungen sollen an dieser Stelle noch erwähnt werden:

  • HTML hat jetzt nativen Support für IRIs. (In HTML4 wurden diese nur mittels error handling verarbeitet.)
  • Das lang-Attribut kann, zusätzlich zu einem validen Bezeichner für die Dokumentensprache, in HTML5 auch ein Leerelement sein, wie es auch bei xml:lang in XML der Fall ist.

Top ↑