von Xong » 22. Apr 2009, 14:54
Dem Text ist nur hinzuzufügen, dass die XML-Deklaration (<?xml version="1.0" encoding="utf-8"?>) nicht an den Anfang eines UTF-8-kodierten XHTML-Dokuments gestellt werden sollte, weil der IE in den Versionen bis einschließlich 7 in den Quirksmodus versetzt wird.
Das funktioniert deshalb, weil Dokumente ohne diese Deklaration automatisch als UTF-8-kodiert angesehen werden.
Ich empfehle uneingeschränkt die Nutzung von UTF-8. Es vermeidet Probleme und erlaubt die kontextgerechte Verarbeitung von Daten in allen Bereichen, die für Webseiten wichtig sind: Eingabe, Verarbeitung, Ausgabe und Speicherung (u. a. Datenbanken).
Ob die HTML-eigenen Zeichen (<,>,",&) bei der Ausgabe als Text (in gewissen Situationen) trotzdem maskiert werden müssen, hängt vom Kontext ab.
Jedem ist wohl klar, dass ein Anführungszeichen innerhalb eines Textes, der im alt-Attribut eines Bildes steht, in seine Zeichenentität umgewandelt werden muss. Im normalen Fließtext ist das nicht unbedingt nötig.
Dort sollten wiederum die Tag-Klammern maskiert sein.
Generell: Maskierung mit HTML-Entitäten schadet nicht, kann aber den Verwaltungsaufwand erheblich vergrößern. Also sparsam damit umgehen!
Zusatz: Wer mit UTF-8-kodierten Dateien arbeitet, sollte diese nicht mit einem Byte-Order-Mark (BOM) versehen. PHP kann damit afaik noch nicht umgehen und sendet dieses BOM bei jedem Skript-Start als erstes an den Browser, womit eine Ausgabe getätigt wurde und die Headerangaben nicht mehr modifiziert werden können.
LG,
Xong
LG,
Xong

Määääääääääääääääääääääääh!