Homepage - Dietmar Reinke
Technologien

Sonderzeichen Ä Ö Ü ...

Zeichenkodierung

Die Zeichenkodierung für eine HTML-Seite wird durch den Server oder die HTML-Seite (head > meta > charset) festgelegt. Wurde keine Zeichenkodierung festgelegt, muss der Browser eine entsprechende Kodierung bestimmen. Schriften in Abhängigkeit von Version und Betriebssystem verfügen über einen unterschiedlichen Zeichenumfang und teilweise über eine andere Zuordnung der Zeichen. Auch kann in der Browsereinstellung eine Zeichenkodierung oder Schrift vorgegeben werden.

1 Webserver

  • Modul Mime Defaults
  • AddDefaultCharset iso-8859-1
  • Keine gute Wahl: alle Webseiten werden mit iso-8859-1 ausgeliefert (auch UTF-8).
  • Aber Vorgabe für diverse Zeichensätze: AddCharset ISO-8859-1 .iso8859-1 .latin1 ... AddCharset UTF-8 .utf8 (Verhandlungsvorgabe für Server und Browser)

2 Webserver - PHP

  • PHP Data Handling
  • default_charset = "iso-8859-1"
  • Keine gute Wahl: alle PHP-Webseiten werden mit iso-8859-1 angezeigt (auch UTF-8)
  • http://php.net/default-charset

3 Basis ANSI (Tastatur EN-US)

  • Eigeschränkter Zeichensatz nach ANSI (Wertebereich 32 bis 127)
  • Es sind nur Zeichen auf derBasis von ANSI möglich: A ... Z, a ... z, 0 ... 9, ae, ue, oe ...
  • Zeichen A = 65

4 ANSI erweitert mit Code-Elementen

  • Zeichensatz nach ANSI & Zeichenersetzung im Quelltext
  • Zusätzlich sind diverse Zeichen durch den Browser darstellbar: Ä Code > Ä ...
  • Anzeige: Ä ä Ü ü Ö ö ß € µ
  • Quelltext: Ä ä Ü ü Ö ö ß € µ

5 ANSI erweitert mit CHARSET = "iso-8859-1" (Tastatur DE-DE)

  • Erweiterter Zeichensatz nach ANSI mit CHARSET = iso-8859-1 Latin-1 (Wertebereich 32 bis 255)
  • Zusätzlich können diverse Zeichen über Tastatur (DE) eingegeben werden (DOS: CP850)
  • Anzeige: Ä ä Ü ü Ö ö ß € µ
  • Quelltext: Ä ä Ü ü Ö ö ß € µ
  • Zeichen Ä = 196

6 Webserver und Browser mit UTF-8 (IPA mit UTF-8)

  • Betriebssystem muss UTF-8 unterstützen
  • HTML-Datei muss im Format UTF-8 vorliegen
  • Webserver sendet HTML-Datei im Format UTF-8
  • Browser kann HTML-Datei im Format UTF-8 erkennen und anzeigen
  • Die Schrift muss über die erforderlichen Zeichen verfügen
  • Wenn nicht: Text wird in ANSI umgewandelt und ist nicht mehr lesbar!

7 CHARSET / Datei - Anzeige

7.1
charset = iso-8859-1 und Datei ANSI
Anzeige: Ä ä Ü ü Ö ö ß € µ
7.2
charset = iso-8859-5 und Datei ANSI
Anzeige: м ќ Ф ф ж і п @ € Е
7.3
charset = iso-8859-15 und Datei ANSI
Anzeige: Ü ü Ä ä Ö ö ß @ € µ
7.4
charset = utf-8 und Datei utf8
Anzeige: Ä ä Ü ü Ö ö ß € µ
7.5
charset = iso-8859-1 und Datei utf8 (Anzeige falsch / Daten richtig)
Anzeige: Ü ü Ä ä Ö ö ß @ €
7.6
charset = utf-8 und Datei ANSI (Daten falsch - z.B Editor mit ANSI)
Anzeige: � � � � � � � @ �