ISO-5589-5 - UTF-8
Hinweise zum Erstellen von HTML-Seiten in
kyrillischer (russischer) Schrift unter Windows 9x:
- Es kann zunächst nötig sein, auf dem eigenen PC die
kyrillische Sprachenunterstützung zu
installieren:
Start | Einstellungen | Systemsteuerung | Software |
Windows Setup | Sprachenunterstützung | Details |
Kyrillisch
Sonst ist der Browser evtl. nicht in der Lage,
kyrillische Schrift darzustellen (das gilt auch für diese
Seite).
- Man muß sich für eine kyrillische
Zeichenkodierung entscheiden. Davon gibt es mehrere:
Die Kodierung ISO-8859-5 wird als besonders zuverlässig
angesehen, weil sie plattformunabhängig ist. Es sind aber
auch Windows-1251 und KOI8-R verbreitet. Außerdem gibt es
noch UTF-8 (dazu unten mehr).
-
Um die Zeichenkodierung zu definieren, gibt es zwei
Möglichkeiten: Auf einem Apache-Webserver kann man eine
Textdatei namens .htaccess anlegen, in der alle
benötigten Kodierungen mit bestimmten
Dateinamenerweiterungen verknüpft werden:
AddType text/html;charset=iso-8859-1 html
AddType text/html;charset=windows-1251 html1
AddType text/html;charset=iso-8859-5 html5
AddType text/html;charset=utf-8 html8
Das bedeutet freilich, daß in diesem Beispiel die
russischen Webseiten mit der Zeichenkodierung
ISO-8859-5 immer den Dateinamen "*.html5" haben müssen,
da "*.html" an die westeuropäischen Kodierung
ISO-8859-1 vergeben ist.
-
Alternativ oder besser zusätzlich dazu kann man jeder
russischen HTML-Seite im Header einen Meta-Tag
geben, der im Browser die jeweilige Zeichenkodierung
einstellt. Zwei Beispiele:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1251">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=iso-8859-5">
- Die kyrillischen Zeichen werden im HTML-Quelltext mit
lateinischen Sonderzeichen codiert, die auf einer
deutschen Tastatur z.T. nur mit Alt + Num eingegeben
werden können. Um "Россия" zu erhalten, muß man
also (bei Windows-1251) "Ðîññèÿ" eintippen bzw.
bei gedrückter Alt-Taste über den Zahlenblock die
entsprechende Nummer eingeben.
Zeichentabelle für
ISO-8859-5
Zeichentabelle für KOI8-R
Zeichentabelle für
Windows-1251
- Für längere Texte ist diese Methode allerdings zu
mühsam; daher lohnt es sich, das russische Tastaturlayout
zu installieren (siehe unten) oder einen
Tastaturmanager zu verwenden, z.B.
Keys von Péter Szászvári. (Weitere Möglichkeiten der
"Russifizierung" des eigenen PCs erklärt ausführlich
Wolfgang Kirsch.)
- Eine Kombination von lateinischer und kyrillischer
Schrift auf einer Seite ist mit ISO-8859-5 (diese Seite in ISO-5589-5) oder
Windows-1251 zwar prinzipiell möglich. Alle lateinischen
Sonderzeichen, die erhalten bleiben sollen (z.B. ä ö ü ß
é ç) müssen dann mit entsprechenden HTML-Kodes maskiert
werden (ä ö ü ß
é ç usw.). Netscape Navigator bis
Version 4.x zeigt die Sonderzeichen allerdings trotz
Maskierung nicht an. Eine Alternative wäre, auf solche
Zeichen ganz zu verzichten (stattdessen: ae oe ue ss e
c).
-
Eine bessere mehrsprachige Lösung bietet die
Verwendung der multilingualen Unicode-Zeichenkodierung
UTF-8, wie auf dieser Seite. Damit kann man die
verschiedensten Sprachen und Schriftzeichen
kombinieren. Unter Start | Einstellungen |
Systemsteuerung | Tastatur | Sprache werden dazu die
benötigten Tastaturlayouts installiert, zwischen denen
man dann über ein Sprachsymbol in der Taskleiste
wechseln kann. Zum Schreiben verwendet man einen
UTF-8-fähigen HTML-Editor (z.B. Frontpage Express oder
Netscape Composer) oder einen Unicode-Editor (z.B. SC UniPad oder für
kurze Texte Jukka
Korpelas gwrite). Header-Angabe:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=utf-8">
Näheres bei
Paul Gorodyansky, wo man auch ein "phonetisches"
russisches Tastaturlayout bekommt, das sich mit einer
deutschen Tastatur leichter bedienen läßt als die
originale Version. Bei Alan J.
Flavell kann man sich umfassend über Möglichkeiten
und Probleme der Internationalisierung informieren.
- Will man einen bereits vorhandenen russischen Text im
DOC- oder RTF-Format in eine Webseite umwandeln,
geht man am besten so vor: den Text mit Word im
Write-Format (*.wri) speichern; diese Datei mit Write
oder einem Editor öffnen und als Textdatei (*.txt)
speichern; den Inhalt der Textdatei in das HTML-Gerüst
kopieren. (Eine direkte Konvertierung von Word nach HTML
ist zwar möglich, führt aber zu einer falschen
Kodierung.) Das Ergebnis dieser Methode ist zwangsläufig
eine Webseite mit der Kodierung Windows-1251. Mit dem
Unicode-Editor SC
UniPad kann man man die Seite jedoch leicht in eine
andere Zeichenkodierung konvertieren.
- Die fertigen russischen Seiten werden wie gewohnt
gespeichert (ohne Sonderzeichen im Dateinamen) und
anschließend ganz normal auf den Server geladen. Siehe auch Tips für den Upload.
Wie das dann aussehen kann, zeigen z.B. unsere
russischen Seiten über das Kriegsgefangenenlager Stalag VII
A (ISO-5589-5 und
Windows-1251).
Sie sollten mit dem Internet Explorer, mit dem Netscape
Navigator und mit Opera ab Version 6 funktionieren.
|