Announcement

**Ralf Jansen** · 10.01.2017, 19:14

utf-16 hei�t nicht das die Zeichen mit 16bit kodiert sind. Das solltest du auch nachlesen.

**Wernfried** · 10.01.2017, 21:45

Originally posted by Ralph Erdt (2) View Post

Danke f�r die Korrekturen, stimmt.

Aber das mit dem Unicode muss ich nochmal nachlesen.. (z.B. UTF-16 -> 2^16 = 65K Unterschiedliche Zeichen)

UTF-8:
U+0000 bis U+007F -> 1 Byte
U+0080 bis U+07FF -> 2 Bytes
U+0800 bis U+FFFF-> 3 Bytes
U+10000 bis U+10FFF -> 4 Bytes

UTF-16:
U+0000 bis U+FFFF -> 2 Byte
U+10000 bis U+10FFFF -> 4 Bytes

UTF-32:
immer 4 Bytes

Gruss

**Ralph Erdt (2)** · 11.01.2017, 13:57

Hmm. Das hat sich mit der Zeit ge�ndert, und ich habe das gl�cklicherweise nicht mitbekommen:
"Originally, Unicode was designed as a pure 16-bit encoding,.." http://unicode.org/faq/utf_bom.html

Danke. F�r die Hinweise.

Rant:
Da baut man einen Standard um mal hart alte Z�pfe abzuschneiden, aber dann kreiert man eigenen Schwachsinn (ja, meine Meinung), indem wieder Spezialcharakter und Bereiche nur f�r die Codierung definiert...
Da muss man wieder Spezialf�lle im Kopf haben, und Sonderbehandlungen im Code machen. Da muss ich mir nochmal den C++ Code ansehen - das hatte hier noch keiner auf dem Radar... :-(

**Wernfried** · 11.01.2017, 15:00

Vor Version 2.0 (d.h. Juli 1996) waren es noch 65.536 Codepunkte.

Windows 2000 war das erste Windows welches Unicode unterst�tzte, das kam Februar 2000 raus - also vier Jahre sp�ter.
Oracle fing im Release 8i (1997) mit Unicode an. Beim Linux "GNU C Library" war es Release 2.2 (2000)

Ich denke du wirst recht lange suchen m�ssen bis du eine Software findest welche bereits Unicode Version < 2.0 unterst�tzt hat.

Announcement

Dateien inhaltlich vergleichen

Comment

Comment

Comment

Comment