Habe ich doch gelöst (Edit)
Announcement
Collapse
No announcement yet.
Umlaute werden "falsch" übertragen
Collapse
X
-
Originally posted by Chickaria View Post@Christian ; Du hattest eine Funktion ersetzeZeichen. Hierbei ist allerdings ein Proble, dass ich ja durch utf-8 f+r das ö z.B. 2 zeichen habe, nach denen ich suchen müssten, daraus eines machen müsste und das dann als ö ersetzen. Richtig? Wenn ja, wie test ich denn immer zwei zeichen,ist das nicht ziemlich ineffizient?
Im UTF-8 werden "Zeichen" durch 1 bis 4 Byte kodiert (das €-Zeichen besteht z.B. aus 3 Bytes), das hat wenig mit den 8 Bit pro Zeichen im ASCII zu tun.
Ja, es bedeutet zusätzlichen Aufwand wenn die Zeichen durch unterschiedlich lange Byte-Sequenzen kodiert werden. Du kannst dein Dokument auch als UTF-16 abspeichern, dann sind es immer 2 Byte pro Zeichen (es sei denn, du bist Archäologe und hast einen Text in Gotisch oder Phönizisch)
Gruss
Comment
Comment