Announcement

**dibo33** · 28.01.2012, 21:42

Kann ich nicht best�tigen, dein "Fehler" muss woanders liegen.

**Falk Pr�fer** · 30.01.2012, 10:03

Hallo,
bei COMPRESS auf BINARY-Ebene d�rften Umlaute �berhaupt keine Rolle spielen. Die Daten werden 1:1 wieder hergestellt. Umlaute kommen hier erst bei den Charsets der Clientverbindung und deiner Applikation ins Spiel. Hier w�re also interessant, WIE die Daten gespeichert und ausgelesen werden und welche Charsets die MySQL-Client-Verbindung und deine Applikation verwenden.

Gru� Falk

**Dave_Bowman** · 30.01.2012, 11:00

Hallo Falk,

ich wei� nicht genau, was Du meinst, WIE die Daten gespeichert und ausgelesen werden. Es ist eine .NET-Applikation �ber einen Konnector (wei� gerade nicht, ob ODBC oder .NET, da wir f�r Datenbankaufrufe ein separates Framework benutzen). Ich wei� nur, dass, wenn ich normalen Text mit Umlauten in der DB speichere, dieser korrekt ankommt. Behandle ich ihn stattdessen mit COMPRESS, erhalte ich bei UNCOMPRESS kaputte Umlaute zur�ck. Nach meinem Verst�ndnis w�re doch dann der �bertragungsweg egal, da ja das COMPRESS erst auf DB-Server-Seite zum Tragen kommt, und dort kommen ja auch augenscheinlich die Umlaute korrekt an, zumindest in normalen VARCHAR-Feldern. Allerdings hat auch dibo recht, speichere ich komprimierten Text direkt auf dem Server mit der Workbench, wird der auch korrekt wieder entpackt.
Ich verstehe nicht, wo der Fehler liegen soll.

**Falk Pr�fer** · 31.01.2012, 09:36

Hallo Dave,

Originally posted by Dave_Bowman View Post

...Ich verstehe nicht, wo der Fehler liegen soll.

ich vermute den Fehler in deiner Zugriffsschicht. Im Endeffekt sind bei einer Datenbankoperation drei "Partner" beteiligt, die ggfs. jeder einer andere "Sprache" (Charset) sprechen k�nnen. Da ist zum einen deine Anwendung, zum Zweiten die MySQL-Clientverbindung und als Dritter die eigentliche DB-Tabelle. Bei unterschiedlichen Charsets von Zweitem und Drittem f�hrt MySQL automatisch eine Zeichensatzkonvertierung durch. Um Erstens musst du dich als Programmierer selbst k�mmern.
Von Interesse w�re jetzt also, welches Charset die DB, die betroffene Tabelle, die MySQL-Clientverbindung und deine Anwendung verwenden. Gibt es da Unterschiede, dann m�sstest du dir ansehen, wie an den "Schnittstellen" mit diesem Unterschied umgegangen wird.

Frage: Wenn du mit deiner Anwendung Umlaute normal in der DB speicherst und diese mit einem anderen Programm (z.B. Workbench) ausliest, sind die Umlaute dann korrekt?

Gru� Falk

**Dave_Bowman** · 31.01.2012, 11:06

Originally posted by Falk Pr�fer View Post

Frage: Wenn du mit deiner Anwendung Umlaute normal in der DB speicherst und diese mit einem anderen Programm (z.B. Workbench) ausliest, sind die Umlaute dann korrekt?

Ja, das sind sie. Wir haben beim Speichern nie Probleme dieser Art gehabt, nur eben jetzt, und nur w�hrend der Benutzung des COMPRESS().
Die Tabellen bzw. die betreffenden Spalten haben latin1_german1_ci, au�er nat�rlich der Spalte, die die komprimierten Inhalte aufnehmen soll, dort habe ich als Datentyp BLOB eingestellt, aber auch andere Datentypen und mit VARCHAR() diverse Kollationen versucht.

Ich habe mich um Zeichens�tze noch nie k�mmern m�ssen, alles wurde und wird korrekt gespeichert. Es ist nur das erste Mal, dass ich COMPRESS benutzen will, und das funktioniert pl�tzlich nicht wie erwartet. Ich nahm an, dass der zu komprimierende Text wie anderer Text auch per SQL zum Server gelangt und erst dort, nachdem quasi die �bertragung beendet wurde, vom Server komprimiert und abgelegt wird. Der Client verarbeitet oder komprimiert da ja noch nichts, nehme ich an. Dagegen spricht aber eben, dass anderer Text korrekt gespeichert wird und auch, dass das COMPRESS mit UNCOMPRESS, manuell in der Workbench ausgef�hrt, auch korrekt klappt.

...

Hah, ich habe jetzt mal in meiner Anwendung einen komprimierten Wert ausgelesen (CONVERT(UNCOMPRESS(fieldname), CHAR)), und dieser ist wieder korrekt! "Nur" in der Workbench dagegen nicht.

...

Jetzt habe ich es, glaube ich. Es sind tats�chlich unterschiedliche Zeichens�tze, die hier, vermutlich erst beim Komprimieren, zugrunde gelegt werden. Auf jeden Fall habe ich in der Anwendung bei den dekomprimierten Daten korrekte Umlaute, und in der Workbench auch, wenn ich dort explizit konvertiere: CONVERT(UNCOMPRESS(fieldname), CHAR CHARACTER SET latin1). Ist wohl standardm��ig utf8. Aber dann stimmt jetzt dort auch alles. Und dann passt das doch.

Vielen Dank f�r Deine Hilfestellung, Falk ...

Announcement

kaputte Umlaute beim Einsatz von COMPRESS()

kaputte Umlaute beim Einsatz von COMPRESS()

Comment

Comment

Comment

Comment

Comment