Jetzt ist mir wieder etwas derartiges untergekommen. Als ich versuchte mit meiner Detailverliebtheit in der Typografie eine SMS zu schreiben wurde ich bitter enttäuscht. Dies mal machte mir die SMS-Kodierung mit 7 Bit einen Strich durch die Rechnung.
In einer SMS wollte ich typografisch korrekt einen Gedankenstrich setzen. Also wählte ich den Zeichensatz in meinem iPhone aus und selektierte durch Gedrückthalten der Bindestrichtaste den Gedankenstrich.
Doch woran liegt das jetzt? Es ist eigentlich ganz einfach; Wikipedia gibt die Antwort. SMS werden in Bits kodiert. Für unseren Fall sind 2 Kodierungsverfahren wichtig: einmal die 7- und einmal die 16 Bit-Kodierung:
7 Bit, 160 Zeichen
Für SMS-Textnachrichten bei denen ein begrenzter Zeichenvorrat zur Darstellung ausreichend ist. Der Text kann pro Nachricht bis zu 160 Zeichen enthalten (7 Bit/Zeichen × 160 Zeichen = 1.120 Bit). Jeweils 7 Bit werden als ein Zeichen interpretiert, was den Vorrat an darstellbaren Zeichen grundsätzlich auf 128 beschränkt. Diese 128 Zeichen sind im 7-Bit-Basiszeichensatz festgelegt. Es existieren mehrere Mechanismen mit denen der Vorrat an darstellbaren Zeichen erweitert werden kann.
16 Bit, 70 Zeichen
Unicode UCS2, d. h. auf BMP (Basic Multilingual Plane) beschränktes UTF-16. Unicode-Nachrichten werden für alle anderen Schriftsysteme benötigt, z. B. Arabisch, Hebräisch, Kyrillisch und Lateinisch mit anderen Sonderzeichen. Eine Unicode-Nachricht ist begrenzt auf 70 Zeichen (16 Bit/Zeichen × 70 Zeichen = 1.120 Bit).
Das heißt im Klartext: Wenn ein Zeichen nicht im 7 Bit-SMS-Kodierungsverfahren enthalten ist, wird das 16 Bit-SMS-Kodierungsverfahren angewendet.
Fazit: Wer Geldsparen will, schreibt typografisch unsaubere Nachrichten. Der Typogott wird es euch verzeihen.