Mittwoch, 4. April 2012

SMS-Kodierung zwingt mich zu typografischen Fehlern

Seitdem ich in der Gestaltung die Typografie – genau genommen Detailtypografie – versuche richtig einzusetzen, wird mir das Leben oft durch technische Aspekte schwer gemacht. Damals berichtete ich diesbezüglich schon einmal.

Jetzt ist mir wieder etwas derartiges untergekommen. Als ich versuchte mit meiner Detailverliebtheit in der Typografie eine SMS zu schreiben wurde ich bitter enttäuscht. Dies mal machte mir die SMS-Kodierung mit 7 Bit einen Strich durch die Rechnung.


In einer SMS wollte ich typografisch korrekt einen Gedankenstrich setzen. Also wählte ich den Zeichensatz in meinem iPhone aus und selektierte durch Gedrückthalten der Bindestrichtaste den Gedankenstrich.


Bis hier hin ist alles ok – es sieht gut aus. Doch wenn man auf den Zeichenzähler oberhalb des Sendebuttons achtet fällt auf, dass mir für diese SMS nunmehr keiner 160 Zeichen sondern nur noch 70 zu Verfügung stehen. Doch warum?

Das Gleiche passiert mit anderen Zeichen …



















Doch woran liegt das jetzt? Es ist eigentlich ganz einfach; Wikipedia gibt die Antwort. SMS werden in Bits kodiert. Für unseren Fall sind 2 Kodierungsverfahren wichtig: einmal die 7- und einmal die 16 Bit-Kodierung:

7 Bit, 160 Zeichen
Für SMS-Textnachrichten bei denen ein begrenzter Zeichenvorrat zur Darstellung ausreichend ist. Der Text kann pro Nachricht bis zu 160 Zeichen enthalten (7 Bit/Zeichen × 160 Zeichen = 1.120 Bit). Jeweils 7 Bit werden als ein Zeichen interpretiert, was den Vorrat an darstellbaren Zeichen grundsätzlich auf 128 beschränkt. Diese 128 Zeichen sind im 7-Bit-Basiszeichensatz festgelegt. Es existieren mehrere Mechanismen mit denen der Vorrat an darstellbaren Zeichen erweitert werden kann.


16 Bit, 70 Zeichen
Unicode UCS2, d. h. auf BMP (Basic Multilingual Plane) beschränktes UTF-16. Unicode-Nachrichten werden für alle anderen Schriftsysteme benötigt, z. B. Arabisch, Hebräisch, Kyrillisch und Lateinisch mit anderen Sonderzeichen. Eine Unicode-Nachricht ist begrenzt auf 70 Zeichen (16 Bit/Zeichen × 70 Zeichen = 1.120 Bit).

Das heißt im Klartext: Wenn ein Zeichen nicht im 7 Bit-SMS-Kodierungsverfahren enthalten ist, wird das 16 Bit-SMS-Kodierungsverfahren angewendet.

Fazit: Wer Geldsparen will, schreibt typografisch unsaubere Nachrichten. Der Typogott wird es euch verzeihen.


1 Kommentar:

  1. Auf Gedankenstrichen bestehen, aber fehlende Kommata ignorieren ("[...]achtet, fällt[...]" und im Wiki-Text sowieso)?

    AntwortenLöschen