Stufenplan für die Lokalisierung von Content

    Portrait_Märki_768x1024

    Jeremias Märki, freier Softwareentwickler und Berater im Auftrag der Compart AG

    Mehrsprachigkeit in der Dokumentenverarbeitung: In Ländern wie Indien, Kanada und der Schweiz ist sie ein Muss. Aber auch Unternehmen, die in der Kundenkommunikation mehr als das notwendige Minimum bieten wollen, kommen daran nicht vorbei. Fakt ist: In der Multikulti-Gesellschaft von heute ist für immer mehr Menschen die primäre Landessprache nicht unbedingt auch die Muttersprache. Warum also diesen Umstand nicht als Wettbewerbsvorteil nutzen und Inhalte entsprechend anpassen? In diesem Zusammenhang nur von einer Übersetzung von Texten zu sprechen, greift zu kurz. Das wichtige Stichwort in diesem Zusammenhang lautet „Lokalisierung“.

    Stufe 0 ‒ Keine Lokalisierung

    Um die Relevanz und Komplexität des Themas besser zu verstehen, bietet sich eine Stufensystematik an: Hier geht es um die Frage, ob man Lokalisierung in einem konkreten Fall braucht? In vielen Ländern mit nur einer einzigen Amtssprache (z.B. Deutschland oder Österreich) wird die Lokalisierung noch gerne vernachlässigt. Zwar gibt es regional meist weitere Amtssprachen (z.B. Slowenisch in Teilen Österreichs), jedoch spielt dieser Umstand außerhalb der Kommunikation mit Behörden so gut wie keine Rolle.

    Doch die Situation ändert sich – und nicht nur durch den steigenden Bevölkerungsanteil mit Migrationshintergrund. Denn es gibt im deutschsprachigen Raum auch sehr viele Fälle, wo Englisch die geeignetere Sprache wäre – beispielsweise bei ausländischen Spezialisten, die nur für ein paar Monate oder Jahre im Land bleiben. Für die Entscheidung, ob sich der Aufwand für die Lokalisierung lohnt, muss man die interessanten Zielgruppen eruieren und analysieren.

    Stufe 1 – Mehrsprachigkeit mit Empfängern nur im Inland

    Hat man sich für die Lokalisierung entschieden, gilt es weitere Fragen zu klären; beispielsweise, ob mehrsprachige Dokumente nur für Empfänger im Inland produziert werden sollen. In diesem Fall muss man sich keine Gedanken um länderspezifische Besonderheiten machen. Trotzdem reicht es hier nicht aus, nur von Übersetzung zu sprechen. Denn neben Texten sind unter Umständen auch Bilder oder Grafiken anzupassen. Gerade in personalisierten Geschäftsdokumenten finden sich oft Variablen in den Texten, so dass Fallunterscheidungen notwendig werden. Diese müssen je nach Sprache recht unterschiedlich gehandhabt werden. Allein in Deutsch können die drei Fälle (0, 1 und n) folgende Umsetzungen nach sich ziehen: „… hat keine weiteren Policen“ oder „… hat eine weitere Police“ bzw. „… hat drei weitere Policen“. Man kann also nicht einfach einen einfachen Platzhalter benutzen wie „… hat {anzahl} Policen“.

    Ein wichtiger Aspekt in diesem Zusammenhang ist die Trennung von Geschäfts- und Sprachlogik. Diese beiden sollten voneinander entkoppelt und nacheinander betrachtet bzw. umgesetzt werden. Beispiel Kfz-Versicherung: Etliche Versicherer bieten ihren Kunden einen Rabatt, wenn sie ihr Auto zu Hause in der Garage parken. Das bedeutet: In der Geschäftslogik, die einmal durchlaufen wird, führt das auf der einen Seite in der Berechnung zu einem Rabatt. Andererseits werden für das Output Management Rohdaten zur Verfügung gestellt, die aufgrund dieser Regel einen Indikator enthalten, dass im Dokument später ein entsprechender Textblock (z.B. über einen eindeutigen Namen identifiziert) auftauchen soll. Der eigentliche Text spielt zu diesem Zeitpunkt keine Rolle. Später bei der Formatierung (Composition) werden die entsprechenden Textblöcke in der richtigen Variante ausgewählt und die darin enthaltenen Platzhalter sprachabhängig ersetzt. Die Sprachlogik dabei muss also mehrfach pro Sprache und vielleicht sogar pro Ausgabeformat (Print/PDF, HTML etc.) umgesetzt werden.

    Neben der komplexen Ersetzung von Variablen bei der Lokalisierung müssen weitere Elemente beachtet werden. Ein Datumswert aus einer XML-Datei wie z.B. „2015-10-16“ (ISO 8601 bzw. XML Schema Format) muss nach „16. Oktober 2015“ oder „16.10.2015“ formatiert werden. Auch Beträge sind entsprechend aufzubereiten. Darüber hinaus ist gerade beim Layout zu beachten, dass einige Sprachen wesentlich längere Texte verursachen als andere und sich dadurch Zeilen- und Seitenumbrüche ändern können. So ist Deutsch beispielsweise weniger kompakt als Englisch. Ein weiterer Aspekt kann die Sortierung sein: In Deutschland besagt DIN 5007, dass in Wörterbüchern beispielsweise „ä“ und „a“ als gleichwertig zu behandeln sind, nicht jedoch in Telefonbüchern. Dort sind aber „ä“ und „ae“ bzw. „æ“ gleichwertig.

    Betrachtet man die kompletten Systeme, drängt sich die durchgehende Verwendung des Unicode-Standards auf, um in Zukunft auch für weitere Sprachen gerüstet zu sein. Ein westeuropäischer 8 Bit-Zeichensatz (z.B. ISO 8859-1) wird auf Dauer nicht ausreichen. Alle Elemente in der Systemlandschaft müssen die Mehrsprachigkeit unterstützen: Applikationen, Output Management und Austauschformate – Ziel ist die Internationalisierung des Gesamtsystems.

    Stufe 2 – Versand von Dokumenten ins Ausland

    Versendet ein Unternehmen Dokumente auch ins Ausland, wird es komplizierter. Dabei spielt das Thema nicht nur im Output Management eine Rolle, sondern kann auch in die Konzeption von Internetauftritten mit internationalem Publikum einfließen. Plötzlich müssen beispielsweise Zahlen- und Datumswerte je nach Land unterschiedlich formatiert werden. Während in Deutschland ein Betrag als „7654,12 €“ gesetzt wird, liest man in Österreich eher „7 654,12 €“ und in der Schweiz „Fr. 7654.12“. Auch Telefonnummern werden unterschiedlich dargestellt.

    Ein anderes Beispiel sind Wörter, die je nach Land anders geschrieben werden. So wird in der Schweiz wird kein „ß“ verwendet („Straße“ wird zu „Strasse“). Hier werden auf der technischen Seite Codes wie „de_DE“ und „de_AT“ verwendet, um beide Aspekte auszuzeichnen. Es können sogar noch weitere Merkmale wie die Region angehängt werden.

    Die Wahl von Datenstrukturen bei Austauschformaten wie XML kann ebenfalls etwas heikel sein, wenn man zum Beispiel in die Adressformatierung verzweigt. Hier kann die Postleitzahl beispielsweise hinter (USA) oder unter (England) dem Ort platziert sein. Auch Maße müssen in der Regel angepasst werden. Ein weiterer Aspekt ist das Papierformat (DIN A4 versus US-Letter). Darüber hinaus spielen auch Zeitzonen und die Sommerzeit schnell eine Rolle.

    Unabdingbar ist auch, die unterschiedlichen gesetzlichen Anforderungen für das Ausstellen von Dokumenten zu beachten. Die Beispiele zum Thema internationale Regelkonformität (Compliance) beginnen bereits bei den Vorschriften für die Berechnung der Besteuerung (Mehrwertsteuer). Die Vorgaben für die Preisauszeichnung können ebenfalls unterschiedlich sein.

    Stufe 3 – Berücksichtigung der Gepflogenheiten von Zielgruppe und Kultur

    Ein weiteres Thema in der Lokalisierung ist die Ausrichtung auf Zielgruppen. Dabei spielen Aspekte wie Kultur, Religion, Ästhetik, Bedeutung von Farben, Kleider und Titel in der Anrede eine Rolle. Wie weit man gehen will (oder muss), ist situativ zu betrachten und zu entscheiden. Ein bekanntes Beispiel ist das Foto mit der netten Dame vom Kundendienst, die ein Headset trägt und in die Kamera lächelt. Im deutschsprachigen Raum hat sie in der Regel kaukasische Gesichtszüge, ein modisches, europäisches Outfit und keine Kopfbedeckung. Doch empfiehlt sich diese Darstellung kaum in anderen Ländern, beispielsweise in afrikanischen oder asiatischen.

    Nicht zuletzt gibt es kalendarische Unterschiede: Feiertage sind sehr regional, und der erste Tag in der Woche muss nicht überall der Montag sein. Auch ist der bei uns übliche Gregorianische Kalender nicht auf der ganzen Welt gültig. So orientiert man sich in asiatischen Staaten wie Thailand eher an der buddhistischen Zeitrechnung.

    Von der Relevanz unterschiedlicher Wortwahl wurde bereits gesprochen. Noch komplexer wird es, wenn jenseits der lateinischen Sprachen unterschiedliche Schreibrichtungen umgesetzt werden müssen. Beispielsweise Hebräisch oder Arabisch mit „RL-TB“ (von rechts nach links und dann von oben/top nach unten/bottom) oder auch traditionelle, asiatische Schriften mit „TB-RL“ (von oben nach unten und dann von rechts nach links). Rechtschreibung und Silbentrennung sind hier sehr unterschiedlich.

    Strikte Trennung von Inhalt und Präsentation

    Neben der Entkopplung von Geschäfts- und Sprachlogik kommt es bei der Internationalisierung vor allem auf die strikte Trennung des Inhaltes von der Präsentation unter Zuhilfenahme geeigneter Technologien (wie z.B. XML) an. Dabei geht es unter anderem um folgende Fragen:

    • Wie bildet man die Informationen ab in Austauschformaten, die weitestgehend sprachunabhängig sein sollen?
    • Wie präsentiert man diese Informationen dem Empfänger?
    • Muss eine Adresse in einem strukturierten Format abgelegt werden oder schon formatiert vorliegen, damit man es am besten umsetzen kann? Oder führt man gleich beide Formate?
    • Wo setzt man welche Aspekte um? In der Fachapplikation, im Output Management oder anderswo? Lassen sich bestimmte Themen zentral für alle Ausgabekanäle realisieren, so dass sie nicht mehrfach in möglichweise unterschiedlichen Technologien umgesetzt werden müssen?

    Indem man die einzelnen Aufgaben in nacheinander gelagerte Prozessschritte aufteilt, lässt sich die Komplexität reduzieren. Außerdem gibt es beispielsweise beim Unicode Consortium verschiedene Hilfsdatenbanken, die bei der Lokalisierung helfen können. Empfohlen sei an dieser Stelle das Common Locale Data Repository (CLDR) [1].

    Fazit

    Lokalisierung ist mehr als nur Übersetzung. Ein Unternehmen kann möglicherweise bei seinen Kunden punkten, wenn es in der Kundenkommunikation mehr als nur die Pflichtsprache(n) anbietet. Lokalisierung kann also sowohl aus einer Notwendigkeit von steigenden Compliance-Anforderungen als auch aus eigenem Antrieb heraus angegangen werden. Doch spielt bei der Umsetzung auch das Kosten-Nutzen-Verhältnis eine Rolle, denn die Auswirkungen in die Systemlandschaft sind oft weitreichend. Daher ist es in diesem Zusammenhang notwendig, sich parallel mit dem Dokumenten- und Output-Management zu beschäftigen.

    „Lokalisierung“

    Im Zusammenhang mit der Lokalisierung von Inhalten sind einige Begriffe entscheidend.
    So steht die Abkürzung „l10n“ für das englische localization, welches die eigentliche Anpassung von Inhalten an eine Sprache und/oder Kultur bedeutet. Darunter fallen Themen wie Übersetzung (translation oder „t9n“), Zahlenformate, Datumsformate und mehr. „i18n“ ist entsprechend die Abkürzung für internationalization (ein „i“, 18 weitere Buchstaben und ein „n“ am Schluss). Darunter versteht man, grob gesagt, die Vorbereitung sämtlicher involvierter Systeme zur Ermöglichung der Lokalisierung.

    www.compart.com

    Jeremias Märki, freier Softwareentwickler und Berater im Auftrag der Compart AG. Compart ist ein führender globaler Anbieter von Multi-Channel-Lösungen für das Dokumentenmanagement. Das Unternehmen mit Hauptsitz in Deutschland ist seit mehr als zwei Jahrzehnten im Markt präsent und verfügt über Niederlassungen in Europa und Nordamerika sowie ein Partnernetzwerk in Lateinamerika.

     

    Quelle

    [1] http://cldr.unicode.org