KI-basierte Browser-Applikation zur Multilingualisierung von Audio- und Video-Content
Mannheim, 03.08. 2022 +++ Die alugha GmbH, ein Experte für die multilinguale Bereitstellung von Video- und Audio-Content (https://alugha.com), hat mit „alugha2go Fast“ eine browserbasierte Applikation gelauncht, die es neben internationalen Unternehmen und Bildungseinrichtungen nun auch Content Creators, YouTubern, Podcastern und sogar Privatpersonen erlaubt, Video- und Audio-Dateien automatisch in die gewünschte Sprache zu übersetzen – ganz ohne Account und Anmeldung. Anwender fügen dafür den Link zu einer auf YouTube, Vimeo oder der alugha-Plattform gespeicherten Datei in die alugha2go-Seite ein und wählen ihre Zielsprache(n) sowie eine Stimme aus. Nach wenigen Minuten erhalten sie einen Link, über den sie die multilingual aufbereitete Video- oder Audio-Datei samt Transkript herunterladen können.
Pro-Version für Business-Nutzer
Während die kostengünstige „Fast“-Version rein KI-basiert funktioniert, gibt es mit „alugha2go Pro“ eine Anwendung, die noch höhere Qualitätsansprüche erfüllt – und damit insbesondere den Anforderungen von Unternehmen und Bildungseinrichtungen, die Unmengen an Videos zu übersetzen haben, gerecht wird: Fachlich versierte Muttersprachler prüfen die KI-basierte Übersetzung und nehmen, falls nötig, Korrekturen und Anpassungen am Transkript vor. „Da wir die KI mit vielen tausend Videos und Sprachen täglich trainieren, erreicht sie eine Übersetzungsgenauigkeit von rund 95 Prozent“, erklärt Bernd Korz, Gründer und Geschäftsführer von alugha. „Die letzten fünf erreichen wir durch die Zusammenarbeit mit Muttersprachlern.“ Dabei ist nicht nur der Prozess derselbe wie bei „alugha2go Fast“, auch die Übersetzung ist in kurzer Zeit abrufbar.
Natural Language Processing als technologische Basis
Zugunsten eines automatisierten Übersetzungsprozesses greift alugha auf verschiedene Verfahren des Natural Language Processings (NLP) zurück: von der automatischen Spracherkennung (Speech-to-Text; STT) über die maschinelle Übersetzung (Neural Machine Translation; NMT) bis hin zur Sprachsynthese (Text-to-Speech; TTS). Diese Technologien sind im Online-Übersetzungs-Workspace dubbr, auf den registrierte alugha-Kunden ebenfalls Zugriff haben, gebündelt und dort mit passenden Open-Source-Lösungen kombiniert. So kommen beim Text-to-Speech-Verfahren mit Tacotron 2 und FastSpeech 2 zwei KI-Modelle zum Einsatz, die alugha anhand eigener Audio- und Textdaten immer weiter optimiert. Durch dieses Re-Training verbessern sich die alugha2go zugrunde liegenden neuronalen Netze und Machine-Learning-Algorithmen immer weiter – ebenso wie die Trainingsdaten.
Nutzerdaten sind sicher
Anders als seine US-amerikanischen Mitbewerber legt alugha großen Wert auf den Schutz und die Sicherheit von Nutzerdaten. alugha verzichtet auf Tracking-Cookies und verarbeitet Kundendaten in Übereinstimmung mit den Vorgaben der DSGVO: Sie verbleiben in deutschen Rechenzentren, die ISO/IEC 27001-zertifiziert und mit Energie aus Wasserkraft betrieben sind.
Kombination aus Plattform, Player, Hosting und Encoding ist am Markt einzigartig
„Neben dem Datenschutz besteht der Vorteil von alugha sicherlich in der einzigartigen Kombination aus Content-Management-Plattform, multilingualem Player, Encoding-Technologie und Hosting-Angebot“, sagt Bernd Korz. „Unternehmen profitieren von deutlich effizienteren Workflows. Sie können nicht nur mehr Videos und Audios in unzähligen Sprachen in deutlich kürzerer Zeit generieren und bereitstellen, sondern auch verschiedene Use Cases abbilden: Schriftsprache als Tonspur ausgeben, Töne in Untertitel sowie Transkripte umwandeln und dergleichen. Dabei bringt das Zusammenspiel von menschlicher und künstlicher Intelligenz optimale Ergebnisse.“
alugha unterstützt Inklusion und Barrierefreiheit
Für alugha darf die Teilhabe an Bildung nicht an Sprachbarrieren scheitern. „Wir vertreten die Auffassung, dass alle Menschen – egal, wo sie leben, welches Geschlecht sie haben oder ob sie körperlich eingeschränkt sind – ein unwiderrufliches Recht auf Bildung haben“, so Bernd Korz weiter. Die Technologie von alugha ist ein wichtiger Meilenstein auf dem Weg hin zu wirklicher Inklusion und Barrierefreiheit. „Weltweit sind mehr als 460 Millionen Menschen hörgeschädigt oder gehörlos“, erklärt Bernd Korz. „95 Prozent aller Podcasts bieten keine Transkripte und schließen damit per se eine halbe Milliarde potenzielle Nutzer aus. Dem wirken wir entgegen.“ Mit dem Code „IFA30“ erhalten Nutzer von alugha und alugha2go bis 10. September 2022 30 Prozent Rabatt auf ihre Übersetzungsaufträge.
Über alugha
Die 2014 gegründete alugha GmbH (https://alugha.com) mit Hauptsitz in Mannheim ist ein Software-Unternehmen, das darauf spezialisiert ist, Video- und Audio-Content mittels künstlicher Intelligenz und Übersetzungsteams auf der ganzen Welt multilingual bereitzustellen. Die gleichnamige One-Stop-Shop-Videoplattform-Lösung macht sich Verfahren des Natural Language Processings (NLP), wie etwa automatische Spracherkennung (Speech-to-Text; TTS), maschinelle Übersetzung (Neural Machine Translation; NMT) und Sprachsynthese (Text-to-Speech; TTS), zunutze. Das intuitiv über den Browser zu bedienende Tool erlaubt, Videos und Audios mithilfe von KI automatisch in über 200 Sprachen zu übersetzen. Der in die Plattform integrierte „dubbr“ erlaubt, Videos in jede beliebige Sprache und sogar Dialekte zu übersetzen.
Dabei legt alugha großen Wert auf Datenschutz- und sicherheit. alugha nutzt kein Google-Tracking und keine Facebook Pixel. Das Familienunternehmen verarbeitet die Daten seiner Nutzer jederzeit DSGVO-konform: Sie verbleiben in ISO/IEC 27001-zertifizierten Rechenzentren in Deutschland, die mit Energie aus Wasserkraft betrieben sind. alugha beschäftigt rund 40 Mitarbeitende. Mehr als fünf Millionen User:innen besuchen die Plattform jeden Monat. Zu den Referenzkunden von alugha zählen unter anderen BASF, CHNC Pharmacology University, CoHu, Duravit, John Deere, Meisterklasse, Röchling und Trimble.