KI-basierte virtuelle Experten: Sie lernen aus Dokumenten.

     

       Paul Caspers, Vorstand der Theum AG.

     

     

    Unternehmen sehen sich heute mit einer Flut von Dokumenten zu immer umfassenderen Regularien, komplexeren Produkten, komplizierteren Abläufen und einem exponentiell wachsenden Meer an Wissen konfrontiert: Selbst mit modernster Suchmaschinentechnik können nicht einmal mehr Spezialisten diese massive Fülle an neuen Informationen in ihren Fachgebieten überblicken. Besonders evident wird das Problem in Unternehmen und Organisationen in Bezug auf ihre betriebsnotwendigen Informationen in unendlich vielen Schriftstücken – vom einfachen Dokument bis zum umfänglichen Buch, von Papier über Office Formate bis hin zu Wiki und Web Inhalten, abgelegt an verschiedenen Speicherorten von Dateiservern über DMS oder in der Cloud. In diesen Dokumenten ist heute fast alles festgehalten, was für die Leistungserbringung eines Unternehmens erforderlich ist. In ihnen spiegelt sich das gesamte Know-how der Organisation.

    Genau hier liegt das Problem: Man kommt nur schwer an dieses Wissen heran. Die Speichersysteme erweisen sich als isolierte Silos, die hohe Zugangsbarrieren schaffen. Im Zusammenhang mit der Formatvielfalt ihrer Objekte ist das in ihnen enthaltene Know-how zudem äußerst sperrig, was ein sinnvolles Zusammenführen verteilter Information und deren aggregierte Nutzung auf PCs so mühsam und auf mobilen Geräten so gut wie unmöglich macht. All das führt letztlich dazu, dass das vorhandene Wissen in einer Vielzahl von Fällen gar nicht oder nur mit immensem Aufwand erschließbar ist.

    Für dieses Dilemma benötigen zukunftsorientierte Unternehmen in einer digitalisierten Welt dringend eine Lösung. Und diese kann nicht von einer graduellen Verbesserung überkommener Technologien kommen. Die Lösung des geschilderten Problems erfordert ganz neue Denkansätze und Technologien.

    Viele Suchergebnisse – und doch nichts gefunden?

    Welches Werkzeug auch zur Suche eingesetzt wird (Betriebssystem, DMS, Wiki oder dedizierte Suchmaschine), sobald dabei Dokumente durchforstet werden, erhält man als kleinste Einheit: eben immer diese Dokumente. Sie werden in meist langen, hinlänglich bekannten Trefferlisten präsentiert.

    Das gilt auch für modernste kognitive Software und KI-Anwendungen: Zwar liefern diese präzise Ergebnisse, solange sie auf strukturierte Daten (Big Data) zurückgreifen können: Was haben Leute noch gekauft, die denselben Artikel bestellt haben? Wie alt ist Angela Merkel? Wie wird das Wetter morgen? Auf welcher Route komme ich heute am schnellsten zum Büro? Wenn diese Systeme aber zu einer Frage das Relevante im Pool der Dokumente eines Unternehmens finden sollen, sagen wir beispielsweise alles, was es zu „Künstliche Intelligenz und Algorithmen“ gibt, liefern sie wieder nur die gewohnten Stapel von umfänglichen Schriftgut. Und auch wenn dieses in digitaler Form dargeboten wird, so ist doch die anschließende Suche nach den ‚tatsächlichen‘ Fundstellen in den angezeigten Dokumenten langwierig und aufwendig.

    Hinzu kommt: Je mehr Skills man herkömmlichen Systemen für die Lieferung vernünftiger Ergebnisse anzutrainieren versucht, desto teurer wird deren Einsatz. Deswegen ist dieser nur für hochprofitable ausgewählte Anwendungen überhaupt eine Option. Was als Fakt bleibt: Bestehende Systeme können benötigtes Wissen gar nicht, nur sehr unzureichend oder mit hohem Aufwand aus unterschiedlichen Dokumenten filtern, extrahieren und zu einem neuen Dokument in Form einer vollständigen – sagen wir ruhig – brauchbaren Antwort zusammenstellen.

    Antworten, keine Trefferlisten

    Anwender suchen (von Objekten mit „Records-Charakter“ wie Rechnungen abgesehen) aber keine Dokumente, sondern feingranular extrahierte und „in einem Stück“ angebotene Information zu anstehenden Aufgaben und Themen. Sie brauchen zu einer Suchanfrage ein aus wesentlichen Teilen verschiedener Quellen erstelltes Exzerpt mit dem gesamten Ergebnis.

    Anstatt endlos Zeit beim Durchforsten von öden Trefferlisten mit dem Öffnen und Durchblättern langer Dokumente zu verschwenden, wünschen sich Anwender also direkte Antworten. Sie wollen das gerade benötigte Wissen möglichst mit einem einzigen Klick – extrahiert aus allen relevanten Dokumenten – kontextorientiert zusammengestellt und sofort nutzbar erhalten. Und genau das ist heute möglich: mit Software die aus Dokumenten eines zugeordneten Themenkomplexes lernt und mit diesem Wissen auf Suchanfragen vollständige Ergebnisse in „gebundener Form“ liefert.

     

    Eine Matrix, die alles auf den Punkt bringt

    Der Weg in eine „Zukunft mit Antworten aus Dokumenten“ führt über ein neuronales Netz. Denn in unterschiedlichen Dokumenten verpacktes Wissen kann eben nicht durch bloßen Zugang zu denselben effizient erschlossen werden, sondern es muss letztlich von seiner Hülle befreit und in ein solches Netz überführt werden. Software der neuesten Generation erledigt dies ohnehin selbsttätig.

    Im Rahmen dieses Prozesses werden Dokumentinhalte normalisiert. Der aus der Datenbankwelt entlehnte Begriff bedeutet so etwas wie „in strukturierte maschinell auswertbare Daten umwandeln“. Dokumente werden dabei in ihre atomaren Bestandteile (Kapitel, Absätze, Listen, Tabellen, Bilder, Wörter …) zerlegt, thematische Bezüge („Verwandtschaften“) zwischen den Elementen nach ausgeklügelten Verfahren ermittelt und gewichtet. Darüber hinaus wird das Ganze mit vorhandenen oder anhand von Mustern erkannten Metadaten angereichert. Im letzten Schritt wird den Wissensatomen noch ein einheitliches responsives Erscheinungsbild verpasst.

    Legt man solchermaßen in Form gebrachte Dokumentinhalte in einer smarten Matrix ab, enthält diese das dokumentierte Wissen einer Organisation zu einem entsprechenden Themenkomplex in sachgerecht vernetzter Form. Und dieses Netz wird bei Änderung der Dokumentinhalte bzw. beim Hinzufügen neuer Quellen organisch eigenständig wachsen. Diese Matrix des Wissens erlaubt also allein mittels Standard-Browser die vollautomatisierte, „dokument-befreite“, geräteunabhängige, einheitliche und stets aktuelle Bereitstellung dokumentierter Information jeglicher Art in Form durchgängiger, präzise zu navigierender digitaler Bibliotheken und Bücher.

    Dokumente bleiben Dokumente

    Die Lösung erfordert weder Abschaffung oder Änderungen von Dokumenten, noch Anpassungen bestehender Systeme und Abläufe rund um das Management von Dokumenten – und schon gar nicht verlangt sie langwierige Konzeptionsarbeiten zur ihrer Einführung. Die Matrix wird völlig automatisch auf der Grundlage der vorhandenen Dokumente erzeugt.

    Es reicht, dem System mitzuteilen, wo die Dokumente liegen, aus denen der Inhalt der Matrix generiert werden soll – etwa auf einem Fileserver, in einem DMS, einer SharePoint-Dokumentbibliothek, einem Wiki, einer Website oder in der Cloud. Es müssen dazu keine Unternehmenstaxonomien, Nomenklaturen, Metadatensystematiken oder andere aufwändige Konstrukte konzipiert werden. Auf diese Weise lassen sich dokumentierte Information zu beliebigen Themen – basierend auf mächtigen daraus erzeugten Netzen – als komfortabel zugreifbares Wissen für direkte Nutzung am PC, Tablet und Smartphone intern oder, wenn gewünscht, weltweit in wenigen Tagen bereitstellen.

    Virtuelle Experten, die aus Dokumenten lernen

    Die neben der komfortablen Wissensbereitstellung aber viel durchschlagendere Kraft dieser Technik ist, dass jede zu einem bestimmten Themenkomplex generierte Matrix nun wie eine Art „virtueller Experte“ fungiert, der mit dem in der Matrix gespeicherten und vernetzten Wissen Antworten auf allfällige Fragen zu den verarbeiteten Inhalten geben kann. Diese digitalen Helfer stehen jedem Beschäftigten im Unternehmen und bei Bedarf auch dessen Kunden und Partnern zur Verfügung – zu jeder Zeit, an jedem Ort, auf jedem Gerät.

    Klassische Trefferliste heutiger Suchmaschine (Auszug): Basis Project-Consult Newsletter 1999–2018

    Dieselbe oben zitierte Dokumentrecherche zu „Künstliche Intelligenz und Algorithmen“ wird nun mit einer sofort nutzbaren Antwort erwidert – verfügbar innerhalb eines Sekundenbruchteils. Ohne diese Unterstützung müssten viele umfängliche Dokumente zum Thema durchstöbert werden, um diese Information zu selektieren. Natürlich sind alle Elemente der Antwort klickbar und auf diese Weise mehrstufig vernetzt mit den jeweils umgebenden und weiterführenden Informationen.

    Virtuelle Experten bieten folglich auf Basis der zugrundeliegenden Matrix einen antwortorientierten Zugriff auf Wissen. Um eine gewünschte Antwort zu liefern, gibt es zwei Wege: Bei dem ersten wird sofort ein Antwortdokument mit relevanten Extrakten aus dem Inhalt aller für das Thema geltenden Dokumente erzeugt. Bei der zweiten Methode führt der virtuelle Experte den Anwender zum richtigen Ziel. Dies ist dann der Fall, wenn eine Antwort bei recht allgemein gehaltenen Anfragen eine definierte maximale Länge überschreitet. Dann bildet das System dynamisch Fachrubriken aus dem Ergebnis und bietet diese als präzisierende Kontext-Optionen für die Antwortermittlung an. Wenn man etwa den Begriff „Cholera“ in einem Berater zu Seuchen recherchiert, könnte man Optionen wie Behandlung, Verbreitung, Inkubationszeit etc. erhalten.

    Wissen, immer „up to date“

    Ein virtueller Experte liefert immer einen umfassenden, aus allen verfügbaren Quellen gespeisten Gesamtüberblick zu einem Thema. Das im Gegensatz zu den diskontinuierlichen Trefferlisten so vermittelte komprimierte Gesamtbild eines Sachverhaltes beugt Fehlentscheidungen mit vielleicht gravierenden Folgeschäden infolge übersehener Information vor.

    Mit virtuellen Experten kann also die in Bergen von Dokumenten verpackte Information antwort-orientiert auf jedem Endgerät passgenau als nutzbares Wissen erschlossen werden. Da sich das Know-how der virtuellen Experten aus zugeordneten Quelldokumenten unterschiedlichster Herkunft speist, gibt es eine weitere wichtige Synergie: Der entstehende „Single Point of Access“ zum dokumentierten Wissen eliminiert alle aus den diversen Informationssilos, der System- und Formatvielfalt resultierenden Zugriffsbarrieren.

    Fazit

    Virtuelle Experten, die aus Dokumenten lernen, lösen ein großes Problem: Sie erschließen den in zahllosen Dokumenten jeder Couleur verborgenen Wissensschatz von Organisationen. Nicht jedes Mal perfekt – aber immer besser als heute verfügbare Alternativen. Insbesondere bewirken virtuelle Experten sofort eine signifikante Reduktion (teils Elimination) von Suchzeiten im ganzen Unternehmen durch unmittelbar verfügbare vollständige Antworten. Darüber hinaus bieten sie einen barrierefreien Informationszugang durch Wissensbereitstellung über einen einzigen Zugriffspunkt und eine uneingeschränkte Wissensmobilität durch On- und Offline-Bereitstellung der Information auf allen modernen Medien.

    Virtuelle Experten sind bereits heute für beinahe jedes Thema äußerst wirksam und nutzbringend einsetzbar. Sie beziehen ihr Wissen aus Dokumenten, lassen sich binnen Tagen implementieren und für beliebig definierte Zwecke in Betrieb verwenden. Sie arbeiten alle nach denselben Prinzipien und können sich sogar untereinander verständigen und damit ihre Auskunftsfähigkeit steigern. Virtuelle Experten können überall dort sinnvoll eingesetzt werden, wo umfangreiches Wissen in Dokumenten vorgehalten und regelmäßig von vielen Menschen benötigt wird, beispielsweise bei:

    • Richtlinien, Verfahren, Vorschriften, Gesetzen, Compliance
    • Produkthandbüchern, Betriebshandbüchern, Sicherheitsvorgaben, Support
    • Normen, Projekte, F&E, Dossiers, Fallakten, Patente
    • Vertrags- und Risikomanagement
    • Rundschreiben, Fachmitteilungen, Tagungsunterlagen
    • Marktanalysen, Wettbewerbsbeobachtung, Studien

    Mit virtuellen Experten lässt sich also das Optimum aus den vorhandenen Systemen eines Unternehmens herausholen und das darin enthaltene Wissen vollumfänglich barrierefrei erschließen.

     

    www.theum.com

    Die Theum AG ist in Stuttgart ansässig. Unternehmen jeder Größe nutzen die Technologie von Theum weltweit zur Bereitstellung einsatzbereiten Wissens für Menschen, Anwendungen, Systeme und Maschinen.