Interview 10.4

    Schatzsuche: Geschäftsoptimierung durch Filtern unstrukturierter Daten
    Oliver Oursin, IBM

    Business Intelligence (BI), Content Analytics, Informationsmanagement, Text Mining

    Business Intelligence (BI) zählt seit Jahrzehnten zu den „Standard-Disziplinen“ der IT. Betriebswirtschaftlich gesehen, ist das nichts Neues. Im Moment scheint allerdings eine Welle durch den Markt zu gehen, die das Thema zu einem Business Treiber macht. Warum?
    Dafür gibt es verschiedene Gründe. Einer davon ist als Reaktion auf die Krise der letzten zwei Jahre sicher der Wunsch nach Transparenz und nach Information im weitesten Sinne. Man sieht heute, dass Informationen, die als Indikatoren hätten gesehen werden können, schlichtweg nicht als solche erkannt worden sind. Ein weiterer Treiber ist, dass man „mehr vorausschauen“ möchte. Informationen erst dann zu betrachten, wenn sie da sind, ist für bestimmte Situationen zu spät. Da spüren wir bei unseren Kunden einen großen Druck, die Trends und damit die eigene Geschäftsentwicklung besser antizipieren zu können; um Risiken zu minimieren, um mehr Umsatz zu machen. Und schließlich ist da die absolute Menge an Daten: Die Menschheit produziert etwa fünf Petabyte an Daten jeden Tag und der größte Teil davon ist unstrukturiert. In diesem „Topf“ liegt Wissen, das für Unternehmen wichtig ist, für die Risikobeurteilung, Betrugsfälle, Umsatzchancen und so weiter. BI und Content bewegen sich dabei aufeinander zu, am Beispiel von SPSS von BI in Richtung Content. Welches Wissen kann ich als Unternehmen aus meinen Verträgen extrahieren? Wie lokalisiere ich mittels Textanalysen meine unternehmerischen Risiken? Oder, Stichwort Kundenloyalität, wo die Kommunikation zu 90 Prozent mit Dokumenten stattfindet; wie bekomme ich dort Feedback auf Produkte, auf Fehler oder Chancen? Umgekehrt gehen wir mit den IBM Content Analytics von der Content-Seite auf BI zu: Wie kann ich Textinformationen auswerten und strukturieren, so dass ich sie themenbezogen auswerten kann? Zum Beispiel bei der Betreuung von Premienkunden einer Airline, wo es mit E-Mail, der Kommunikation rund um eine Premiumkarte und der direkten Service-Schicht eine Reihe von Interaktionen gibt, die kaum strukturiert sind. Mit Content Analytics werten wir diese Inhalte aus, um den Anwendern, die ja keine Textanalytiker sind, nachvollziehbare Aussagen anzureichen.

    Content Analytics sind aus Sicht eines Durchschnittsunternehmens, eines Durchschnittsanwenders doch noch viel zu komplex …
    Da stimme ich nur zum Teil zu. Ein Grund, warum SPSS im IBM-Portfolio ist, ist die Tatsache, dass sich mit diesen Technologien Aussagen darüber treffen lassen, warum beispielsweise Toyota sich um ein Problem mit den Bremsen kümmern müsste. Content Analytics machen diese Information überhaupt erst einmal sichtbar, damit bekommen wir die linguistischen Aspekte in den Griff. Natürlich muss ich als Unternehmen für solche Analysten zumindest die Systematik der Suche vorgeben, wenn ich etwas finden will.

    Wie kann ich denn nach etwas suchen, ohne zu wissen, wonach ich suchen muss?
    Text Mining bietet die Möglichkeit, Informationen so zu analysieren, dass Muster erkennbar sind. So ist zum Beispiel der Fahrzeugbauer BMW naturgemäß stark daran interessiert, dass die Kunden mit den Fahrzeugen zufrieden sind. Also ist es wichtig, die Anzahl der Werkstattbesuche zu reduzieren, Reparaturen so schnell wie möglich zu erledigen. BMW setzt SPSS ein, um die Wartungsverträge und unstrukturierten Informationen zu filtern, die in den Werkstätten anfallen, denn man weiß ja noch nicht, wo es ein Problem gibt. So meldeten sich beispielsweise die Kunden bei ihren BMW-Händlern mit Problemen bei der Distance Control. Über Text Mining konnte BMW einen Zusammenhang herstellen – dass immer, wenn es ein Problem mit dem Schiebedach gab, auch ein Problem mit der Distance Control auftrat, was die Fehlersuche und -behebung deutlich beschleunigt hat. Ein gutes Beispiel für den Wert von Text Mining, denn außer der Fahrgestellnummer, der Händlerinformation und dem Land lagen hier ausschließlich unstrukturierte Informationen vor.

    Wie aufwendig ist das Aufsetzen eines solchen „Systems“, eines solchen Screenings?
    So etwas lässt sich natürlich nicht an einem Tag aufsetzen. Andererseits sollte sich ein Unternehmen ruhig mal den Aufwand anschauen, den es für seine strukturierten Daten betreibt. Bei einer Inhaltsanalyse geht es nicht zuletzt darum, das Crawling zu optimieren. In Hinblick auf linguistische Fragen brauche ich natürlich jemanden, der das Konzept an sich versteht. Grundsätzlich sollte das Thema, wenn man den Aufwand betrachtet, wie überall im Verhältnis zu dem erwarteten Nutzen gesehen werden. Und der kann enorm hoch skalieren, wenn, siehe BMW, damit schnell Kausalzusammenhänge sichtbar werden. Ein anderer Bereich ist das Thema Versicherungsbetrug. Wenn ein Versicherungskonzern nur ein Prozent der auszuzahlenden Schadenssumme einsparen kann, wird der Nutzen deutlich höher als der Aufwand sein.

    Wenn sich BI und Inhalte aufeinander zu bewegen, was hat die Technologie dazu beigetragen?
    Ich würde das weniger an Technologien festmachen. Der eigentliche Treiber dahinter, und das ist für uns alle neu, ist die private Seite. Bislang waren wir in unserem Privatleben stark von dem „Fallout“ der Geschäftswelt getrieben, also was sich dort an Ideen und Technologien durchgesetzt hat, siehe das Arbeiten mit Laptops. Hier ist es genau umgekehrt: Das private Verhalten der Anwender bestimmt den Umgang mit Informationen. Wer schnell bei Google nachschaut, sucht nicht strukturiert, wer eine Reise buchen will, sucht auch nicht strukturiert nach Daten. Dieser instinktive Umgang mit Daten, mit Text, ist ein wesentlicher Treiber für die Veränderungen in den Unternehmen.

    Was als Web 2.0 begann, ist heute Enterprise 2.0, BI inbegriffen?
    Die Veränderungen, die wir im Moment erleben, sind systemimmanent, allerdings nicht wirklich ausgesprochen. Unsere Kunden fangen an zu nicken, wenn wir darüber reden, wie man mit Informationen umgehen sollte. In Meetings wird die Faktenlage nicht selten als unzureichend empfunden und dann hört man, der Kunde habe soundsoviel umgesetzt oder er habe sich beschwert und dann ist der erste Reflex oft, das gleich wissen zu wollen, direkt im Browser nachzuschauen.

    Die gern zitierten „Digital Natives“ die demnächst bestimmen, wie in Unternehmen gearbeitet wird …
    Ich will nicht bestreiten, dass sich die Menschen heute genauso verhalten wie vor 10 oder 20 Jahren. Als Mathematiker kann ich mich allerdings nicht über etwas streiten, was sich nicht beweisen lässt. Wer vor Jahrzehnten beim Trivial Pursuit über eine Frage diskutiert hat, musste im Brockhaus nachschauen.

    Wobei der nicht immer zur Hand war …
    Richtig, heute sind solche Informationen direkt zur Hand. Im Bereich der Konsumgüter sind Blogs und Foren für die Unternehmen aus Marketingsicht wichtig. Wenn heute ein neues Mobiltelefon auf den Markt kommt oder neue Sneakers, dann wird das in Blogs und in Social Media diskutiert, eine Entwicklung, auf die wir großes Augenmerk legen. Statt Unternehmen wie früher nur dabei zu unterstützen, ihr Geschäft zu betreiben, verlagern wir den Fokus dahin, ihr Geschäft zu optimieren, neudeutsch „Operational Excellence“ genannt.

    Eine neue Qualität im Umgang mit Informationen?
    Kunden wollen Informationen, ohne extra dafür zu zahlen, das ist nichts Neues. Was wirklich neu ist, ist der Druck von Seiten Social Media. Hier wollen sich die Unternehmen neue Wettbewerbsvorteile verschaffen, die drei klassischen Schrauben Kosten, Umsatz und Excellence reichen nicht mehr aus. Diese Art der Optimierung ist neu, das merken wir an der veränderten Art der Projekte, an den veränderten Aufgabenstellungen. Vor zehn Jahren war der Markt noch nicht so weit. Die großen Analysten sagen dazu, dass der Weg zu den „Analytics“ gar nicht mehr über das reine BI oder Reporting geht. Zudem, ein letzter Punkt, verteilen die traditionellen Benutzergruppen Informationen wesentlich weiter und sind wesentlich enger an den Kontext gebunden.
    Ein typisches „Geschäftsproblem“ wirft die Frage auf, wo der Hebel ist, mit dem ich aus Sicht des Unternehmens den größten Nutzen aus dem Reservoir der Möglichkeiten bekomme. Wir gehen dieses Thema analytisch an und geben unseren Kunden ein Set an Optionen. Als Unternehmen muss ich mich fragen, mit welcher Aktion, mit welcher Maßnahme ich den größten Einfluss auf meine Kennzahlen erreiche, was die Einflussfaktoren sind, strukturiert oder unstrukturiert, die wichtig sind?

    Gibt es diese Sichtweise in den Unternehmen bereits?
    Sicher nicht durchgängig, doch die ersten gibt es …

    Für diesen Blick wäre die Fähigkeit gefragt, Informationen neu bewerten zu können, einen neuen Blick darauf entwickeln zu können …
    Das ist richtig. Im Moment optimieren wir die Resultate, im nächsten Schritt optimieren wir unseren Planungsprozess. Ein weiteres Beispiel: Headcount und Kostenplanung ist für viele Unternehmen im Kielwasser der Krise ein wichtiges Thema. COGNOS kann über eigene Workforce-Lösungen den Unternehmen beispielsweise proaktiv eine Liste der Mitarbeiter ausgeben, die aller Wahrscheinlichkeit nach das Unternehmen verlassen werden, einschließlich der Angabe der Gründe. Das ist natürlich für viele Unternehmen Neuland, allerdings kommen gerade wir in Deutschland als Exportnation nicht darum herum, unsere Prozesse, unser Operating ständig zu verbessern.

    Inhalte plus BI – was können wir in den nächsten Jahren erwarten?
    Unternehmen speichern 80 Prozent der Daten unstrukturiert, das ist ein Schatz, den wir heben müssen. Dafür wird es in den kommenden Jahren immer mehr Lösungen geben, für Consumer, horizontale Lösungen wie für Workforce und andere. Plus: Die strukturierten und unstrukturierten Daten werden noch stärker miteinander verschmelzen, so dass wir irgendwann kaum mehr einen Unterschied sehen werden. Die Anwender werden immer weniger von Daten, sondern immer mehr von Informationen sprechen. Gerade unser Umgang mit Google lässt erkennen, dass der Graben zwischen diesen beiden Welten immer flacher wird. Was ich zudem sehe, ist ein Trend hin zu einem veränderten Umgang mit der Zeit, quasi Zeit 2.0. Ich meine damit nicht unbedingt die Realtime-Idee, nicht unbedingt die Jetztzeit als vielmehr den Begriff „zeitnah“. Unser Blick in die Zukunft, das Vorausschauen, wird sich verändern. Wenn wir Auto fahren, werden Vergangenheit, Jetzt und Zukunft von uns souverän eingeteilt: Der Tacho zeigt die Jetztzeit, die Tankanzeige die Zukunft und der Kilometerstand die Vergangenheit. Sie wären kein guter Autofahrer, wenn Sie das nicht mit in Ihre Planung einbeziehen würden. Ohne nachzudenken, sind diese drei Ebenen für uns eins. Im Unternehmensalltag hingegen trennen wir diese drei Horizonte immer noch voneinander. Doch der Anwender von morgen will keinen Blick mehr auf nur einen dieser drei Horizonte. Die Zeit wird also ein natives Element werden und wir als Informationsprovider müssen diesen Blick darauf aufnehmen.

    Oliver Oursin ist IBM Business Analytics. IBM Cognos-Lösungen stehen für Business Intelligence, Business Analytics (Geschäftsanalyse) und unternehmensweites Performance Management.
    www.ibm.com