Enterprise Search – trotz SharePoint? (Teil 2)

Dr. Uwe Crenze, geschäftsführender Gesellschafter der interface:business Unternehmensgruppe

SharePoint 2013, systemübergreifende Suche, Search Assessment, Such- und Informationsportale

Die uns zur Verfügung stehenden digitalen Inhalte wachsen exponentiell an – sowohl im Internet als auch in Unternehmen, der Öffentlichen Verwaltung und in Forschungseinrichtungen. Immer mehr Inhalte werden von vorn herein digital erzeugt. Dieser Trend wird durch die aus Compliance-Anforderungen resultierende digitale Archivierung und durch Soziale Software entstehende Nutzer-erzeugte Inhalte verstärkt.

Information Overload und Suche

Das führt zwangsläufig zu einem Information Overload. Nicht zuletzt durch die Erfahrungen bei der Nutzung des Internets haben sich Suchlösungen als bevorzugtes Mittel für den Zugriff auf große Informationsbestände auch innerhalb von Organisationen etabliert. Organisationsinterne Suchlösungen (Enterprise Search) unterliegen weit komplexeren Anforderungen als Internet-Suchmaschinen. Suchszenarien für interne Informationsbestände berücksichtigen den Kontext von Geschäftsprozessen und die Rollen der Nutzer in diesen Geschäftsprozessen. Hier ist eine starke Verflechtung von unstrukturierten Daten mit strukturierten Daten gegeben. Eine reine Volltextsuche oder ausschließliche Metadatensuche kann dabei nur unbefriedigende Ergebnisse liefern.

Suchlösungen in Organisationen müssen sich sehr stark an Metadaten aus strukturierten und semi-strukturierten Fachdaten orientieren, um daraus semantische Bezüge zu unstrukturierten Daten abzuleiten. Über diesen Weg können Filterkriterien für eine facettierte Suche und die Parametrisierung von Nutzerprofilen gewonnen werden, die eine kanalisierte und personalisierte Informationsversorgung ermöglichen.

Bild 1: Enterprise Search im Kontext anderer Technologien

Erweiterte Indexierungs- und Suchfunktionen

Unabhängig vom Aspekt der systemübergreifenden Suche, ist die Funktionalität der Standardsuche von SharePoint für gehobene Suchanforderung nicht ausreichend. Auch dies kann ein Grund für den Ersatz einer alternativen Suchlösung sein. Will man nicht auf SharePoint 2013 warten (oder es werden noch weiterreichende Funktionalitäten benötigt), stehen als Optionen der Einsatz von FAST Search-Server 2010 oder eine dedizierte Enterprise Search-Lösung.

Wichtige Zusatzfunktionen einer Enterprise Search-Lösung sind unter anderem:

  • Indexierung von Nicht-Microsoft-Dateiformaten
  • Suchindex-basierte Applikationen
  • Extraktion von Metadaten aus den Text-Inhalten (z.B. Named Entity Extraction, wie die Erkennung von Personennamen oder geografischen Begriffen im Text)
  • Vorschau für gefundene Inhalte inklusive Trefferhervorhebung für alle indexierten Dateiformate
  • Erweiterte Suche (Formular, nicht nur einfaches Sucheingabefeld)
  • Gespeicherte Suchen, Benachrichtigung über neue Treffer, Suchergebnis als RSS-Feed
  • Social Search (Tagging & Bookmarks)
  • Hohe Skalierbarkeit der Indexierung und der Suche bei geringer Komplexität (Installation, Betrieb und Ressourcenanforderungen

Bei SharePoint 2010 kann außerdem der Einsatz einer nutzerunabhängig lizenzierten Enterprise Search kostengünstiger sein, als eine entsprechende Lizenzaufrüstung auf SharePoint Enterprise in Verbindung mit dem FAST Search-Server.

Im Falle mehrerer Inhaltsquellen kommen weitere Gründe hinzu, die für den Einsatz einer Enterprise Search-Lösung sprechen:

  • Einrichtung eines Such- und Informationsportals unabhängig von den Quellsystemen der Inhalte, kombiniert mit anderen Web2.0-Applikationen, wie der Bereitstellung von Nachrichten- bzw. Aktivitätsströmen
  • Nicht durch SharePoint Search oder FAST Search unterstützte Inhaltsquellen wie z. B. E-Mail und SAP. Zum Teil kann hierfür auf 3rd-Party-Konnektoren für SharePoint zurückgegriffen werden.

Bild 2: Beispiel für eine personalisierte Suchoberfläche mit Hyperbolischem Baum

Best Practices

Die Einführung einer Enterprise Search-Lösung erfolgt typischerweise im Rahmen eines Projektes, in dem in Abhängigkeit von der Projektgröße bestimmte Phasen enthalten sein sollten. Unerlässlich ist ein Search Assessment bzw. die Erstellung eines Fachkonzepts für die Suche. Hier bietet es sich an, auf die Erfahrungen des Herstellers bzw. eines Dienstleisters zurückzugreifen. Wie bei jeder anspruchsvollen Software hängt der erfolgreiche Einsatz einer Suchlösung sowohl von der Leistungsfähigkeit des eingesetzten Produktes als auch von dessen fachgerechter Konfiguration ab.

In größeren Einführungsprojekten wird ergänzend ein Proof of Concept (PoC) mit ausgewählten Inhaltsquellen und Stakeholdern durchgeführt. Die dabei gewonnenen Erkenntnisse aus dem Feedback der Pilotnutzer fließen dann in eine Optimierung der der Suche für die Produktivsetzung ein. Die Einführungsphase ist gewöhnlich mit der schrittweisen Einbindung weiterer Inhaltsquellen verbunden. Während des Betriebs der Suche sollten regelmäßige Auswertungen des Suchverhaltens für die Nachjustierung der Suche erfolgen.

IT-Infrastrukturaspekte

Ein wichtiger Punkt bei der Umsetzung globaler Suchlösungen in großen Organisationen ist die Berücksichtigung der durch die vorhandene IT-Infrastruktur vorgegebenen Randbedingungen. Die für die Suche relevanten Aspekte sind von der Organisationsstruktur, den Geschäftsprozessen, den Rollen- und Rechtekonzepten sowie der Bandbreite der Netzwerkverbindung zwischen verschiedenen Standorten geprägt. Zusätzlich spielt die Anzahl der in die Suche einbezogenen Systeme und die Menge der dabei zu indexierenden Informationsobjekte eine wichtige Rolle bei der Spezifikation der konkreten Umsetzungsstrategie.

Zu betrachten sind insbesondere folgende Einflussfaktoren:

  • Gesamtmenge und Wachstumsraten der zu indexierenden Informationsobjekte
  • Anzahl der gleichzeitig auf die Suchlösung zugreifenden Nutzer
  • Bandbreiten zwischen verschiedenen Standorten und Verteilung der Nutzer über die Standorte (in der Regel leitet sich daraus eine vorwiegend lokale Indexierung der Systeme ab)
  • Inhaltsquellen-übergreifende  Zugriffs- und Rechtestrukturen (vorzugsweise per zentraler Authentifizierung über Microsoft Active Directory oder einen anderen Verzeichnisdienst)
  • Administrationsarme Installation von Updates mit einem definierten Zeitfenster für eine ggf. notwendige Neuindexierung

Die Ergebnisse der Auswertung dieser Randbedingungen fließen in das Fachkonzept ein, wozu die zu realisierenden Topologie der Suchlösung und die dafür benötigten Hardwareressourcen gehören. Als Alternative zu einer Softwarelösung (auf physikalischer Hardware oder auf virtuellen Servern) ist die Realisierung der Suchlösung als Appliance in Erwägung zu ziehen. Eine Appliance ist ein für die Suche optimal konfiguriertes System. Sie darf allerdings keine Black-Box-Lösung sein und muss ausreichend Möglichkeiten zur nutzerspezifischen Anpassung bieten.

Trends

Das systemübergreifende Suchen hat sich in den letzten Jahren massiv weiterentwickelt. Die Entwicklung bei anderen IT-Lösungen wirkt zusätzlich als Katalysator und bringt bemerkenswerte Synergien im Zusammenspiel mit Enterprise Search hervor. Insbesondere die Themen Mobilität & Cloud, Social Search und Big Data prägen die aktuellen Entwicklungen bei Enterprise Search-Produkten und werden die Anwendungsfelder für Suchindex-basierte Applikation und Informationsportale deutlich verbreitern.