Montag, 21. Oktober 2013

SharePoint Enterprise Search

Was ist dran an Enterprise Search mit SharePoint? Wer die Microsoft SharePoint Conference 2012 in Las Vegas verfolgt hat weiß, Enterprise Search ist nach der ersten Integration der FAST Search in SharePoint 2010 nun vollständig in die Plattform integriert. Microsoft ist jedoch nicht der einzige Anbieter, der eine Enterprise Search in seine Plattform integriert hat. IBM bietet mit IBM OmniFind eine Lösung für Enterprise Search an, die sich in die Produktpalette von IBM Content Manager und IBM Connections integriert und auch Oracle bietet mit Oracle Secure Enterprise Search eine Lösung an. Neben den Angeboten dieser bekannten Systemhäuser kann man für Enterprise Search auf verschiedene Lösungen von spezialisierten Anbietern zurückgreifen. Die bekannteste Marke ist auf diesem Gebiet sicherlich Google Search Appliance, aber es gibt noch einige weitere Anbieter wie zum Beispiel inter:gator, Coveo oder Polyspot.
Diese Vielfalt an Anbietern ist nicht weiter verwunderlich, betrachtet man den Nutzen von Enterprise Search für Unternehmen. Die Marktstudie "Enterprise Search 2013" von Frauenhofer IAO zeigt die enormen Potenziale der Enterprise Search als Teil des Information Retrivals für Unternehmen auf. Laut dieser Marktstudie und der zugrunde liegenden Enterprise Search Survey 2013 sehen 63% der befragten Unternehmen einen Wettbewerbsvorteil für Ihre Organisation durch die richtige Nutzung von Informationen. Für 73% ist das Auffinden der richtigen Information sehr kritisch oder kritisch zum Erreichen der Ziele des Unternehmens und den Unternehmenserfolg. Jedoch sagen beinahe zwei Drittel (64 %) der Befragten aus, es sei in Ihrem Unternehmen sehr schwer oder schwer, Informationen zu finden. Sogar zur wirtschaftliche Quantifizierung der Einsparpotenziale wird eine Aussage getroffen. Die Einsparpotenziale werden auf circa 8050 € Einsparung pro Jahr und Mitarbeiter beziffert. [1]
Möchte man diese Potenziale für sich erschließen stellt sich die Frage, ob man dafür auf die Lösung eines spezialisierten Anbieters verwenden sollte oder eine bestehende Plattform im Haus, wie zum Beispiel Microsoft SharePoint. Daher werden in diesem Artikel die Möglichkeiten zur Enterprise Search mit Microsoft SharePoint 2013 betracht, jedoch nicht ohne zuvor das Thema näher definiert zu haben.

Was ist Enterprise Search

Die amerikanische Association for Information and Image Management hat eine passende Definition für Enterprise Search erstellt.
"The practice of identifying and enabling specific content across the enterprise to index, search, and display to authorized users." [2]
Somit ist die Enterprise Search ein System zur Integration aller Unternehmensanwendungen; eine komplexe, oft unterschätzte Herausforderung. Ziel ist es, einen einheitlichen Index als Datengrundlage der Suche zu Erstellen und die Informationen daraus dem Benutzer anwenderfreundlich und intuitiv bedienbar zur Verfügung zu stellen.

Enterprise Search Index
Die Anforderungen an Enterprise Search und den Index sind [3] :

  • Der Index muss homogen sein,
  • Schnittstellen zu allen Unternehmensanwendungen müssen vorhanden sein,
  • Es muss eine Zugriffskontrolle analog der Autorisierung des Repositories auf die Inhalte des Indexes geben,
  • Übergreifend über einzelne Unternehmensanwendungen hinweg müssen Suchapplikationen möglich sein,
  • Verarbeitung verschiedener XML- Formate.
Diese grundlegenden Anforderungen wurden im Laufe der Zeit weiterentwickelt und ausgebaut, man spricht von Faceted Search und semantischer Suche. Die Faceted Search soll es dem Anwender ermöglichen, die Information innerhalb eines Suchergebnissen in multiplen Dimensionen zu filtern, welche durch eine Klassifizierung der Inhalte aufgebaut werden. Ein Benutzer kann so zum Beispiel ein Suchergebnis nach allen Dokumenten vom Typ "docx" der letzten drei Monate filtern.
Die semantische Suche bietet dem Anwender ein Ergebnis unter Einbeziehung eines semantischen Models an. Die Abfragekomponente der Suche greift nicht ausschließlich auf den Inhalt der einzelnen Repositories zu, sondern vergleicht die Inhalte mit einem semantischen Model, also mit bereitgestellten Thesauri und Ontologie.

Semantisches Model
Ein einfaches Ergebnis des semantischen Models ist das bekannte "Meinten Sie..." unterhalb einer Suchbox, welches uns ähnliche Alternativen für unser angefragtes Stichwort liefert. Etwas komplexer ist das Ergebnis da schon zum Beispiel bei Onlineshops wie Amazon, die uns anhand der von uns besuchten Artikel Vorschläge unterbreiten, welche Artikel für uns noch interessant sein könnten. Damit eine semantische Suche effektiv im Unternehmen eingesetzt werden kann, muss Sie einfach zu pflegen sein, damit das Model auch die Inhalte des Unternehmens wiederspiegelt. Neben Taxonomiestrukturen, die gepflegt werden, sollen auch Metadaten aus dem Inhalt extrahiert werden. Steht im Fließtext eines Dokumentes zum Beispiel ein bestimmter Kundenname, soll das Dokument auch relevant sein, wenn ein Anwender nach "SharePoint" sucht, da der Kunde im Bereich "SharePoint" agiert. Diese Zuordnung von Metadaten zu einer Entität nennt man "Custom Entity Extraction" und ist Teil eines semantischen Models.
Nicht zuletzte soll die Enterprise Search neben Faceted Search und semantischer Suche auch personalisierte Suchergebnisse anbieten können. Personalisierte Suchergebnisse sind Voraussetzung für auch der Suche basierende Inhaltsveröffentlichung von Neuigkeiten oder Artikeln. Dabei wird aber nicht nur vorausgesetzt, dass die Enterprise Search weiß, welcher Benutzer die Anfrage schickt und die Zugehörigkeit zu Benutzer- und Zielgruppen auflöst. Vielmehr soll das Benutzerverhalten selbst analysiert werden und so das Suchergebnis optimiert. Jemand, der viele Präsentationen öffnet, möchte diese vielleicht höher im Ranking der Suche finden wie ein Kollege, der sich nur für Webartikel interessiert.

Betrachtet man diese Anforderungen, insbesondere die Homogenisierung aller heterogen verteilter Unternehmensanwendungen in einem gemeinsamen Index wird der Umfang eines Projekts im Umfeld der Enterprise Search deutlich. Es ist nicht alleine mit der Anschaffung einer geeignet Technologie getan, auch ist mit dem Einführen einer Enterprise Search hoher Projektaufwand verbunden. Die geeignete Technologie ist jedoch die Grundlage für erfolgreiche Enterprise Search.

Enterprise Search in SharePoint 2013

Es stellt sich die Frage, in wieweit Microsoft SharePoint 2013 die Anforderungen an Enterprise Search erfüllt. Eine grundlegende Anforderung an Enterprise Search ist ein homogener Index, der durch Schnittstellen zu allen Unternehmensanwendungen befüllt wird. SharePoint erstellt einen solchen Index aus verschiedenen Inhaltsquellen ( engl. "Content Source" ) und bedient sich nicht nur über den Opensearch Standard an dem Suchindex des Fremdsystems.

SharePoint Inhaltsquellen

Als Inhaltsquelle für die Suche kann ( wer hätte es gedacht? ) SharePoint selbst ausgewählt werden, aber auch Fileshares, Web Sites und öffentliche Ordner von Microsoft Exchange sind möglich. Unternehmensanwendungen lassen sich als "Line of Business Data" oder "Custom Repository" einbinden. Dabei kommt die Dienstanwendung "Business Connectivity Services" von SharePoint zum Einsatz, mit der man Entitäten aus Fremdsystemen zur Verwendung in SharePoint verwenden kann.  Hat man eine Entität definiert, zum Beispiel einen Kunden aus dem CRM oder ein Material aus dem ERP, kann diese Entität von SharePoint durchsucht werden. Der Zugriff auf die Fremdsysteme kann durch die SharePoint Dienstanwendung "Secure Store Service" verwaltet werden. Die technischen Voraussetzungen zum Anbinden von Unternehmensanwendungen sind also geschaffen, fertige Schnittstellen zu üblichen Unternehmensanwendungen gibt es jedoch nicht.
Bei der Indizierung werden von SharePoint die Metadaten der externen Entität ebenso wie bei allen anderen Inhaltsquellen die Metadaten des Elements als sogenannte "Managed Property" im Index der Suche abgelegt. Natürlich ist es möglich, mehrere Inhaltsquellen anzulegen. Für die Semantik muss sich die Suche jedoch auf die Metadaten der Entität verlassen, denn es gibt keine Möglichkeit, Metadaten von Einträgen im Suchindex nachträglich manuell zu verändern. Die Suche von SharePoint stellt den Katalog von Metadaten aller Quellen als "Crawled Properties" zur Verfügung. Die Crawled Properties werden in "Managed Properties" verwaltet. In den Managed Properties können mehrere Crawled Properties zusammengefasst werden, so das zum Beispiel ein Namensfeld aus verschiedenen Systemen als gleiche Managed Property verwendet werden kann. Diese Eigenschaften können auch durch die zuvor schon genannte "Custom Entity Extraction" gefüllt werden. Zur Custom Entity Extraction können verschiedene Wörterbücher für exakte oder teilweise Übereinstimmung angelegt werden, jedoch nie mehr als fünf pro Typ. Von Haus aus bringt SharePoint die Möglichkeit mit, den vollen Text von Microsoft Office Dokumente und Adobe PDF- Dateien zu durchsuchen. Für weitere Formate müssen sogenannte iFilter für das entsprechende Format installiert werden.
Refinement Panel

Durch den "Refinement Panel" der Suchergebnisseite ist es möglich, das Suchergebnis zu filtern. Hat man durch diese "Faceted Search" die Ergebnismenge eingeschränkt, zeigt der "Hover Panel" eine Vorschau des Ergebnisse für Dokumente und Webseiten mitsamt weiteren Eigenschaften an. Diese Vorschau kann auch den Ansprüchen des Unternehmens entsprechend angepasst werden. Das sogenannte "Suchcenter" hinterlässt einen benutzerfreundlichen Eindruck, hier finden die Anwender gerne- neben Dokumenten und Webseiten auch Newsfeeds, Kollegen, Reports und sogar Videos.

Hover Panel

Neben dem "Suchcenter" bietet SharePoint 2013 mit dem "Content Search Webpart" ein Werkzeug zum Aufbau einer suchbasierten Veröffentlichungsinfrastruktur. Die Suchergebnisse werden damit nicht nur auf den dafür vorgesehen Suchergebnisseiten verwenden, sondern in einzelnen Bausteinen auf dem gesamten Portal. Interessante Dokumente zur Helpdeskseite? Alle Aufgaben eines Benutzers? Kontakte aus dem CRM auf einer Kundenseite? Alles kein Problem mehr- dem Content Searcg Webpart sei Dank! Die Anzeige der Suchergebnisse innerhalb des Webparts kann individuell angepasst werden. Die hierfür verwendeten "Display Templates" sind HTML- und Javascript- Vorlagen und lassen somit keine Wünsche offen. Wie mächtig Display Templates in Verbindung mit der Suche sind wird klar, wenn man sich SharePoint 2013 mal genauer anschaut. Hinter vielen Bausteinen versteckt sich die Suche, zum Beispiel hinter der Aufgabenliste eines Benutzerprofils. Das ist möglich, da SharePoint jetzt die Suchergebnisse auch einfach personalisieren kann.
In der Kategorie "Search-Driven Content" werden von SharePoint noch viele weitere Bausteine zum Anzeigen von Suchergebnissen angeboten. "Empfohlene Elemente" oder "populäre Elemente" sind nur einige dieser fertigen Bausteine. Dabei liegt auch das Benutzerverhalten in der Suche zu Grunde, die von SharePoint gespeichert und in Form von Analyse- Berichten verwendet wird - oder eben um populäre Inhalte zu erkennen.

Search-Driven Content

Fazit

Enterprise Search ist ein weit entwickeltes Themengebiet, durch das sich auch Heute noch Effizienzsteigerungen in vielen Unternehmen erzielen lassen. Microsoft hat schon in der Version SharePoint 2010 mit dem Zukauf des Enterprise Search- Spezialisten FAST ESP reagiert. Die Integration ist mit SharePoint 2013 vollendet und bietet ein durchaus wettbewerbsfähiges Ergebnis. Insbesondere die Anzeige der Suchergebnisse und die Möglichkeit, auf der Suche basierende Veröffentlichung und Anwendungen zu erstellen haben sich noch einmal erheblich verbessert. Das "Suchcenter" ist modern und benutzerfreundlich, die Integration von verschiedenen Unternehmensanwendungen in einen Index ist auch zu realisieren.
Natürlich funktioniert die Enterprise Search mit SharePoint da am besten, wo die Plattform breit eingesetzt wird. Wer seine Inhalte mit einer Taxonomie in SharePoint versehen kann und auch ein "Social Enterprise" mit SharePoint- Mitteln lebt erzielt die deutlich besten Ergebnisse, denn wirklich Interessant wird der Index in SharePoint, wenn er auch erfassen kann, was die Anwender über einzelne Inhalte reden. Letztendlich verfolgt Microsoft auch mit der Suche die Strategie einer "Entwicklungsplattform" und bietet für jedes Szenario die passende Technologie an. Wer jedoch jedoch Enterprise Search mit Integration von Unternehmensanwendungen machen möchte, muss diese Anwendungen individuell anbinden - oder auf Erweiterungen eines Drittanbieters setzen.
Insgesamt lohnt sich die Betrachtung von SharePoint als Plattform zur Enterprise Search durchaus. Insbesondere, wenn die Plattform fest in der IT- Strategie verankert ist und sowohl den Index als auch die Anzeige beinhaltet, kann Sie ihr volles Potenzial entfaltet werden.

Literaturhinweise

[1] Marktstudie "Enterprise Search 2013", http://www.swm.iao.fraunhofer.de/de/Publikationen/es2013.html
[2] Association for Information and Image Management, http://www.aiim.org/what-is-enterprise-search
[3] Anforderungen an Enterprise Search, http://www.unternehmensweite-suche.de/anforderungen-enterprise-search.php