Konzeption und Evaluation der Aggregationsmethode mit analytischem Hierarchieprozess für Meta-Suchmaschine in Unternehmen
- Art: Diplomarbeit
- Autor: Mau Tri Nguyen
- Abgabedatum: August 2009
- Umfang: 97 Seiten
- Dateigröße: 915,0 KB
- Note: 1,7
- Institution / Hochschule: Universität Potsdam Deutschland
- Bibliografie: ca. 84
- ISBN (eBook): 978-3-8366-4023-7
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Nguyen, Mau Tri August 2009: Konzeption und Evaluation der Aggregationsmethode mit analytischem Hierarchieprozess für Meta-Suchmaschine in Unternehmen, Hamburg: Diplomica Verlag
- Schlagworte: Wissensmanagement, Meta-Suchmaschine, AHP, Information retrieval, Entscheidungsmethode
38,00 €
PDF-eBook Download: 38,00 €
Diplomarbeit von Mau Tri Nguyen
Einleitung:
Wissen erlangt zunehmende Bedeutung als Wettbewerbfaktor. Durch die stetige Steigerung der Menge der in digitaler Form zur Verfügung stehenden Information stellt die Nutzung des vorhandenen Wissens eine große Herausforderung dar. Mitarbeiter wissen oft nicht, ob die relevante Information zu einem Thema in Unternehmen vorhanden ist oder wo die Information zu finden ist. Durch diesen Umstand ist es schwierig, Wissen effizient und effektiv zu nutzen, was dazu führt, dass die Erfahrungen und Kompetenzen eines Unternehmens nicht konsequent ausgenutzt oder weiterentwickelt werden können. Das Auffinden vollständiger Information zu einem Problem, wie es Mitarbeiter beispielsweise zur Aufgabenerledigung benötigen, umfasst die zeitaufwendige Suche mit mehreren Suchdiensten in unterschiedlichen Systemen. Durch Suchmaschinen können die Inhalte mehrerer Quellsysteme erschlossen werden. Die Anzahl der auf eine Suchanfrage gelieferten Treffer ist jedoch häufig zu hoch oder die Qualität der Ergebnisse für die Suchintention unpassend. Effektives Ranking der Suchergebnisse aus heterogenen Informationsquellen wurde deshalb als offenes Problem im Bereich des Enterprise Search identifiziert.
Am Lehrstuhl für Wirtschaftsinformatik und E-Government der Universität Potsdam wurde eine Meta-Suchmaschine im Rahmen des Forschungsprojekts selbstlernende Suchmaschine (kurz SLS) entwickelt. Durch eine kombinierte automatische und interaktive Bewertung der Suchergebnisse und durch den suchenden Mitarbeiter wird die Qualität der Ergebnisse ermittelt. Diese Daten werden in Beziehung zur organisatorischen Einbindung des Suchenden (Projekt, Hierarchie, Rolle) gesetzt. Die so entstehenden Verknüpfungen werden zur Verbesserung der Suchergebnisse verwendet. Durch die Anwendung von Techniken des fallbasierten Schließens (Engl.: Case-Based Reasoning) soll es möglich sein, die so gewonnenen Informationen auf andere suchende Mitarbeiter zu übertragen. So wurden die Personalisierung sowie die Sozialisierung der Suche in der selbstlernenden Suchmaschine bereits berücksichtigt.
Um Ranking der Suchergebnisse aus heterogenen Informationsquellen zu verbessern, kann man den Rankingprozess als einen Entscheidungsprozess aus Sicht des Nutzers betrachten. Dabei soll der Entscheidungsträger (der Suchende) die Alternativen (die Suchergebnisse) hinsichtlich seines Problems (Suchintention) auswählen. So können Entscheidungsmodelle dafür eingesetzt werden. Der multikriterielle Entscheidungsansatz, der analytischer Hierarchieprozess (Engl.: analytic hierarchy process, kurz AHP), wurde bereits für diesen Zweck verwendet. Das wichtigste Argument für die Anwendung der multikriteriellen Entscheidungsmethode besteht darin, dass je mehr die Suchmaschine über die Suchintention des Nutzers weist, desto besser kann sie ihn bei der Informationssuche unterstützen und ihm bessere Ergebnisse zurückliefern. Der Entwurf für einen derartigen Ansatz für die SLS wird im Rahmen der Diplomarbeit analysiert und prototypisch umgesetzt. Im Gegensatz zu den bisherigen Ansätzen liegt der Fokus hier im Bereich Enterprise Search anstelle Web Search.
Zielsetzung und Aufbau der Arbeit:
Die vorliegende Arbeit soll einen Beitrag zur Verbesserung der Informationssuche in Unternehmen leisten, indem eine neuartige Aggregationsmethode mittels des analytischen Hierarchieprozesses für die selbstlernende Suchmaschine entwickelt wird. Dabei sollen die Personalisierung und die Sozialisierung der Suche besonders berücksichtigt bzw. verbessert werden.
Zur Erreichung der oben genannten Ziele wird die Diplomarbeit folgendermaßen aufgebaut. Das erste Kapitel befasst sich mit den theoretischen Grundlagen. Dabei werden unter anderem Grundlagen des Information Retrievals, der Meta-Suchmaschine ausführlich behandelt. Im zweiten Kapitel wird die selbstlernende Suchmaschine vorgestellt. Dabei werden nicht nur Hintergrund, Konzept dieser Suchmaschine vorgestellt, sondern wichtige technische Aspekte werden ebenfalls ausführlich erläutert. Der wichtigste Teil der Diplomarbeit befindet sich im vierten Kapitel. Hier wird die Konzeption einer neuen Aggregationsmethode mittels des analytischen Hierarchieprozess ausführlich erörtert. Zunächst werden Methoden der Entscheidungstheorie auf ihre Eignung für den Einsatz im Kontext der Suchmaschine geprüft. Die Grundlage des analytischen Hierarchieprozesses wird nicht im theoretischen Kapitel sondern hier erläutert. Das Ergebnis dieses Kapitels stellt eine Softwarekomponente für AHP dar. Auf deren Basis wird eine Aggregationsmethode entwickelt und in die Suchmaschine eingebettet. Um die Aussagen über die Qualität der neu entwickelten Aggregationsmethode ableiten zu können, wird im fünften Kapital der Diplomarbeit eine Evaluation dieser Methode durchgeführt. Dabei wird ein Anwendungsszenario der Suchmaschine vorgestellt. Das letzte Kapitel wird die Arbeit mit einer Aussicht auf offene Forschungsfragen abschließen.
Inhaltsverzeichnis:
| Abkürzungsverzeichnis | III | |
| Abbildungsverzeichnis | IV | |
| Tabellenverzeichnis | V | |
| 1. | Einleitung | 1 |
| 1.1 | Motivation und Thema | 1 |
| 1.2 | Zielsetzung und Aufbau der Arbeit | 2 |
| 2. | Theoretische Grundlagen | 3 |
| 2.1 | Grundlage des Information Retrievals | 3 |
| 2.1.1 | Daten, Information und Wissen | 3 |
| 2.1.2 | Definition des Information Retrievals | 4 |
| 2.1.3 | Modelle des Information Retrievals | 6 |
| 2.1.3.1 | Boolesches Modell | 6 |
| 2.1.3.2 | Vektorraummodell | 7 |
| 2.1.3.3 | Probabilistisches Modell | 8 |
| 2.1.4 | Grundlegende Techniken in Information Retrieval | 8 |
| 2.1.4.1 | Invertierter Index | 8 |
| 2.1.4.2 | Termgewichtung | 9 |
| 2.1.4.3 | Modifikation der Anfrage | 10 |
| 2.1.5 | Evaluation von Information Retrieval Systemen | 11 |
| 2.2 | Meta-Suchmaschine | 12 |
| 2.2.1 | Definition und Abgrenzung der Meta-Suchmaschine | 12 |
| 2.2.2 | Typologien der Meta-Suchmaschinen | 14 |
| 2.2.3 | Komponenten der Meta-Suchmaschine | 14 |
| 2.2.4 | Aggregrationsmethode der Ergebnisliste | 16 |
| 2.2.4.1 | Scorebasierte Methode | 17 |
| 2.2.4.2 | Rangbasierte Methode | 18 |
| 2.3 | Fazit | 18 |
| 3. | Selbstlernende Suchmaschine | 20 |
| 3.1 | Hintergrund der selbstlernenden Suchmaschine | 20 |
| 3.2 | Architektur und Implementierung des Prototyps | 21 |
| 3.3 | Technische Aspekte der selbstlernenden Suchmaschine | 29 |
| 3.4 | Aggregrationsmethode der selbstlernenden Suchmaschine | 31 |
| 3.4.1 | Fallbasiertes Schließen | 31 |
| 3.4.2 | Ranking mit fallbasiertem Schließen | 35 |
| 3.5 | Fazit | 38 |
| 4. | Konzeption der Aggregationsmethode mit analytischem Hierarchieprozess | 39 |
| 4.1 | Eignung des analytischem Hierarchieprozesses für Aggregation der heterogenen Suchergebnisse | 39 |
| 4.1.1 | Informationsbeschaffung als ein Entscheidungsproblem | 39 |
| 4.1.2 | Ranking als ein Entscheidungsproblem | 40 |
| 4.2 | Grundlagen und Vorgehensweise des analytischen Hierarchieprozesses | 42 |
| 4.2.1 | Grundlagen des analytischen Hierarchieprozesses | 42 |
| 4.2.2 | Vorgehensweise des analytischen Hierarchieprozesses | 43 |
| 4.3 | Konzeption der Aggregationsmethode mit analytischen Hierarchieprozess | 53 |
| 4.3.1 | Festlegung der Kriterien und Aufbau der Entscheidungshierarchie | 53 |
| 4.3.2 | Errechnung der Gewichte für Suchergebnisse | 57 |
| 4.4 | Technische Umsetzung | 64 |
| 4.4.1 | Umsetzungsziele und Rahmenbedingungen | 65 |
| 4.4.2 | Realisierung und Einbettung der Aggregationsmethode in SLS | 66 |
| 5. | Fallstudien: Ein Anwendungsszenario der selbstlernenden Suchmaschine | 70 |
| 5.1 | Zielsetzung der Fallstudie | 70 |
| 5.2 | Design der Fallstudie | 71 |
| 5.2.1 | Ausgangsituation und Vorbereitungen der Fallstudie | 71 |
| 5.2.2 | Vorgehensweise | 73 |
| 5.2.3 | Datenerfassung | 76 |
| 5.3 | Analyse und Bewertung der Ergebnisse | 77 |
| 6. | Zusammenfassung und Ausblick | 81 |
| Literaturverzeichnis | VI | |
| Anhänge | XII |
Textprobe:
Kapitel 4.3, Konzeption der Aggregationsmethode mit analytischem Hierarchieprozess:
Festlegung der Kriterien und Aufbau der Entscheidungshierarchie:
Bevor Kriterien für das Entscheidungsproblem ermittelt werden sollen, müssen zunächst maßgebliche Anforderungen an die Aggregationsmethode mit analytischem Hierarchieprozess definiert werden. Im Einzelnen sind dies:
- Verbesserung der Personalisierung und der Sozialisierung der Suche.
- Berücksichtigung der Rolle der Suchenden im Unternehmen.
- Berücksichtigung der Aufgabe, die der Suchende zur erledigen hat.
- Sowie Erweiterung der Aggregationsmethode mit CBR.
Es ist deutlich, dass es keine allgemeingültige Hierarchie für alle Entscheidungsprobleme gibt. Vielmehr hängt sie von der Entscheidungssituation und von der subjektiven Einstellung des Entscheidungsträgers ab. Dennoch kann der Aufbau einer Entscheidungshierarchie in folgenden Schritten erfolgen.
- Definition des Oberziels.
- Ableitung der Kriterien und Subkriterien aus dem definierten Oberziel.
- Festlegung der Alternativen für die Zielerreichung.
Mit der Inanspruchnahme der Suchmaschine beabsichtigt der Entscheidungsträger, zusätzliche Information für die Lösung seines Problems zu beschaffen. In diesem Fall lautet das Oberziel eindeutig das Auffinden der relevanten Dokumente. Im Vergleich zu anderem Entscheidungsproblem wie Entscheidung über den Kauf eines Autos stellt die Ableitung der (Sub-) Kriterien in diesem besonderen Entscheidungsmodell eine schwierige Aufgabe dar. Dennoch lassen sich aus den zuvor definierten Anforderungen Kriterien für diese Entscheidung ermitteln. Im Folgenden werden deshalb die Ansätze der Personalisierung der Suche sowie der sozialen Suche kurz erörtert, welche der Ermittlung der Kriterien dienen sollen.
Personalisierung der Suche /Personalisierte Suche:
Ziel der zu entwickelnden Aggregationsmethode ist, Suchergebnisse aus unterschiedlichen und heterogenen Informationsquellen durch Anpassung an die Suchpräferenzen der Suchenden zusammenzuführen. Von einer Personalisierung der unternehmensweiten Suche kann hier gesprochen werden. Hierzu können personenbezogenen Merkmale verwendet werden. Zur Ermittlung der Entscheidungskriterien für diesen analytischen Hierarchieprozess wäre es deshalb sinnvoll, zuerst mit der Analyse der Personalisierung der Suche zu beginnen. Bei Coskun wird die Personalisierung der Suche folgendermaßen definiert.
‘Personalized search techniques use information stored in user profiles, additionally to the user's current search or query, to estimate the user's wishes and select the set of relevant information’.
Wichtige Aufgabe der Personalisierung ist es, dem Nutzer die relevante Information in einer für ihn aufbereiteten Form zu liefern. Daten über den Nutzer und seine Präferenzen bilden dabei die Grundlagen der Personalisierung. Im Unternehmensumfeld kann sich die Personalisierung entweder auf externe Anspruchgruppen (Kunden, Geschäftspartner, Investoren, Lieferanten etc.) oder aber auf interne Anspruchgruppen orientieren. Die Zielgruppe der selbstlernenden Suchmaschine ist in erster Linien die interne Anspruchgruppen. Innerhalb des Unternehmens ist das Nutzerprofil davon abhängig:
- Zur welchen Abteilung (z.B. F&E, Finanz, Marketing etc.) der Nutzer gehört.
- Welche Rolle in der Abteilung (Manager, Experte, etc.) der Nutzer innehat.
- Über welche Erfahrung, Wissen der Nutzer verfügt.
- Welche Aufgabe der Nutzer zu erledigen hat (Engl. context of current task).
Im Grunde kann Nutzerprofil in drei Ebenen eingeteilt werden. In der ersten Ebene werden die persönliche Daten (Name, Geschlecht, Ausbildung, etc.) sowie die ziemlich konstante Merkmale wie Abteilung, Rolle etc. gespeichert. Der mittleren Ebene umfasst die dynamische Merkmale des Nutzers im Unternehmen, die sich jedoch nicht sehr häufig ändern. Dazu gehört z.B. die Information über beteiligte Projekte, Skill, Soziales Netzwerk etc. Auf der obersten Ebene eines Nutzerprofils werden die vorläufigen bzw. kurzlebigen Nutzerdaten präsentiert. Diese Daten werden vom System generiert, in dem er die Aktivitäten des Nutzers registriert und analysiert. Die Aktivitäten des Nutzers in diesem Kontext sind dennoch nicht mit den Suchaktivitäten zu verwechseln. Es wird unterschieden zwischen vier typischen Arten der Nutzeraktivitäten.
- Workspace level: Ereignisse wie (Mausklick, Texteingaben, etc.) werden überwacht.
- User action level: repräsentiert Aktionen des Benutzer wie Erstellen neuen Dokuments.
- Task concept level: erfasst die Absicht des Benutzers.
- Process level: verbindet mit dem Geschäftsprozess im Unternehmen.
Bedeutend für die Ermittlung der Kriterien sind in erster Linie das Aufgabekonzept sowie die Aktivitäten des Nutzers im Rahmen des Geschäftsprozesses in Unternehmen. Die Ermittlung des Aufgabekonzepts ist allerdings nicht einfach. Es gibt verschiedene Gründe dafür. Vor allem existiert kein theoretisches Fundament dafür, dass ein bestimmtes Aufgabekonzept aus einer Reihe der sequentiellen Aktivitäten der Benutzer zu identifizieren ist. Trotz dieser Schwierigkeiten wird das aufgabenbezogene Kriterium für die Entscheidung gewählt. Und im folgenden Abschnitte soll darüber geklärt werden, wie eine Aufgabe ermittelt und beschrieben wird und wie diese in den Aggregationsprozess einbezogen werden kann.
Sozialisierung der Suche /kollaborative Suche:
Der Ansatz der sozialen Suche verfolgt das Ziel, die Qualität der Suchergebnisse für einen Nutzer durch Erfahrungen anderer Nutzer, also durch ihre zuvor abgegebenen Bewertungen anzupassen bzw. zu verbessern. Während bei der personalisierten Suche Daten über einen Nutzer eine wichtige Rolle spielen, ist die Qualität der Suchergebnisse bei der sozialen Suche vor allem von Aktivitäten und Interesse anderer Nutzer abhängig. Technisch gesehen wird bei der sozialen Suche häufig das kooperative Filtern (Engl. collaborative filtering) verwendet. Dabei besteht das Problem der Identifikation der Gruppe von Nutzern, insbesondere wenn es um Web Search geht. Zur Einordnung eines Nutzers in eine Gruppe können unterschiedliche Kriterien wie Interesse, Beruf, geographische Daten, gemeinsame Aufgabe etc. verwendet werden. Da der Fokus dieser Diplomarbeit auf die unternehmensweite Suche gelegt wurde, werden Gruppen von Nutzer in der Regel bereits vorgegeben und diese Information kann hierzu ohne weiteren Aufwand sofort benutzt werden.
Kriterien des Entscheidungsmodells:
Bereits auf ersten Blick auf die Eigenschaft der selbstlernenden Suchmaschine ist festzustellen, dass die Suchanfrage eine wichtige Rolle bei dem betrachteten Entscheidungsproblem spielt. Die Suchanfrage gibt der Suchmaschine wichtigen Hinweis auf die Suchintention des Nutzers. Deswegen kann das erste Kriterium aus der gestellten Anfrage ermittelt werden. Dieses anfragenbezogene Kriterium kann weiterhin in andere Subkriterien weiter geteilt werden. Herangezogen werden z.B. die Nutzereinstellungen über Synonyme, Assoziierte Terme etc.
Aus der Analyse der Ansätze zur personalisierten und sozialen Suche kommen Suchkontext und Profil des Nutzers ebenfalls in Betracht. Damit können auf der ersten Hierarchieebene zwei weitere Kriterien bestimmt werden. Zum einen ist es das kontextbezogene Kriterium. Mit dem ausgewählten Suchkontext werden die Nutzerpräferenzen hinsichtlich der Informationsquellen automatisch angegeben, weil beim Anlegen eines Kontexts ein Initialgewicht für jede unterliegende Informationsquellen vordefiniert wird, dieser wird im Laufen der Zeit in Abhängigkeit der Bewertungen anderer Nutzer verändert. Zum anderen stellt Rolle oder Profil des Nutzers das dritte Kriterium der Hierarchieebene dar.
38,00 €
PDF-eBook Download: 38,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783836640237
Arbeit zitieren:
Nguyen, Mau Tri August 2009: Konzeption und Evaluation der Aggregationsmethode mit analytischem Hierarchieprozess für Meta-Suchmaschine in Unternehmen, Hamburg: Diplomica Verlag
Schlagworte:
Wissensmanagement, Meta-Suchmaschine, AHP, Information retrieval, Entscheidungsmethode




