Barrierefreie und thesaurusbasierte Suchfunktion für das Webportal der Stadt Nürnberg
- Art: Diplomarbeit
- Autor: Stefan Wagner
- Abgabedatum: Mai 2007
- Umfang: 193 Seiten
- Dateigröße: 3,5 MB
- Note: 1,1
- Institution / Hochschule: Georg-Simon-Ohm-Fachhochschule Nürnberg Deutschland
- Bibliografie: ca. 41
- ISBN (eBook): 978-3-8366-0761-2
- ISBN (CD) :978-3-8366-0761-2 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Wagner, Stefan Mai 2007: Barrierefreie und thesaurusbasierte Suchfunktion für das Webportal der Stadt Nürnberg, Hamburg: Diplomica Verlag
- Schlagworte: Nürnberg, Portal (Internet), Information Retrieval, Barrierefreiheit, Suchmaschine
In den Warenkorb
48,00 €
Diplomarbeit von Stefan Wagner
Einleitung:
Im Internetportal der Stadt Nürnberg wurde in einer vorausgehenden Diplomarbeit eine Suchmaschine auf Basis des Produktes e:IAS der Fa. empolis GmbH realisiert. Diese Lösung soll in verschiedenen Bereichen verbessert und erweitert werden.
Es sollen aussagekräftige Logfiles generiert und ausgewertet werden, insbesondere sollen die Auswertungen mit denen der vorhergehenden Suchlösung vergleichbar sein.
Bei der Ergebnispräsentation sollen die Erfordernisse der Barrierefreiheit beachtet werden und die vorhandenen Templates entsprechende Anpassung erfahren.
Die Lösung soll um Ansätze semantischer Suche erweitert werden. Es ist angedacht die vorhandene Synonymverwendung auszubauen und um Taxonomien zu einem Theasurus zu erweitern. Dabei sollen verschiedene Möglichkeiten untersucht werden und eine Möglichkeit, mindestens prototypisch, integriert werden.
Inhaltsverzeichnis:
| Kurzfassung | 2 | |
| Inhaltsverzeichnis | 3 | |
| Abbildungsverzeichnis | 6 | |
| Tabellenverzeichnis | 8 | |
| Formelverzeichnis | 8 | |
| 1. | Motivation | 9 |
| 2. | Grundlagen | 10 |
| 2.1 | Textbasierte Suche | 10 |
| 2.2 | Taxonomien und Thesauri | 13 |
| 2.2.1 | Was sind Taxonomien und Thesauri | 13 |
| 2.2.2 | Semantische Suche mittels Thesauri | 17 |
| 2.2.3 | Taxonomiebasierte Ähnlichkeitsmaße | 18 |
| 2.2.3.1 | Pfadlänge | 18 |
| 2.2.3.2 | Normalisierte Pfadlänge | 19 |
| 2.2.3.3 | Dichte des Zweigs | 19 |
| 2.2.3.4 | Extended gloss overlaps measure | 20 |
| 2.2.3.5 | Maß basierend auf Informationsgehaltswert des Konzepts | 20 |
| 2.2.3.6 | Maß basierend auf knoten- und kantenbasierten Techniken | 21 |
| 2.2.3.7 | Maß abgeleitet aus der Informationstheorie | 22 |
| 2.2.3.8 | Vergleich | 22 |
| 2.2.4 | RDF-basierte Thesaurusrepräsentation: SKOS | 23 |
| 2.3 | Barrierefreiheit von Webanwendungen | 30 |
| 2.3.1 | Allgemeine Regelungen | 31 |
| 2.3.2 | Rechtliche Regelungen | 33 |
| 3. | Suchlösung der Stadt Nürnberg - der Ist-Stand | 34 |
| 3.1 | Abacho | 35 |
| 3.2 | E:IAS | 36 |
| 3.2.1 | Systemaufbau | 36 |
| 3.2.1.1 | Indexierung | 37 |
| 3.2.1.2 | Ergebnissauslieferung | 37 |
| 3.2.2 | Konfiguration | 38 |
| 3.2.3 | Such- und Indexierungsablauf | 38 |
| 3.2.4 | Verbesserungspotentiale | 44 |
| 4. | Thesaurusbasierte Suche | 46 |
| 4.1 | Ist-Stand | 46 |
| 4.2 | Realisierte Systemerweiterungen | 46 |
| 4.2.1 | Ähnlichkeitsmaße in e:IAS | 46 |
| 4.2.1.1 | Taxonomieähnlichkeitsmaß: Taxonomie | 46 |
| 4.2.1.2 | Taxonomieähnlichkeitsmaß TaxonomiePfad | 51 |
| 4.2.2 | Mögliche Thesauri und Datenquellen | 52 |
| 4.2.2.1 | WikiSaurus in Wiktionary | 53 |
| 4.2.2.2 | OmegaWiki | 53 |
| 4.2.2.3 | OpenThesaurus | 54 |
| 4.2.2.4 | Getty Thesaurus of Geographic Names | 54 |
| 4.2.2.5 | Projekt Deutscher Wortschatz | 54 |
| 4.2.2.6 | HUGO | 55 |
| 4.2.2.7 | GEMET Thesaurus | 56 |
| 4.2.2.8 | Eurovoc Thesaurus | 57 |
| 4.2.3 | Beispielhafte Einbindung von Thesauri | 57 |
| 4.2.3.1 | Ein XML-Thesaurus - Eurovoc | 59 |
| 4.2.3.2 | Ein SKOS-Thesaurus - GEMET | 60 |
| 4.2.4 | Gewichtung von Attributen und Synonymen | 62 |
| 4.2.4.1 | Gewichtswerte der Taxonomieähnlichkeit | 62 |
| 4.2.4.2 | Änderung der Gewichtsfaktoren | 63 |
| 4.2.4.3 | Berechnung der globalen Ähnlichkeit | 64 |
| 4.3 | Analyse der Suchergebnisse | 67 |
| 5. | Barrierefreie Präsentation der Suchergebnisse | 69 |
| 5.1 | Ist-Stand | 69 |
| 5.2 | Realisierte Systemerweiterung | 70 |
| 5.2.1 | Zugriff auf die Ergebnisdaten | 70 |
| 5.2.2 | Aufbau der GUI | 71 |
| 5.2.2.1 | Verfügbare e:Script Tags | 71 |
| 5.2.2.2 | Gliederung der Seite | 71 |
| 5.2.2.3 | Umsetzung der Navigation | 73 |
| 5.2.3 | Verwandte Links | 78 |
| 6. | Logdateiauswertung | 83 |
| 6.1 | Ist-Stand | 83 |
| 6.1.1 | Analyse des Benutzerverhaltens | 83 |
| 6.1.2 | Anforderungen an die Logdateiauswertung | 87 |
| 6.2 | Realisierte Systemerweiterung | 87 |
| 6.2.1 | Erzeugung der Logdateien in e:IAS | 87 |
| 6.2.2 | Datenschutz | 91 |
| 6.2.3 | Umwandlung der Logdatei mit Shell-Skripten | 91 |
| 6.2.4 | Prototyp einer Logdateianalyse in Perl | 92 |
| 6.2.4.1 | Sicherheit der Anwendung | 93 |
| 6.2.4.2 | Datenbankstruktur | 93 |
| 6.2.4.3 | Einlesen der Logdateien | 95 |
| 6.2.4.4 | Auswertung der Logdaten | 95 |
| 6.2.5 | Stresstest | 100 |
| 7. | Ausblick | 101 |
| Literaturverzeichnis | 103 | |
| Anhang | 107 |
Textprobe:
Kapitel 2.3, Barrierefreiheit von Webanwendungen:
Barrierefreies Webdesign ist die Kunst Webanwendungen so zu gestalten, dass jeder sie nutzen und lesen kann - insbesondere auch Menschen mit Behinderungen.
Für Sehbehinderte erweisen sich vor allem Nicht-Text-Elemente, wie grafisch dargestellter Text, Bilder, animierte GIFs, grafische Menüs oder Buttons als problematisch, da sie über Programme, die die Webseite vorlesen (Screenreader) oder Braille-Displays, die den Text in Blindenschrift darstellen, nicht angezeigt werden können. Jemand, der nur farbenblind ist (also etwa jeder zehnte Mann), hat Probleme mit Anweisungen wie „Klicken Sie auf den grünen Button“. Und wenn nur Schwarz-Weiß-Displays vorhanden sind, lässt sich eine Webseite die einen hohen Kontrast besitzt, besser darstellen. Mit einer motorischen Behinderung ist es schwierig konventionelle Eingabegeräte wie Tastatur oder Maus zu benutzen, stattdessen werden spezielle Eingabegeräte zum Navigieren auf der Webseite eingesetzt. Damit diese funktionieren, muss die Seite ohne Maus bedienbar sein. Für Hörgeschädigte ist hingegen jede Art von Ton oder Sprache ein Hindernis, auch hier ist die Umsetzung der Medien in Texte notwendig. Bei Menschen mit einer geistigen Behinderung ist die Möglichkeit zum Navigieren in Webseiten stark von der Art und Schwere ihrer Behinderung abhängig, wahrscheinlich wird es also nicht immer möglich sein eine Seite so zu gestalten, dass sie für wirklich jeden Menschen zugänglich ist. Dennoch gibt es auch hier ein paar Grundregeln, die man beachten sollte. Navigation und Layout sollten möglichst klar und einfach gehalten sein, Texte sollten prägnant und in einer leicht verständlichen Sprache verfasst werden und Skizzen und Illustrationen die Sachverhalte erläutern und zum Verständnis beitragen, sollten eingesetzt werden.
Wenn man die eben angesprochenen Punkte bei der Gestaltung von Webseiten beachtet, dann ist dies auch für Menschen hilfreich, deren Muttersprache nicht mit der Sprache der Webseite übereinstimmt.
Darüber hinaus ist die Barrierefreiheit, die manchmal auch mit Zugänglichkeit oder Accessibility bezeichnet wird, wichtig für alternative Anzeigegeräte, wie zum Beispiel PDAs oder Handys, die eine besonders kleine Anzeige besitzen.
Allgemeine Regelungen Es gibt von verschiedene Organisationen Normen und Handreichungen um ein Webangebot barrierefrei zu erstellen, bzw. zu prüfen, ob es barrierefrei ist. Eine grundsätzliche Voraussetzung ist der valide Einsatz von HTML und CSS. Diese Validität ist dann gegeben, wenn Seiten unabhängig von einem bestimmten Anzeigegerät sind. Die Spezialisierung auf bekannte Browser und ihre Eigenarten, wie z. B. Internet Explorer, bei der Darstellung von Seiten stellt schon einen Verstoß gegen dieses Prinzip dar, so dass Nutzer von alternativen Programmen, wie z. B. Mozilla Firefox, die Seiten nicht fehlerlos dargestellt bekommen. Die Inhalt sollten unabhängig von dem Layout ausgezeichnet sein, so das im HTML-Dokument nur die logische Formatierung des Inhalts vorgenommen wird und das Layout komplett über CSS gesteuert wird.
Das prominenteste Dokument, das Richtlinien für barrierefreie Webseiten enthält, stellen die „Web Content Accessibility Guidelines „ (WCAG 1.0) dar, die in den späten 90er Jahren des letzen Jahrhunderts entstanden sind und 1999 vom W3C als Recommendation (Empfehlung) verabschiedet wurden.
Jedem Prüfpunkt der WCAG ist eine Priorität zwischen 1 und 3 zugeordnet. Dabei bedeutet 1, dass ein Dokument diesen Punkt erfüllen muss, da sonst eine bestimmte Nutzergruppe nicht auf die Informationen zugreifen kann. 2 bedeutet, dass ein Dokument diesen Punkt erfüllen soll, da es sonst für bestimmte Nutzer schwierig sein kann auf die Information zuzugreifen, 3 bedeutet, dass ein Dokument diesen Punkt erfüllen kann, andernfalls wird es für bestimmte Nutzergruppe „etwas schwierig“ auf die Informationen zuzugreifen. Ein Dokument kann nach der Prüfung eine Konformitätsstufe von „A“, über „Double-A“, bis zu „Tripple-A“ erhalten, je nachdem ob es alle Prüfpunkte der Priorität 1, 2 oder 3 erfüllt. Sie enthält 14 Richtlinien mit insgesamt 59 Checkpunkten.
Durch den rasanten Fortschritt der Webtechnologie bedingt, galt die Richtlinie aber bald als veraltet. Zur Zeit wird an einer Aktualisierung der Richtlinie gearbeitet (WCAG 2.0) die seit 2006 den Status eines „Working Draft“ (Arbeitsentwurf) besitzt. Allerdings ist der Entwurf und die ganze Arbeitsgruppe sehr umstritten, manche Autoren reden davon, dass er in „den W3C-Zänkereien zu versinken droht“.
Als einzige andere nennenswerte offizielle Spezifikation gibt es noch den sogenannten Abschnitt 508 (Section 508) des Rehabilitation Act, den die Regierung der Vereinigten Staaten 1988 erweitert hat. Allerdings sind die relevanten Regeln der dazugehörenden Ausführungsverordnung auch an die WCAG angelehnt. Dieses Regelwerke für die Informationsangebote aller Bundesbehörden wurde außerdem auch in deren Beschaffungsvorgaben aufgenommen und muss von allen Firmen erfüllt werden, die an die Regierung der USA Waren oder Dienstleistungen verkaufen. Das Regelwerk umfasst 16 Abschnitte mit insgesamt 34 Prüfpunkten.
Aus diesem Grund sind andere Richtlinien entstanden, die sich mehr an der Praxis orientieren. Im deutschsprachigen Raum sind das vor allem die Kriterien des BIENE-Awards. Dieser Award wird seit 2003 für vorbildlich barrierefreie deutschsprachige Webseiten vergeben.
Bei den Kriterien (siehe Anhang 1) gibt es zunächst Grundvoraussetzungen, dann Prüfpunkte zu Lesbarkeit und inhaltlicher Erschließung, zu variabler Präsentation (dass Bildern und ähnlichem eine textuelle Repräsentation zugeordnet ist), zu Navigation, zum Aufbau des Internetangebots, zu Kompatibilität, zu Formularverarbeitung, zu komplexen Transaktionen, zu Datenschutz, zu Werbung, zu Downloads, zu umfangreichen Datentabellen, zu komplexen Dokumenten, zu Multimedia und Spielen, zu Gebärdensprache-Filmen und zu leichter Sprache. Es sind 87 Kriterien enthalten, die jeweils in eine unterschiedliche Anzahl von Einzelpunkten unterteilt sind, so dass insgesamt 235 Prüfpunkte enthalten sind.
Rechtliche Regelungen:
Im April 2002 trat auf Bundesebene das „Gesetz zur Gleichstellung behinderter Menschen“ (BGG) mit dem Ziel in Kraft, „die Benachteiligung von behinderten Menschen zu beseitigen und zu verhindern sowie die gleichberechtigte Teilhabe von behinderten Menschen am Leben in der Gesellschaft zu gewährleisten und ihnen eine selbstbestimmte Lebensführung zu ermöglichen“. Dazu wurde auch die „Verordnung zur Schaffung barrierefreier Informationstechnik nach dem Behindertengleichstellungsgesetz“ (BITV) erlassen. Die BITV enthält in einer Anlage eine nach zwei Prioritäten gegliederte Liste mit Anforderungen und Bedingungen zur Realisierung der Verordnung, die auf die W3C-Empfehlung WCAG 1.0 zurückgehen. Die Regelungen des BGG und damit auch die der BITV gelten nur für die Dienststellen des Bundes und sollten dort bis zum Jahre 2005 umgesetzt werden.
In Bayern trat im August 2003 das Bayerisches Behindertengleichstellungsgesetz (BayBGG) in Kraft. Darin wird geregelt, dass unter anderem die öffentliche Stellen und die Gemeinden des Freistaates Bayern ihre „Internet- und Intranetauftritte ... schrittweise technisch so (gestalten sollen; Anm. d. Verf.), dass sie von behinderten Menschen grundsätzlich uneingeschränkt genutzt werden können“. Dazu wurde die „Bayerische Barrierefreie Informationstechnik-Verordnung“ (BayBITV) erlassen. In ihr ist festgelegt, dass Webseiten so zu gestalten sind, dass sie die in der BITV unter Priorität I aufgeführten Anforderungen erfüllen und, dass zentrale Navigations- und Einstiegsangebote zusätzlich die unter Priorität II aufgeführten Anforderungen berücksichtigen. Allerdings ist die Umsetzung nur für staatliche Stellen bis 2012 vorgeschrieben, Kommunen wird die Umsetzung lediglich empfohlen. Die Stadt Nürnberg versucht seit 2005 ihre Informationsangebote möglichst barrierefrei zu gestalten.
Da die Empfehlungen der WCAG 1.0 und damit die der BITV veraltet sind, und sie für Kommunen nur eine Empfehlung darstellen, werden in dem späteren Kapitel zur Barrierefreiheit im Wesentlichen die BIENE-Kriterien berücksichtigt.
In den Warenkorb
48,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783836607612
Arbeit zitieren:
Wagner, Stefan Mai 2007: Barrierefreie und thesaurusbasierte Suchfunktion für das Webportal der Stadt Nürnberg, Hamburg: Diplomica Verlag
Schlagworte:
Nürnberg, Portal (Internet), Information Retrieval, Barrierefreiheit, Suchmaschine



