Bachelor + Master Publishing
811 Bachelorarbeiten, 533 Masterarbeiten, 10.103 Diplomarbeiten

Mustererkennung mit Neokognitron und Anwendungen

Mustererkennung mit Neokognitron und Anwendungen
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Raoul Privenau
  • Abgabedatum: Mai 2011
  • Umfang: 160 Seiten
  • Dateigröße: 6,8 MB
  • Note: 1,0
  • Institution / Hochschule: Martin-Luther-Universität Halle-Wittenberg Deutschland
  • Bibliografie: ca. 185
  • ISBN (eBook): 978-3-8428-2036-4
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Privenau, Raoul Mai 2011: Mustererkennung mit Neokognitron und Anwendungen, Hamburg: Diplomica Verlag
  • Schlagworte: Künstliche Neuronale Netze, Neokognitron, Hopfield Netz, Mustererkennung, E-Learning

Diplomarbeit von Raoul Privenau

Einleitung:

Das menschliche Gehirn empfängt eine Fülle unterschiedlicher Reize über verschiedene Sinnesorgane. Ein bedeutendes Gebiet in diesem Zusammenhang ist die visuelle Wahrnehmung, die als ‘... Aufnahme und die zentrale Verarbeitung von visuellen Reizen ...’ definiert ist. Der Mensch ist in der Lage aus einer großen Menge visueller Reize bestimmte Signale innerhalb kürzester Zeit herauszufiltern und richtig zu interpretieren. Probleme ergeben sich allerdings bei der Portierung dieser Fähigkeit der natürlichen Mustererkennung auf Computersysteme durch die erheblichen Unterschiede hinsichtlich der Leistungsfähigkeit und der Architektur. Nach dem derzeitigen technischen Stand können Computer Daten um ein vielfaches schneller verarbeiten, als unser Gehirn, sind aber dennoch mit Aufgaben überfordert, die durch unser Gehirn in kürzester Zeit erfolgreich durchgeführt werden. Charakteristisch für das menschliche Gehirn, als komplexes biologisches Netzwerk, ist seine hochgradige parallele Signalverarbeitung. Dank seiner ca. 1012 Nervenzellen, die über ca. 1015 Verbindungen miteinander verknüpft sind, verarbeitet es Millionen von Reizen innerhalb weniger Millisekunden. Die serielle Datenverarbeitung auf einer Von-Neumann-Architektur ist damit nicht vergleichbar. Es existieren allerdings stark vereinfachte Modelle zur Nachahmung dieses komplexen biologischen natürlichen Nervensystems, die als künstliche neuronale Netze (KNN) bezeichnet werden. Auch im Bereich der Mustererkennung hat sich der Einsatz von KNN bewährt, wobei besonders das Neokognitron eine gute Nachahmung der natürlichen Mustererkennung im visuellen Bereich verspricht.

Der Fokus der vorliegenden Arbeit liegt auf der strukturellen und funktionalen Darstellung des Neokognitrons bei der Mustererkennung. Darüber hinaus werden Anwendungen vorgestellt, für die das Neokognitron implementiert wurde. Neben dem Neokognitron wird auch das Hopfield-Netz (HN) als klassisches KNN zur Mustererkennung erläutert. Entsprechend dieser Ausführungen wurde zusätzlich zur vorliegenden Arbeit ein E-Learning Modul (EM) für binäre HN prototypisch implementiert und wird in dieser Arbeit vorgestellt.

Die vorliegende Arbeit ist wie folgt aufgebaut:

Kapitel 2 gibt eine Einführung in die Mustererkennung, wobei zunächst eine Eingrenzung dieses Themengebietes für die vorliegende Arbeit erfolgt. Anschließend werden die Teilschritte eines allgemeinen Mustererkennungsprozesses erläutert. In diesen Prozess lassen sich verschiedene Mustererkennungsaufgaben integrieren, von denen die wesentlichen Aufgaben vorgestellt werden. Den Abschluss bildet eine Motivation des Einsatzes von KNN zur Mustererkennung.

Kapitel 3 vermittelt die notwendigen Grundlagen von KNN, die zum Verständnis der folgenden Kapitel von Bedeutung sind. Darüber hinaus wird die Eignung von KNN für den Mustererkennungsprozess aus Kapitel 2 begründet.

Kapitel 4 führt in die Theorie eines HN zur Mustererkennung ein und schließt mit einer kritischen Bewertung des Einsatzes zur Mustererkennung.

Kapitel 5 thematisiert anschließend das Neokognitron zur Mustererkennung. Im Vordergrund stehen dabei die Netzstruktur, die sich daraus ergebende Funktionsweise bei der Mustererkennung sowie potentielle Lernverfahren. Abschließend erfolgt eine Bewertung u.a. bzgl. des Einsatzes im Mustererkennungsprozess aus Kapitel 2 und der Leistungsfähigkeit bei der Mustererkennung.

In Kapitel 6 werden verschiedene Erweiterungen des Neokognitrons vorgestellt, die sich auf spezielle Problembereiche beziehen. Aufgrund deren hoher Komplexität werden ausschließlich die wesentlichen Eigenschaften im Überblick dargestellt.

Kapitel 7 fokussiert Anwendungen aus verschiedenen Bereichen, in denen das Neokognitron zur Mustererkennung implementiert wurde. Die entsprechenden Implementierungen sollen die praktische Leistungsfähigkeit und das Anwendungsspektrum des Neokognitrons verdeutlichen.

Kapitel 8 stellt das entwickelte EM für binäre HN vor, das die Möglichkeit zur computergestützten Simulation von binären HN im Lehrbetrieb schafft, wodurch deren Leistungsfähigkeit praktisch evaluiert werden kann. Das Kapitel zeigt dazu ausgewählte Aspekte der Implementierung.

Kapitel 9 beinhaltet schließlich eine zusammenfassende Betrachtung der zentralen Punkte der vorliegenden Arbeit und gibt einen Ausblick zum Neokognitron bzgl. der Mustererkennung.

Inhaltsverzeichnis:

Abbildungsverzeichnis V
Abkürzungsverzeichnis VII
Tabellenverzeichnis IX
1. Einleitung 1
1.1 Motivation 1
1.2 Ziele der Arbeit 2
1.3 Aufbau der Arbeit 2
2. Mustererkennung 5
2.1 Mustererkennungsprozess 6
2.2 Wesentliche Mustererkennungsaufgaben 8
2.3 Methoden der Mustererkennung 10
3. Künstliche Neuronale Netze 13
3.1 Standardneuronenmodell 13
3.2 Grundlegende Netzarchitekturen 15
3.3 Lernverfahren 16
3.4 Einsatz im Bereich der Mustererkennung 17
4. Hopfield-Netz 19
4.1 Netzstruktur 19
4.2 Mustererkennung 20
4.2.1 Rekursive Berechnung 21
4.2.2 Energiefunktion 21
4.3 Musterspeicherung 22
4.4 Musterlöschung 24
4.5 Verschiedene Netzkonfigurationen 24
4.6 Bewertung 26
5. Neokognitron 29
5.1 Grundlegende Netzstruktur 29
5.1.1 Eingabeschicht 30
5.1.2 Stufensystem 30
5.1.3 Verbindungsstruktur 31
5.2 Mustererkennung 32
5.3 S-Zellen 34
5.3.1 Verbindungsstruktur 34
5.3.2 Mathematische Beschreibung 37
5.3.3 Merkmalsextraktion auf Basis der Ähnlichkeit 39
5.3.4 Steuerung der Selektivität 40
5.4 C-Zellen 42
5.4.1 Verbindungsstruktur 42
5.4.2 Mathematische Beschreibung 43
5.4.3 Positionsinvarianz und Unschärfe 44
5.5 Lernverfahren 46
5.5.1 Wahl der Netzgröße 46
5.5.2 Nicht-überwachtes Lernen 47
5.5.3 Überwachtes Lernen 51
5.5.4 Vergleich der Lernverfahren 52
5.6 Bewertung 53
5.6.1 Integration in den Mustererkennungsprozess 53
5.6.2 Geeignete Muster 54
5.6.3 Erkennungsleistung und Störungsinvarianz 54
5.6.4 Fazit 55
6. Erweiterungen des Neokognitrons 57
6.1 Erweitertes Neokognitron 57
6.1.1 Kontrastgewinnung 57
6.1.2 Hemmendes Umfeld von C-Zellen 58
6.1.3 Hybrider Lernprozess 59
6.1.4 Weiterentwicklung 60
6.1.5 Computersimulation 63
6.2 Selektive Aufmerksamkeitssteuerung und Autoassoziation 64
6.2.1 Routenwahl 66
6.2.2 Autoassoziation 66
6.2.3 Verstärkung der Aufmerksamkeit 67
6.2.4 Segmentierung 67
6.2.5 Wechsel der Aufmerksamkeit 67
6.2.6 Antwortkontrolle 68
6.3 Rotationsinvarianz 69
6.3.1 Version 1 – Rotationsinvariantes Neokognitron 69
6.3.2 Version 2 – Hybrides Neokognitron entsprechend der mentalen Rotation 70
6.4 Doppelte C-Zellen-Schicht 72
7. Anwendungen 75
7.1 Zeichenerkennung 76
7.1.1 Erkennung numerischer und alphanumerischer Zeichen 76
7.1.2 Weitere Anwendungen im Bereich der Zeichenerkennung 78
7.2 Erkennung handgeschriebener Musiknoten 79
7.3 Gesichtserkennung 80
7.4 Automatische Zielerkennung 85
7.5 Analyse von Echokardiogrammen 87
7.6 Erkennung von Draht-Modellen 88
7.7 Suche struktureller Einheiten auf Mikrochips 89
7.8 Weitere Anwendungen 90
8. E-Learning Modul für binäre Hopfield-Netze 93
8.1 Wahl der Software-Plattform und Entwicklungsumgebung 94
8.2 Softwarearchitektur und allgemeine Modulverwendung 95
8.3 Kritische Aspekte der Entwicklung 97
8.3.1 Hopfield-Logik 97
8.3.2 Benutzeroberfläche und Ablaufsteuerung 99
9. Resümee und Ausblick 101
A. Hopfield Netz 105
A.1 Gewichtsmatrix 105
A.2 Beispiel für eine Energiefunktion 105
A.3 Beispiel zum Lernen der Schwellen 106
B. Software zur Simulation eines Neokognitrons 107
B.1 Beholder 2.0b 107
B.2 NeoCognitron 1.0.0 Beta 112
C. Muster bei der Erkennung alphanumerischer Zeichen 117
D. CAPTCHA-Beispiele 123
E. E-Learning Modul 125
E.1 Abbildung des zweidimensionalen Eingabebereiches auf ein eindimensionales Feld 125
E.2 Abbildung der zweidimensionalen Gewichtsmatrix auf ein eindimensionales Feld 125
E.3 Einsatz einer Datenbank zur Speicherung der Gewichtsmatrix 127
E.4 Ermittlung der maximalen Mustergröße in Abhängigkeit von der Prozessorarchitektur 128
Literaturverzeichnis 131

Textprobe:

Kapitel 5.5, Lernverfahren:

In diesem Abschnitt steht der Lernprozess des Neokognitrons im Vordergrund, in dessen Rahmen die variablen Verbindungsgewichte aller S-Zellen angepasst werden. Dieser basiert auf einer Reihe ausgewählter Trainingsmuster, durch die das Neokognitron grundlegend vorkonfiguriert wird, wobei u.a. die Wahl der Netzgröße von Bedeutung ist und in 5.5.1 zunächst thematisiert wird.

Das Neokognitron lässt sich anschließend nicht-überwacht (learning without a teacher bzw. self-organized) oder überwacht (learning with a teacher) trainieren, wobei im Verlauf beider Lernverfahren sukzessive Trainingsmuster an die Eingabeschicht angelegt und deren Signale vorwärts gerichtet durch das Netz propagiert werden. Auf Basis dieser Signale erfolgt die (positive) Verstärkung der variablen Verbindungsgewichte. Dabei existiert keine explizite obere Schranke für die Verbindungsgewichte. Dennoch wachsen diese nicht unendlich, da der Lernprozess nur solange stattfindet, bis die Trainingsmuster zufriedenstellend wiedererkannt werden. Zusätzlich rufen die Aktivierungsfunktion in Formel 5.4 und die gleichzeitige Verstärkung der hemmenden Verbindung einer S-Zelle eine Dämpfung der Ausgabe einer S-Zelle hervor.

Im Lernprozess werden bestimmte Merkmale der Trainingsmuster extrahiert, deren Signale gelernt und die Trainingsmuster darauf aufbauend nach Ähnlichkeit bestimmten Musterklassen zugeordnet. Der Lernprozess sollte dabei solange durchgeführt werden, bis für jedes angelegte Trainingsmuster die zugehörige C-Zelle der letzten Stufe aktiviert wird.

5.5.1, Wahl der Netzgröße:

Die optimale Netzgröße bezieht sich auf die Anzahl der Stufen, der Ebenen pro Schicht sowie die Größe der rezeptiven Felder und ist abhängig von der Anzahl der zu lernenden Musterklassen sowie der Trainingsmuster bzgl. deren Merkmals- Komplexität, -Dichte und -Störungen.

Ein Anstieg der zu lernenden Musterklassen erfordert maßgeblich die Erhöhung der Anzahl von Ebenen, da die Merkmale der neuen Musterklassen gelernt werden sollen. Die Größe der rezeptiven Felder von Zellen der Zwischenschichten wird zunächst durch die Merkmalskomplexität der Trainingsmuster bestimmt, wobei diese bei steigender Komplexität kleiner zu wählen sind und umgekehrt. Dadurch werden Unterschiede zwischen den Musterklassen detaillierter gelernt. Weiterhin ist die Größe der rezeptiven Felder von der Dichte der Merkmale in den Trainingsmustern abhängig, wobei auch in diesem Fall die rezeptiven Felder umso kleiner gewählt werden sollten, je größer die Merkmalsdichte ist. Schließlich beeinflussen die erwarteten Störungen von Merkmalen die Größe der rezeptiven Felder. Werden starke Merkmalsstörungen erwartet, so sind die rezeptiven Felder klein zu wählen und umgekehrt. Diese Verkleinerung (Vergrößerung) von rezeptiven Feldern zieht insgesamt eine Erhöhung (Verringerung) der Stufenanzahl nach sich, damit bei der Mustererkennung eine geeignete Aggregation von primitiven zu komplexeren Merkmalen durchgeführt wird.

5.5.2, Nicht-überwachtes Lernen:

Bei diesem Lernverfahren werden ausschließlich die zur Verfügung stehenden Trainingsmuster benötigt und gleichverteilt wiederholt an das Netz angelegt, bis sich eine gewünschte Erkennungsgenauigkeit eingestellt hat. Weitere Informationen werden nicht vorgegeben, so dass die variablen Verbindungsgewichte und die Zuordnung der Trainingsmuster zu einer Musterklasse selbstorganisierend gelernt werden.

Im ersten Schritt erfolgen die Initialisierung aller erregenden Verbindungen mit kleinen positiven Werten nahe Null und die aller hemmenden Verbindungen durch Bewertung mit Null. Fukushima hat keine bestimmte Funktion zur Initialisierung der erregenden Verbindungen vorgegeben, sondern lediglich die einzubeziehenden Parameter, auf deren Basis die Bewertung zu erfolgen hat. Dadurch werden die Verbindungen aller S-Zellen einer S-Ebene gleich, aber zwischen den S-Ebenen verschieden bewertet. Insgesamt sind S-Zellen zu Beginn des Lernverfahrens auf kein bestimmtes Merkmal konditioniert.

Im Anschluss daran erfolgt die Ausbildung der Selektivität der S-Zellen auf ein bestimmtes Merkmal des Trainingsmusters. Dazu wird ein Wettbewerbslernen (competitive learning) simultan für alle S-Schichten durchgeführt, wobei die Strategie ‘der Gewinner erhält alles’ (winner takes all) implementiert wird. In diesem Wettbewerb werden bestimmte S-Zellen als Repräsentanten ihrer jeweiligen S-Ebene ausgewählt und deren Verbindungsgewichte anschließend verstärkt. Dieses Vorgehen lässt sich in drei Teilschritte gliedern, die im Folgenden für eine beliebige S-Schicht beschrieben werden.

Arbeit zitieren:
Privenau, Raoul Mai 2011: Mustererkennung mit Neokognitron und Anwendungen, Hamburg: Diplomica Verlag

Schlagworte:
Künstliche Neuronale Netze, Neokognitron, Hopfield Netz, Mustererkennung, E-Learning

Entdecken Sie mehr zum Thema

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren