Mustererkennung mit Neokognitron und Anwendungen
- Art: Diplomarbeit
- Autor: Raoul Privenau
- Abgabedatum: Mai 2011
- Umfang: 160 Seiten
- Dateigröße: 6,8 MB
- Note: 1,0
- Institution / Hochschule: Martin-Luther-Universität Halle-Wittenberg Deutschland
- Bibliografie: ca. 185
- ISBN (eBook): 978-3-8428-2036-4
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Privenau, Raoul Mai 2011: Mustererkennung mit Neokognitron und Anwendungen, Hamburg: Diplomica Verlag
- Schlagworte: Künstliche Neuronale Netze, Neokognitron, Hopfield Netz, Mustererkennung, E-Learning
58,00 €
PDF-eBook Download: 58,00 €
Diplomarbeit von Raoul Privenau
Einleitung:
Das menschliche Gehirn empfängt eine Fülle unterschiedlicher Reize über verschiedene Sinnesorgane. Ein bedeutendes Gebiet in diesem Zusammenhang ist die visuelle Wahrnehmung, die als ‘... Aufnahme und die zentrale Verarbeitung von visuellen Reizen ...’ definiert ist. Der Mensch ist in der Lage aus einer großen Menge visueller Reize bestimmte Signale innerhalb kürzester Zeit herauszufiltern und richtig zu interpretieren. Probleme ergeben sich allerdings bei der Portierung dieser Fähigkeit der natürlichen Mustererkennung auf Computersysteme durch die erheblichen Unterschiede hinsichtlich der Leistungsfähigkeit und der Architektur. Nach dem derzeitigen technischen Stand können Computer Daten um ein vielfaches schneller verarbeiten, als unser Gehirn, sind aber dennoch mit Aufgaben überfordert, die durch unser Gehirn in kürzester Zeit erfolgreich durchgeführt werden. Charakteristisch für das menschliche Gehirn, als komplexes biologisches Netzwerk, ist seine hochgradige parallele Signalverarbeitung. Dank seiner ca. 1012 Nervenzellen, die über ca. 1015 Verbindungen miteinander verknüpft sind, verarbeitet es Millionen von Reizen innerhalb weniger Millisekunden. Die serielle Datenverarbeitung auf einer Von-Neumann-Architektur ist damit nicht vergleichbar. Es existieren allerdings stark vereinfachte Modelle zur Nachahmung dieses komplexen biologischen natürlichen Nervensystems, die als künstliche neuronale Netze (KNN) bezeichnet werden. Auch im Bereich der Mustererkennung hat sich der Einsatz von KNN bewährt, wobei besonders das Neokognitron eine gute Nachahmung der natürlichen Mustererkennung im visuellen Bereich verspricht.
Der Fokus der vorliegenden Arbeit liegt auf der strukturellen und funktionalen Darstellung des Neokognitrons bei der Mustererkennung. Darüber hinaus werden Anwendungen vorgestellt, für die das Neokognitron implementiert wurde. Neben dem Neokognitron wird auch das Hopfield-Netz (HN) als klassisches KNN zur Mustererkennung erläutert. Entsprechend dieser Ausführungen wurde zusätzlich zur vorliegenden Arbeit ein E-Learning Modul (EM) für binäre HN prototypisch implementiert und wird in dieser Arbeit vorgestellt.
Die vorliegende Arbeit ist wie folgt aufgebaut:
Kapitel 2 gibt eine Einführung in die Mustererkennung, wobei zunächst eine Eingrenzung dieses Themengebietes für die vorliegende Arbeit erfolgt. Anschließend werden die Teilschritte eines allgemeinen Mustererkennungsprozesses erläutert. In diesen Prozess lassen sich verschiedene Mustererkennungsaufgaben integrieren, von denen die wesentlichen Aufgaben vorgestellt werden. Den Abschluss bildet eine Motivation des Einsatzes von KNN zur Mustererkennung.
Kapitel 3 vermittelt die notwendigen Grundlagen von KNN, die zum Verständnis der folgenden Kapitel von Bedeutung sind. Darüber hinaus wird die Eignung von KNN für den Mustererkennungsprozess aus Kapitel 2 begründet.
Kapitel 4 führt in die Theorie eines HN zur Mustererkennung ein und schließt mit einer kritischen Bewertung des Einsatzes zur Mustererkennung.
Kapitel 5 thematisiert anschließend das Neokognitron zur Mustererkennung. Im Vordergrund stehen dabei die Netzstruktur, die sich daraus ergebende Funktionsweise bei der Mustererkennung sowie potentielle Lernverfahren. Abschließend erfolgt eine Bewertung u.a. bzgl. des Einsatzes im Mustererkennungsprozess aus Kapitel 2 und der Leistungsfähigkeit bei der Mustererkennung.
In Kapitel 6 werden verschiedene Erweiterungen des Neokognitrons vorgestellt, die sich auf spezielle Problembereiche beziehen. Aufgrund deren hoher Komplexität werden ausschließlich die wesentlichen Eigenschaften im Überblick dargestellt.
Kapitel 7 fokussiert Anwendungen aus verschiedenen Bereichen, in denen das Neokognitron zur Mustererkennung implementiert wurde. Die entsprechenden Implementierungen sollen die praktische Leistungsfähigkeit und das Anwendungsspektrum des Neokognitrons verdeutlichen.
Kapitel 8 stellt das entwickelte EM für binäre HN vor, das die Möglichkeit zur computergestützten Simulation von binären HN im Lehrbetrieb schafft, wodurch deren Leistungsfähigkeit praktisch evaluiert werden kann. Das Kapitel zeigt dazu ausgewählte Aspekte der Implementierung.
Kapitel 9 beinhaltet schließlich eine zusammenfassende Betrachtung der zentralen Punkte der vorliegenden Arbeit und gibt einen Ausblick zum Neokognitron bzgl. der Mustererkennung.
Inhaltsverzeichnis:
| Abbildungsverzeichnis | V | |
| Abkürzungsverzeichnis | VII | |
| Tabellenverzeichnis | IX | |
| 1. | Einleitung | 1 |
| 1.1 | Motivation | 1 |
| 1.2 | Ziele der Arbeit | 2 |
| 1.3 | Aufbau der Arbeit | 2 |
| 2. | Mustererkennung | 5 |
| 2.1 | Mustererkennungsprozess | 6 |
| 2.2 | Wesentliche Mustererkennungsaufgaben | 8 |
| 2.3 | Methoden der Mustererkennung | 10 |
| 3. | Künstliche Neuronale Netze | 13 |
| 3.1 | Standardneuronenmodell | 13 |
| 3.2 | Grundlegende Netzarchitekturen | 15 |
| 3.3 | Lernverfahren | 16 |
| 3.4 | Einsatz im Bereich der Mustererkennung | 17 |
| 4. | Hopfield-Netz | 19 |
| 4.1 | Netzstruktur | 19 |
| 4.2 | Mustererkennung | 20 |
| 4.2.1 | Rekursive Berechnung | 21 |
| 4.2.2 | Energiefunktion | 21 |
| 4.3 | Musterspeicherung | 22 |
| 4.4 | Musterlöschung | 24 |
| 4.5 | Verschiedene Netzkonfigurationen | 24 |
| 4.6 | Bewertung | 26 |
| 5. | Neokognitron | 29 |
| 5.1 | Grundlegende Netzstruktur | 29 |
| 5.1.1 | Eingabeschicht | 30 |
| 5.1.2 | Stufensystem | 30 |
| 5.1.3 | Verbindungsstruktur | 31 |
| 5.2 | Mustererkennung | 32 |
| 5.3 | S-Zellen | 34 |
| 5.3.1 | Verbindungsstruktur | 34 |
| 5.3.2 | Mathematische Beschreibung | 37 |
| 5.3.3 | Merkmalsextraktion auf Basis der Ähnlichkeit | 39 |
| 5.3.4 | Steuerung der Selektivität | 40 |
| 5.4 | C-Zellen | 42 |
| 5.4.1 | Verbindungsstruktur | 42 |
| 5.4.2 | Mathematische Beschreibung | 43 |
| 5.4.3 | Positionsinvarianz und Unschärfe | 44 |
| 5.5 | Lernverfahren | 46 |
| 5.5.1 | Wahl der Netzgröße | 46 |
| 5.5.2 | Nicht-überwachtes Lernen | 47 |
| 5.5.3 | Überwachtes Lernen | 51 |
| 5.5.4 | Vergleich der Lernverfahren | 52 |
| 5.6 | Bewertung | 53 |
| 5.6.1 | Integration in den Mustererkennungsprozess | 53 |
| 5.6.2 | Geeignete Muster | 54 |
| 5.6.3 | Erkennungsleistung und Störungsinvarianz | 54 |
| 5.6.4 | Fazit | 55 |
| 6. | Erweiterungen des Neokognitrons | 57 |
| 6.1 | Erweitertes Neokognitron | 57 |
| 6.1.1 | Kontrastgewinnung | 57 |
| 6.1.2 | Hemmendes Umfeld von C-Zellen | 58 |
| 6.1.3 | Hybrider Lernprozess | 59 |
| 6.1.4 | Weiterentwicklung | 60 |
| 6.1.5 | Computersimulation | 63 |
| 6.2 | Selektive Aufmerksamkeitssteuerung und Autoassoziation | 64 |
| 6.2.1 | Routenwahl | 66 |
| 6.2.2 | Autoassoziation | 66 |
| 6.2.3 | Verstärkung der Aufmerksamkeit | 67 |
| 6.2.4 | Segmentierung | 67 |
| 6.2.5 | Wechsel der Aufmerksamkeit | 67 |
| 6.2.6 | Antwortkontrolle | 68 |
| 6.3 | Rotationsinvarianz | 69 |
| 6.3.1 | Version 1 – Rotationsinvariantes Neokognitron | 69 |
| 6.3.2 | Version 2 – Hybrides Neokognitron entsprechend der mentalen Rotation | 70 |
| 6.4 | Doppelte C-Zellen-Schicht | 72 |
| 7. | Anwendungen | 75 |
| 7.1 | Zeichenerkennung | 76 |
| 7.1.1 | Erkennung numerischer und alphanumerischer Zeichen | 76 |
| 7.1.2 | Weitere Anwendungen im Bereich der Zeichenerkennung | 78 |
| 7.2 | Erkennung handgeschriebener Musiknoten | 79 |
| 7.3 | Gesichtserkennung | 80 |
| 7.4 | Automatische Zielerkennung | 85 |
| 7.5 | Analyse von Echokardiogrammen | 87 |
| 7.6 | Erkennung von Draht-Modellen | 88 |
| 7.7 | Suche struktureller Einheiten auf Mikrochips | 89 |
| 7.8 | Weitere Anwendungen | 90 |
| 8. | E-Learning Modul für binäre Hopfield-Netze | 93 |
| 8.1 | Wahl der Software-Plattform und Entwicklungsumgebung | 94 |
| 8.2 | Softwarearchitektur und allgemeine Modulverwendung | 95 |
| 8.3 | Kritische Aspekte der Entwicklung | 97 |
| 8.3.1 | Hopfield-Logik | 97 |
| 8.3.2 | Benutzeroberfläche und Ablaufsteuerung | 99 |
| 9. | Resümee und Ausblick | 101 |
| A. | Hopfield Netz | 105 |
| A.1 | Gewichtsmatrix | 105 |
| A.2 | Beispiel für eine Energiefunktion | 105 |
| A.3 | Beispiel zum Lernen der Schwellen | 106 |
| B. | Software zur Simulation eines Neokognitrons | 107 |
| B.1 | Beholder 2.0b | 107 |
| B.2 | NeoCognitron 1.0.0 Beta | 112 |
| C. | Muster bei der Erkennung alphanumerischer Zeichen | 117 |
| D. | CAPTCHA-Beispiele | 123 |
| E. | E-Learning Modul | 125 |
| E.1 | Abbildung des zweidimensionalen Eingabebereiches auf ein eindimensionales Feld | 125 |
| E.2 | Abbildung der zweidimensionalen Gewichtsmatrix auf ein eindimensionales Feld | 125 |
| E.3 | Einsatz einer Datenbank zur Speicherung der Gewichtsmatrix | 127 |
| E.4 | Ermittlung der maximalen Mustergröße in Abhängigkeit von der Prozessorarchitektur | 128 |
| Literaturverzeichnis | 131 |
Textprobe:
Kapitel 5.5, Lernverfahren:
In diesem Abschnitt steht der Lernprozess des Neokognitrons im Vordergrund, in dessen Rahmen die variablen Verbindungsgewichte aller S-Zellen angepasst werden. Dieser basiert auf einer Reihe ausgewählter Trainingsmuster, durch die das Neokognitron grundlegend vorkonfiguriert wird, wobei u.a. die Wahl der Netzgröße von Bedeutung ist und in 5.5.1 zunächst thematisiert wird.
Das Neokognitron lässt sich anschließend nicht-überwacht (learning without a teacher bzw. self-organized) oder überwacht (learning with a teacher) trainieren, wobei im Verlauf beider Lernverfahren sukzessive Trainingsmuster an die Eingabeschicht angelegt und deren Signale vorwärts gerichtet durch das Netz propagiert werden. Auf Basis dieser Signale erfolgt die (positive) Verstärkung der variablen Verbindungsgewichte. Dabei existiert keine explizite obere Schranke für die Verbindungsgewichte. Dennoch wachsen diese nicht unendlich, da der Lernprozess nur solange stattfindet, bis die Trainingsmuster zufriedenstellend wiedererkannt werden. Zusätzlich rufen die Aktivierungsfunktion in Formel 5.4 und die gleichzeitige Verstärkung der hemmenden Verbindung einer S-Zelle eine Dämpfung der Ausgabe einer S-Zelle hervor.
Im Lernprozess werden bestimmte Merkmale der Trainingsmuster extrahiert, deren Signale gelernt und die Trainingsmuster darauf aufbauend nach Ähnlichkeit bestimmten Musterklassen zugeordnet. Der Lernprozess sollte dabei solange durchgeführt werden, bis für jedes angelegte Trainingsmuster die zugehörige C-Zelle der letzten Stufe aktiviert wird.
5.5.1, Wahl der Netzgröße:
Die optimale Netzgröße bezieht sich auf die Anzahl der Stufen, der Ebenen pro Schicht sowie die Größe der rezeptiven Felder und ist abhängig von der Anzahl der zu lernenden Musterklassen sowie der Trainingsmuster bzgl. deren Merkmals- Komplexität, -Dichte und -Störungen.
Ein Anstieg der zu lernenden Musterklassen erfordert maßgeblich die Erhöhung der Anzahl von Ebenen, da die Merkmale der neuen Musterklassen gelernt werden sollen. Die Größe der rezeptiven Felder von Zellen der Zwischenschichten wird zunächst durch die Merkmalskomplexität der Trainingsmuster bestimmt, wobei diese bei steigender Komplexität kleiner zu wählen sind und umgekehrt. Dadurch werden Unterschiede zwischen den Musterklassen detaillierter gelernt. Weiterhin ist die Größe der rezeptiven Felder von der Dichte der Merkmale in den Trainingsmustern abhängig, wobei auch in diesem Fall die rezeptiven Felder umso kleiner gewählt werden sollten, je größer die Merkmalsdichte ist. Schließlich beeinflussen die erwarteten Störungen von Merkmalen die Größe der rezeptiven Felder. Werden starke Merkmalsstörungen erwartet, so sind die rezeptiven Felder klein zu wählen und umgekehrt. Diese Verkleinerung (Vergrößerung) von rezeptiven Feldern zieht insgesamt eine Erhöhung (Verringerung) der Stufenanzahl nach sich, damit bei der Mustererkennung eine geeignete Aggregation von primitiven zu komplexeren Merkmalen durchgeführt wird.
5.5.2, Nicht-überwachtes Lernen:
Bei diesem Lernverfahren werden ausschließlich die zur Verfügung stehenden Trainingsmuster benötigt und gleichverteilt wiederholt an das Netz angelegt, bis sich eine gewünschte Erkennungsgenauigkeit eingestellt hat. Weitere Informationen werden nicht vorgegeben, so dass die variablen Verbindungsgewichte und die Zuordnung der Trainingsmuster zu einer Musterklasse selbstorganisierend gelernt werden.
Im ersten Schritt erfolgen die Initialisierung aller erregenden Verbindungen mit kleinen positiven Werten nahe Null und die aller hemmenden Verbindungen durch Bewertung mit Null. Fukushima hat keine bestimmte Funktion zur Initialisierung der erregenden Verbindungen vorgegeben, sondern lediglich die einzubeziehenden Parameter, auf deren Basis die Bewertung zu erfolgen hat. Dadurch werden die Verbindungen aller S-Zellen einer S-Ebene gleich, aber zwischen den S-Ebenen verschieden bewertet. Insgesamt sind S-Zellen zu Beginn des Lernverfahrens auf kein bestimmtes Merkmal konditioniert.
Im Anschluss daran erfolgt die Ausbildung der Selektivität der S-Zellen auf ein bestimmtes Merkmal des Trainingsmusters. Dazu wird ein Wettbewerbslernen (competitive learning) simultan für alle S-Schichten durchgeführt, wobei die Strategie ‘der Gewinner erhält alles’ (winner takes all) implementiert wird. In diesem Wettbewerb werden bestimmte S-Zellen als Repräsentanten ihrer jeweiligen S-Ebene ausgewählt und deren Verbindungsgewichte anschließend verstärkt. Dieses Vorgehen lässt sich in drei Teilschritte gliedern, die im Folgenden für eine beliebige S-Schicht beschrieben werden.
58,00 €
PDF-eBook Download: 58,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783842820364
Arbeit zitieren:
Privenau, Raoul Mai 2011: Mustererkennung mit Neokognitron und Anwendungen, Hamburg: Diplomica Verlag
Schlagworte:
Künstliche Neuronale Netze, Neokognitron, Hopfield Netz, Mustererkennung, E-Learning



