Bachelor + Master Publishing
811 Bachelorarbeiten, 533 Masterarbeiten, 10.103 Diplomarbeiten

Grundgerüsterkennung von Diterpenen aus 13C-NMR Daten mit Methoden der Künstlichen Intelligenz

Grundgerüsterkennung von Diterpenen aus 13C-NMR Daten mit Methoden der Künstlichen Intelligenz
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Karsten Rainer Heidtke
  • Abgabedatum: September 1996
  • Umfang: 86 Seiten
  • Dateigröße: 3,5 MB
  • Note: 1,3
  • Institution / Hochschule: Humboldt-Universität zu Berlin Deutschland
  • ISBN (eBook): 978-3-8324-0339-3
  • ISBN (Paperback) :
    978-3-8324-0339-3 P
  • ISBN (CD) :978-3-8324-0339-3 CD
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Heidtke, Karsten Rainer September 1996: Grundgerüsterkennung von Diterpenen aus 13C-NMR Daten mit Methoden der Künstlichen Intelligenz, Hamburg: Diplomica Verlag
  • Schlagworte:

Diplomarbeit von Karsten Rainer Heidtke

Problemstellung:

Die Erforschung und Bekämpfung humaner und pflanzlicher Krankheiten war schon immer ein wesentlicher Bestandteil von Wissenschaft und Forschung. Die Forschung konzentriert sich hierbei neuerdings verstärkt auf natürliche Strukturen, wie sie in Mikroorganismen, marinen Organismen und Pflanzen vorkommen. Die Strukturen in Naturstoffen sind sehr komplex. Die Strukturaufklärung erweist sich als sehr zeitaufwendig und bleibt meistens den Experten vorbehalten. Aufgrund dessen besteht Bedarf für eine Automatisierung der Strukturaufklärung.

Zur Automatisierung der Strukturaufklärung, wurde von der Firma AnalytiConi ein Projekt beim Bundesministerium für Bildung, Wissenschaft, Forschung und Technik (BMBF) beantragt. Bereits seit den siebziger Jahren werden Ansätze verfolgt, die Strukturaufklärung mit Hilfe entsprechender Software teilweise zu automatisieren. Um die hohe Anzahl kombinatorisch denkbarer Strukturen auf die biogenetisch sinnvollen Strukturen reduzieren zu können, wird das Konzept der "biogeneseunterstützten Strukturaufklärung" herangezogen.

Naturstoffe zeichnen sich durch ihren biogenetisch logischen Aufbau des Kohlenstoffgerüstes aus. Der hier verfolgte Ansatz beschränkt sich im Vergleich zu früheren Ansätzen auf Naturstoffe.

In dem beantragten Projekt zur Strukturaufklärung kommen die folgenden modernen Techniken aus dem Bereich der Künstlichen Intelligenz zum Einsatz kommen:

assoziatives Lernen (überwachtes Lernen), entdeckendes Lernen (nicht überwachtes Lernen),neuranale Netze.

Gang der Untersuchung:

Der Inhalt der Arbeit ist in fünf Kapitel untergliedert: Kapitel 1 erläutert Projektstand und Projektziel, Kapitel 2 gibt einen Ausblick auf die chemischen Hintergründe, Kapitel 3 befasst sich mit einem Suchproblem graphentheoretischer Art. Aus den bekannten Strukturen verschiedener Grundgerüste und der vorgegebenen Struktur eines Moleküls soll erkannt werden, um welches Grundgerüst es sich handelt.

Die Kapitel 4 und 5 befassen sich mit der Erkennung von Grundgerüsten, bei denen die Struktur des zu untersuchenden Moleküls unbekannt ist. Untersucht werden die Einsatzmöglichkeiten von neuronalen Netzen und maschinellen Lernalgorithmen. Es werden Daten untersucht, die aus 13C-NMR-Spektren von Naturstoffen stammen, deren Struktur bereits aufgeklärt wurde. Dieses geschieht zum einen unter Berücksichtigung der Zuordnung der Atomnummern und zum anderen ohne deren Berücksichtigung. Diese Einteilung soll die Frage klären, ob neuronale Netze auf diese Problemklasse anwendbar sind. Außerdem soll die Frage der Datenrepräsentation in neuronalen Netzen geklärt werden. Parallel zu diesen Experimenten werden auch Experimente mit maschinellen Lernalgorithmen durchgeführt. Einige der Ergebnisse bezüglich maschineller Lernalgorithmen entstanden in Kooperation mit der Gesellschaft für Mathematik und Datenverarbeitung (GMD) und wurden dort von Soso Dieroski erarbeitet.

Inhaltsverzeichnis:

1. Einleitung 1
1. Vorarbeiten 3
1. Stand der Forschung 3
2. Projektziel 4
2. Chemische Grundlagen 5
1. NMR - Spektroskopie 5
2. 13C - NMR Spektrum 5
3. Diterpene 7
4. Multiplizitäten 7
5. Substituenten 8
6. Beobachtete und reduzierte Multiplizitäten 8
3. Ein graphentheoretisches Problem 11
1. Graphentheoretische Grundlagen 11
2. Suche nach Subgraphen und Isomorphismen 11
2.1 Der Algorithmus von Schmidt und Druffel 13
2.2 Der Algorithmus von Corneil und Gottlieb 15
2.3 Der Algorithmus von Sussenguth Jr. 18
2.4 Algorithmus zur Bestimmung kleinster Kreise 22
3. Anwendung des Subgraphen - Isomorphismus 23
4. Neuronale Netze 25
1. Ein Back – Propagation - Algorithmus 25
2. Auswahl der Netzparameter 26
3. Vorüberlegungen 27
4. Mit Zuordnung durch Atomnummern 27
4.1 Frequenzen neben Multiplizitäten 27
4.2 Frequenzen und Multiplizitäten kombiniert 28
4.3 Multiplizitäten, ohne Angabe der Frequenzen 30
4.4 Cross - Validation 30
4.5 Auswertung der Ergebnisse 31
5. Ohne Zuordnung durch Atomnummern 31
5.1 Zuordnung durch Sortieren 32
5.2 Problem: Ungleich große Klassen 32
5.3 Versteckte Schichten 32
5.4 Einteilung in Frequenzintervalle 33
5.5 Zwanzig Atome des Grundgerüstes 35
5.6 Zwanzig Atome des Grundgerüstes ohne Frequenz 36
5.7 Auswertung der Ergebnisse 36
6. Schlußfolgerungen 37
6.1 Datenrepräsentation 37
6.2 Beo contra Red 37
5. Maschinelles Lernen 39
1. Tools für maschinelles Lernen 39
1.1 C4.5 39
1.2 FOIL 40
2. Experimente mit FOIL 42
2.1 Klassifizierung der Regeln von FOIL 42
2.2 Beschreibung der Beispiele 42
3. Mit Zuordnung durch Atomnummern 43
3.1 Berücksichtigung der Frequenzen 43
3.2 Nur die Multiplizitäten 43
4. Ohne Zuordnung durch Atomnummern 44
4.1 Multiplizitäten und Frequenzen 44
4.2 Anzahl der Multiplizitäten 44
4.3 Künstliche Atomnummern 44
4.4 Kombination von Ansätzen 45
5. Weitere Experimente 46
5.1 Mit Zuordnung durch Atomnummern 46
5.2 Ohne Zuordnung durch Atomnummern 46
6. Schlußfolgerungen 47
6.1 Die Expertenmeinung zu C4.5 47
6.2 C4.5 contra FOIL 48
6. Diskussion der Ergebnisse 51
1. Mit Zuordnung der Atomnummern 51
2. Ohne Zuordnung der Atomnummern 51
3. Neuronales Netz contra maschinelle Lernalgorithmen 52
4. Ungleich große Klassen 52
5. Experimente mit FOIL 53
Anhang A Abkürzungsverzeichnis 59
Anhang B C4.5 60
B.1Mit Zuordnung der Atomnummern 60
Anhang C FOIL 66
C.1 Mit Zuordnung der Atomnummern 66
C.2 Ohne Zuordnung der Atomnummern 70
Anhang D Thesen 79

Arbeit zitieren:
Heidtke, Karsten Rainer September 1996: Grundgerüsterkennung von Diterpenen aus 13C-NMR Daten mit Methoden der Künstlichen Intelligenz, Hamburg: Diplomica Verlag

Schlagworte:

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren