Veröffentlichen auch Sie Ihre Arbeiten - es ist ganz einfach!
Mehr InfosDiplomarbeit, 2010, 98 Seiten
Diplomarbeit
Fachhochschule Düsseldorf (Medien, Studiengang Medientechnik)
1,0
1. Einleitung
2. Einordnung des Themengebietes
3. Physiologische Grundlagen - Das auditive System
3.1. Das periphere auditive System
3.1.1. Das Außenohr
3.1.2. Das Mittelohr
3.1.3. Das Innenohr
3.1.4. Frequenzerkennung durch örtliche Kodierung
3.2. Das zentrale auditive System
3.2.1. Frequenzerkennung durch zeitliche Kodierung
3.2.2. Schallerkennung
3.2.3. Neuronale Informationsverarbeitung
4. Theoretische Grundlagen - Einführung in die Psychoakustik
4.1. Der Hörbereich
4.2. Schall
4.3. Reiz und Empfindung
4.4. Ton und Klang
4.5. Tonhöhenempfindung
4.6. Frequenzgruppen
4.7. Frequenzstufen
5. Konzeption und Durchführung des Hörversuchs
5.1. Vorüberlegungen
5.2. Signalgeneration
5.3. Versuchsaufbau
5.4. Versuchsdurchführung
6. Statistische Auswertung
6.1. Deskriptive Statistik
6.2. Prüfstatistik
6.3. Statistische Absicherung des Verfahrens
6.4. Statistische Auswertung mit Winhoer
7. Ergebnisse des Hörversuchs
7.1. Grundfrequenz 200 Hz, 400 Hz und 500 Hz
7.2. Grundfrequenz 1000 Hz, 2000 Hz und 4000 Hz
7.3. Zusammenfassung und Ausblick
8. Quellen
8.1. Literaturverzeichnis
8.2. Internetverzeichnis
8.3. Abbildungsverzeichnis
9. Anhang
9.1. Der Hörversuch
9.2. Ergebnisausgabe Winhoer
9.3. Test CD des Hörversuches
Gegenstand der vorliegenden Arbeit ist eine Untersuchung zur Hörbarkeit von Frequenzunterschieden. Obwohl psychoakustische Untersuchungen erst mit zunehmendem Wissen über akustische Zusammenhänge und der Möglichkeit zur Generierung genauer Stimuli durch die Verwendung analoger und digitaler Elektronik möglich wurden, gab es Untersuchungen zur Tonhöhe schon früh. Bereits im 6. Jahrhundert vor Christus entdeckte Pythagoras, dass die grundlegenden Intervalle der Musik einfachen Zahlenverhältnissen der Länge einer schwingenden Saite entsprechen. Da eine Halbierung der Saitenlänge eine Verdopplung der musikalischen Tonhöhe zur Folge hatte, folgerte Pythagoras daraus, dass die halbe Saite auch doppelt so schnell schwingen müsste. Galileo Galilei beschrieb 1640 den Zusammenhang zwischen der musikalischen Tonhöhe und der Schwingungen pro Sekunde einer Saite und stellte damit den Bezug von Tonhöhe und Frequenz her. Joseph Sauveur formulierte diese Beziehung zwischen Schwingungsfrequenz und Tonhöhe 1701 aus und wies nach, dass Klänge mit einer deutlichen Tonhöhe aus Grundton und Obertönen zusammengesetzt sind. Georg Simon Ohm wendete 1841 als Erster die Fourieranalyse auf akustische Ereignisse an und stellte sein „ohmisches Gesetz der Akustik“ vor. Dieses besagte unter anderem, dass der Grundton eines Klanges die Tonhöhe bestimmt. Zustimmung bekam er 1862 von Hermann von Helmholtz, der mit der Resonanztheorie eine physiologische Fourieranalyse von Schallereignissen durch die Basilarmembran postulierte. Auch von Helmholtz war überzeugt, dass der Grundton eines Klanges für dessen Tonhöhe verantwortlich ist. 1924 bewies Harvey Fletcher durch spektrale Filterung, dass sich die Tonhöhe eines Signals, trotz fehlenden Grundtones, nicht ändert. Ende der dreißiger Jahre prägte J. F. Schouten für das Phänomen der fehlenden Grundfrequenz den Begriff Residuum und nahm an, dass der Eindruck der Tonhöhe vor allem von den hochfrequenten Anteilen eines Tones bestimmt wird. Ritsma widerlegte diese Annahme 1962 experimentell und konnte ein Frequenzband zwischen dem dritten und fünften Oberton ausmachen, welches entscheidend für den Eindruck der Tonhöhe ist. Ritsma bezeichnete diesen Bereich als spektrale Dominanz eines Klangs. Schoutens und Ritsmas Ergebnisse wurden dahingehend gedeutet, dass das Gehör die Tonhöhe über die Periodizität eines Signals auswertet. Und das, obwohl Georg von Békesy im Jahr zuvor Helmholtz‘ Theorie der Basilarmembran als Fourieranalysator mit der bis heute gültigen Wanderwellentheorie modernisierte.
Alle diese Erkenntnisse bilden die Grundlage der modernen Psychoakustik und bereiteten den Weg für die psychoakustischen Experimente von Weber und Zwicker, die äußerst bedeutsam für die hier vorliegende Arbeit sind. Ernst Weber fand heraus, dass ein Sinnesorgan erst ab einer bestimmten Intensitätsänderung eines Reizes eine Veränderung bemerkt und führte 1834 die ersten JND (Just Noticable Difference) Messungen durch. Eberhard Zwicker gründete 1967 die Münchener Schule für Psychoakustik und führte in den 70er Jahren umfassende Untersuchungen zu Hörempfindungen wie Lautheit, Schwankungsstärke, Rauhigkeit und Tonhöhe durch. Die Ergebnisse, die Zwicker und seine Mitarbeiter Terhardt und Fastl in den folgenden Jahren veröffentlichten, sind international anerkannt. Zwickers vergriffenes Buch „Psychoakustik“ von 1982, die überarbeitete englische Neuauflage „Psychoacoustics. Facts and Models.“ von 1997, sowie Terhardts „Akustische Kommunikation“ von 1998 bilden eine Zusammenfassung der Forschungsergebnisse und sind Standardwerke der Psychoakustik. Zwickers 1967 durchgeführten Hörversuche zur eben wahrnehmbaren Frequenzänderung sollen mit dieser Arbeit überprüft werden.
Im Laufe dieser Arbeit wird zunächst auf die Grundlagen eingegangen, die nötig sind, um den Hörversuch und dessen Ergebnisse nachvollziehen zu können.
Dabei werden nacheinander Teilbereiche der Biologie (Anatomie und Funktionsweise des Gehörs), der Neurologie (neuronale Verarbeitung eingehender akustischer Signale), der Akustik (Beschreibung von Schallereignissen), der Psychoakustik (Zusammenhänge von Schallereignissen und der dadurch ausgelösten Empfindungen) sowie der Statistik (Auswertung) vorgestellt. Die physiologischen Grundlagen werden explizit im Hinblick auf die Fähigkeit der Frequenzselektivität des Gehörs behandelt und sollen die zugrundeliegenden biologischen Mechanismen der Schallerkennung erklären. Die theoretischen Grundlagen werden sich auf die für diese Arbeit wichtigen Teilbereiche der Akustik, Psychoakustik und Statistik beschränken. Hiernach wird der Hörversuch in allen Einzelheiten vorgestellt. Am Ende der Arbeit werden die Ergebnisse des Hörversuches präsentiert und ausgewertet.
Aufgabe des Hörsystems war von jeher die akustische Analyse von Signalen. Für die Vorfahren war die Interpretation von Geräuschen überlebenswichtig, denn sie gab Aufschluss über die Richtung und Entfernung eventueller Gefahren. Um diese komplexen Interpretationen nur aufgrund von Luftdruckschwankungen durchführen zu können, bedient man sich dem sogenannten auditiven System. Dieses unterteilt sich in das periphere auditive System (das anatomische Hörorgan) und das zentrale auditive System, welches die für die Verarbeitung von Schallereignissen benutzten Nervenstrukturen sowie die damit zusammenhängenden Verarbeitungszentren im Gehirn umfasst.
Das Hörorgan wird im Allgemeinen in drei Bereiche unterteilt: Das Außenohr, das Mittelohr und das Innenohr (Abb. 1).
Das Außenohr setzt sich aus dem ca. 2,5 cm langen Gehörgang und der Ohrmuschel zusammen. Die Ohrmuschel dient dabei als Trichter, um den eintreffenden Schall zu konzentrieren. Darüber hinaus bietet alleine die Form der Ohrmuschel schon die erste Möglichkeit, Schallereignisse räumlich zu interpretieren. Denn der von hinten kommende Schall wird im Bereich hoher Frequenzen stärker bedämpft als der von vorne kommende Schall und klingt somit anders. Der Gehörgang leitet den von der Ohrmuschel aufgefangenen Schall weiter zum Trommelfell und verstärkt dabei wie ein Resonanzrohr die für die Sprachverständlichkeit wichtigen Schwingungen innerhalb des Frequenzbandes von 2000 Hz bis 5500 Hz um fünf bis mehr als zehn Dezibel. [12]
Das Mittelohr befindet sich in einem Hohlraum, der durch die Eustachischen Röhre mit dem Rachenraum verbunden ist. Diese Verbindung ist normalerweise geschlossen und dient dem Druckausgleich zwischen Außenohr und Mittelohr, welche durch das Trommelfell voneinander getrennt sind. Druckunterschiede zwischen Außen- und Mittelohr verschieben den Arbeitspunkt des Trommelfells. Schlucken oder Gähnen öffnet die Röhre und bringt durch den so gewonnenen Druckausgleich das Trommelfell wieder zurück in den optimalen Arbeitspunkt. Hier trifft der durch den Gehörgang weitergeleitete Schall auf und versetzt das Trommelfell in Schwingung, wodurch die Luftdruckschwankungen in mechanische Schwingungen umgewandelt werden. Diese Schwingungen werden dann durch die drei Gehörknöchelchen (Hammer, Amboss und Steigbügel) auf das ovale Fenster, und somit in die mit Flüssigkeit gefüllte Cochlea (lat. für Schnecke) übertragen.
Diese komplizierte mechanische Übersetzung ist nötig, da die Schallenergie beim direkten Übergang von Luft in Wasser an der Grenzfläche fast vollständig reflektiert und somit fast keine Schallenergie auf das andere Medium übertragen wird. [14]
Dabei stellen die Gehörknöchelchen einen Hebel dar, welcher große Auslenkung geringer Kraft in kleinere Auslenkung größerer Kraft umwandelt und so eine Verstärkung um den Faktor 1,3 bewirkt. Zudem ist das ovale Fenster (ca. 3,2 mm2) sehr viel kleiner als das Trommelfell (ca. 55 mm2), sodass durch die Verkleinerung der schwingenden Fläche zusätzlich zur Hebelwirkung eine siebzehnfache Verstärkung der Kraft bewirkt wird. Zusammengenommen ergibt sich dadurch eine Verstärkung um den Faktor 22,1. [18]
Das Mittelohr dient somit also als Wandler und Verstärker von Schwingungen, hat darüber hinaus aber auch noch eine nicht zu unterschätzende Schutzfunktion.
Die verbindenden Muskeln an Hammer und Steigbügel können sich bei zu starker Auslenkung des Trommelfells anspannen und so die Weiterleitung von zu lauten Schallereignissen an das Innenohr bedämpfen.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1: Schematische Abbildung des Außen-, Mittel-, und Innenohrs
Das Innenohr, bestehend aus der Cochlea und den Bogengängen des Gleichgewichtsorgans, ist in einen harten Knochen eingelagert. Die mit Flüssigkeit gefüllte Schnecke ist ca. 3 cm lang, hat 2,5 Windungen und beinhaltet drei durch Membranen voneinander getrennte Kanäle (oder Scalen), die nebeneinander von der Basis bis zur Spitze (dem Aphex) laufen. Die Scala Vestibuli, die sich hinter dem ovalen Fenster befindet, ist mit der Scala Tympani am Aphex durch das sogenannte Schneckenloch (Helicotrema) verbunden, sodass ein Flüssigkeitsaustausch stattfinden kann. Die Scala Tympani hat zudem an der Basis zum Druckausgleich das runde Fenster. Diese beiden Skalen umschließen die Scala Media, die kurz vor dem Schneckenloch am Aphex endet (Abb. 2).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2: Schematischer Querschnitt durch die Cochlea
Die Scala Vestibuli und die Scala Media werden nur durch die sehr dünne Reissner Membran voneinander getrennt und daher können vom Standpunkt der Hydromechanik die Schwingungen der beiden Skalen als eine Einheit betrachtet werden. [3]
Die Basilarmembran dagegen, die die Scala Media von der Scala Tympani trennt, ist anders beschaffen. Sie ist am Anfang der Schnecke steif und schmal und wird zum Ende der Schnecke hin immer breiter und elastischer. Da die Flüssigkeiten sowie der das Innenohr umgebene Knochen inkompressibel sind, bildet sich bei Druck des Steigbügels auf das ovale Fenster eine Wanderwelle, die sich in die Schnecke hinein ausbreitet. Die Amplitude dieser Welle nimmt mit zunehmender Entfernung vom ovalen Fenster zu, gleichzeitig reduziert sich ihre Ausbreitungsgeschwindigkeit durch die Verbreiterung der Basilarmembran, bis die Welle an ihrem Resonanzpunkt ein Amplitudenmaxima ausbildet (Abb. 3). [15]
Abbildung in dieser Leseprobe nicht enthalten
Abb. 3: Schematische Darstellung einer Schwingung der Basilarmembran
Auf der Basilarmembran befinden sich die äußeren und inneren Haarzellen, die durch Hörnervenfasern (Axonen) mit dem auditorischen Kortex im Temporallappen verbunden sind. Darüber befindet sich die Tektorialmembran, die nur die längsten Sinneshäärchen (Stereozilien) der äußeren Haarzellen berührt. Die inneren Haarzellen dagegen haben keinen direkten Kontakt zur Tektorialmembran (Abb. 4). Bei einer schallinduzierten Bewegung der Basilarmembran gibt es eine Art Scherbewegung der Tektorialmembran, welche die Flüssigkeit darunter in Bewegung setzt. Die Flüssigkeit lenkt die inneren Haarzellen aus, die daraufhin einen Transmitter freisetzen, der die Nervenfasern stimuliert. Die stimulierten Axonen senden hiernach ein Nervenaktionspotenzial zum Kortex. Dies sind afferente Axonen, die Ihren Ursprung im anatomischen Hörorgan haben und im Kortex enden. Sie sind jeweils eindeutig einer Haarzelle zugeordnet.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 4: Das Cortische Organ
Efferente Axonen, die umgekehrt Ihren Ursprung im Kortex haben und im Hörorgan enden, sind dagegen jeweils mit mehreren äußeren Haarzellen verbunden. Wie sich aus dem Aufbau der Axonen schon vermuten lässt, reizen die äußeren Haarzellen den Hörreiz nicht. Ihre Funktion ist eher mechanischer Natur. Sie sind beweglich und erzeugen bei niedrigen Schalldruck zusätzliche mikromechanische Schwingungen in der Reizfrequenz. Dadurch wirken sie wie Servomotoren, die die Wanderwelle bis zu tausendfach verstärken. [8]
Die zusätzliche Schwingungsenergie entsteht nur an dem jeweils frequenzcharakteristischen, eng umschriebenen Ort auf der Basilarmembran. Dies verstärkt die Flüssigkeitsströmung unter der Tektorialmembran und reizt somit scharf lokalisiert die ortsspezifischen inneren Haarzellen, was die Fähigkeit der Frequenzunterscheidung des Gehörs (Frequenzselektivität) immens erhöht.
Das periphere auditve System transformiert ankommenden Schall also mehrfach.
Erst werden die im Außenohr ankommenden Luftdruckschwankungen im Mittelohr in mechanische Schwingungen umgesetzt. Diese werden dann im Innenohr wiederum in eine hydromechanische Schwingung umgewandelt, die je nach Frequenz des ursprünglichen Schallereignisses, an einer bestimmten Stelle der Basilarmembran ihren Resonanzpunkt hat. Hohe Frequenzen stimulieren Haarzellen an der Basis, tiefe Frequenzen dagegen haben ihr Amplitudenmaximum weiter hinten und wandern weiter in die Cochlea hinein (Abb. 5).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 5: Die entrollte Cochlea mit Basilarmembran
Die Schnecke zerlegt den Schall somit in seine einzelnen Frequenzen und ordnet jeder dieser Frequenzen einen Ort auf der Basilarmembran zu. Dieser Ort ist von der Frequenz des Schallreizes abhängig, hier findet also eine Spektralanalyse mit gleichzeitiger Frequenz-Orts-Transformation statt. Dieses Prinzip, bestimmte Frequenzen auf einen bestimmten Ort abzubilden, nennt man Tonotopie. Die Tonotopie findet sich in fast jedem Zentrum der Hörbahn wieder, einschließlich dem primären auditorischen Kortex. Dies ist ein wichtiger Fakt für den weiteren Verlauf dieser Arbeit, denn er zeigt, dass die Tonhöhenempfindung eigentlich eine Positionsempfindung ist (s. Kap. 4.3.). Ein weiterer Fakt, der aus der Frequenz-Orts-Transformation hervorgeht, ist dass die Fähigkeit, Frequenzunterschiede wahrzunehmen, physiologisch begrenzt ist. Auch aus dem Umstand, dass jede innere Haarzelle durch ein afferentes Axon mit dem Kortex verbunden ist, lässt sich folgern, dass die Fähigkeit Frequenzunterschiede wahrzunehmen, nicht beliebig genau ist. Naheliegend wäre es, dass die Frequenzselektivität durch die Breite einer Haarzelle (10 µm) begrenzt wird, da die Stereozilien einer Haarzelle miteinander durch sogenannte Tips verbunden sind (Abb. 7). Geht man jedoch davon aus, dass sich 620 Frequenzstufen (s. Kap. 4.6.) gleichmäßig auf die Länge der Basilarmembran verteilen, ergibt sich ein Wert von 52 µm für den gerade wahrnehmbaren Frequenzunterschied (Frequenzstufe). Verschiebt sich also der Ort der Haupterregung auf der Basilarmembran um 52 µm, müsste theoretisch eine Frequenzänderung wahrnehmbar sein. Das entspricht 6 Haarzellen, die einen mittleren Abstand von 6 µm haben. [19]
Abbildung in dieser Leseprobe nicht enthalten Abbildung in dieser Leseprobe nicht enthalten
Abb. 6: Haarzelle mit Stereozilien Abb. 7: Stereozilien mit Tip verbunden
An den Haarzellen befinden sich Kanäle, die sich beim Verbiegen der Stereozilien in die eine oder andere Richtung öffnen oder ganz schließen. So gelangen Ionen aus der Endolymphe in und wieder aus den Haarzellen hinaus, der Ionenstrom folgt dabei dem gleichen Zeitverlauf wie die Schwingung der Basilarmembran. Wegen der Endolymphe liegt außerhalb der Haarzellen ein konstantes Potenzial von +85 mV an. Beim Verbiegen der Stereozilien entsteht nun über der Membran der Haarzellen ein sich änderndes Membranpotenzial. Da das Ruhemembranpotenzial von Haarzellen -70 mV beträgt, errechnet sich eine transmembrale Potenzialdifferenz von ca. 155 mV. [8]
Je nach Potenzialdifferenz über der Membran schütten die Haarzellen mehr oder weniger Neurotransmitter aus, welche die Nervenzellen (Neuronen) in den anliegenden afferenten Nervenfasern stimulieren. Diese feuern bei ausreichender Stimulierung pro Sekunde zwischen 20 und 200 elektrische Impulse, sogenannte Nervenaktionspotenziale ab, welche dann über den Hörnerv über die Hörbahn bis zum auditorischen Kortex weitergeleitet werden. Dabei erregt jede Haarzelle 10 bis 20 primäre auditorische Neuronen jeweils über einen einzelnen synaptischen Kontakt, sodass sich die Tonotopie auf neuronaler Ebene fortsetzt. Das Neuron weist also dieselbe charakteristische Frequenz (CF) auf, wie seine innere Haarzelle. [11]
Diese Aktionspotenziale in den einzelnen Nervenfasern folgen der Phase des analysierten Signals hochpräzise, sodass zusätzlich zur Orts - Frequenzinformation über Impulssalven auch die Phase kodiert wird. Über diese zeitlichen Impulsmuster ist die Frequenz direkt bestimmbar. Man spricht hier von Phasenkopplung (Phase Locking), welche allerdings nur bei Frequenzen bis etwa 200 Hz funktioniert. Diese Beschränkung des zeitlichen Auflösungsvermögens besteht aufgrund der Höchstfrequenz der Neurotransmitterfreisetzung im Synaptischen Spalt der Neuronen, die bei maximal 200 Freisetzungen pro Sekunde liegt. Ab 200 Hz kann ein Neuron also nur noch die An- bzw. Abwesenheit einer Schwingung übertragen, aber nicht mehr deren detaillierten Verlauf.
Messungen am runden Fenster mit einer durch das Trommelfell gestochenen Nadelelektrode, sogenannte Elektrokochleogramme, zeigten jedoch, dass Frequenzen bis 5000 Hz mittels zeitlicher Kodierung übertragen werden können. Eine Erklärung für dieses Phänomen bietet E. G. Wevers. Nach dessen Salventheorie kodieren mehrere Neuronen gemeinsam eine Phase, wobei ein einzelnes Neuron nicht bei jeder Periode einer Schwingung einen Impuls anregt, sondern beispielsweise nur bei jeder Dritten. Die anderen Perioden werden in gleicher Weise von den anderen Neuronen übernommen, sodass auch Signale mit einer Frequenz von bis zu 5000 Hz übertragen werden können.
Es gibt also mehrere Theorien, die versuchen, die hohe Frequenzselektivität unseres Gehörs zu erklären. Die ursprüngliche Wanderwellentheorie geht auf Georg von Békésy zurück, der dafür 1961 den Nobelpreis erhielt. Er löste die bis dahin gültige Resonanztheorie von Helmholtz ab, der glaubte, Stereozilien wären Saiten mit verschieden starken Spannungen, die geeignet seien, die Schwingungen der Grundmembran aufzunehmen und selbst in Schwingung zu geraten. [2] Die Theorie der zeitlichen Kodierung (Zeittheorie) stammt von William Rutherford und wurde 1949 mit der Salventheorie von E. G. Wever erweitert.
Die Volley Theorie verbindet die Wanderwellentheorie mit der Zeittheorie. Sie geht davon aus, dass im Bereich tiefer Frequenzen die zeitliche Kodierung, im Bereich hoher Frequenzen die örtliche Kodierung und im mittleren Frequenzbereich beide Verfahren Anwendung finden. Neuere Publikationen gehen davon aus, dass spektrale Komponenten durch örtliche Kodierung in schmalbandige Komponenten zerlegt werden, welche dann durch zeitliche Kodierung aufgelöst werden. [5] Die Frage nach Übertragung von Dauer und Pegel eines Schallereignisses scheint dagegen geklärt. Die Dauer eines Schallreizes wird direkt durch die Dauer der Aktivierung der afferenten Nervenfasern verschlüsselt. Die Kodierung unterschiedlicher Schalldruckpegel gelingt durch die Entladungsrate der einzelnen erregten Neuronen, die synchron zur Änderung des Schalldruckpegels, in einem Bereich von etwa 50 dB variiert. Um den gesamten dynamischen Bereich von 120 dB bis zur Schmerzgrenze abzudecken, wird jede Haarzelle von Neuronen mit unterschiedlicher Erregungsschwelle kontaktiert, sodass bei steigendem Schallpegel zunehmend Neuronen mit höherer Erregungsschwelle rekrutiert werden. [11]
Die Aktionspotenziale aus dem linken und dem rechten Hörsystem werden durch mehrere Schaltzentralen der Hörbahn, den sogenannten Kernen, weiterverarbeitet. Man spricht in diesem Zusammenhang von neuronalen Netzwerken, informationsverarbeitenden Systemen, die aus einer großen Anzahl einfacher Schalteinheiten, den Neuronen, zusammengesetzt sind. [12] Neuronen (Abb. 8) sind über ihre Dendriten mit anderen Neuronen verbunden und erhalten darüber von ihnen Impulse, die sie verarbeiten. Die Übertragung der Impulse von einem Neuron auf ein anderes findet über Synapsen statt. Dabei gibt es zwei Sorten von Synapsen, exzitatorische und inhibitorische. Bei der exzitatorischen Synapse wird die nachfolgende Zelle durch die Übertragung zur Aktivität angeregt, bei der inhibitorischen Synapse wird die nachfolgende Zelle durch die Übertragung in Ihrer Aktivität gehemmt. Ob eine Synapse bei der Übertragung erregt oder hemmt, hängt meist vom Neurotransmitter ab, den die Synapse freisetzt.
Ein Neuron erhält meist gleichzeitig erregende und hemmende Signale, die es über kurze Zeitabschnitte miteinander vergleicht. Wenn die Anzahl von erregenden Signalen die Anzahl der hemmenden Signale um einen bestimmten Wert überschreitet, feuert das Neuron über sein Axon einen Impuls ab. Falls die Anzahl der hemmenden Signale größer ist, als die der erregenden, feuert es nicht.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 8: Schematische Darstellung eines Neurons
Je weiter man die Hörbahn von den Haarzellen aus bis zum auditorischen Cortex verfolgt, desto spezialisierter werden die Neuronen.
Bis heute ist die neuronale Verarbeitung von Schallinformationen nicht vollständig geklärt, allerdings kann man durch Messungen der elektrischen Hirnaktivität während der Darbietung bestimmter Schallreize die Aktivität in den Kernen (Abb. 9) bestimmten Verarbeitungsprozessen zuordnen.
So werden z. B. Laufzeit - und Intensitätsunterschiede vom linken und rechten Ohr vermutlich im Olivenkern (Nucleus Olivaris) verglichen, um eine räumliche Lokalisation der Schallquelle zu bewerkstelligen. Zudem laufen vom Olivenkern aus viele efferente Nervenfasern zurück zur Cochlea, weswegen man annimmt, dass von hier aus die äußeren Haarzellen angesteuert werden.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 9: Schematische Darstellung der zentralen Hörbahn mit den Kernen (lat.: Nucleus). Zur besseren Übersicht werden nur die afferenten Verbindungen eines Ohres dargestellt.
Manche Neuronen reagieren nur auf Reizung mit bestimmten Frequenzen, andere feuern wiederum frequenzunabhängig bei Anwesenheit von Schall. Wieder andere generieren nur ein Aktionspotenzial, wenn eine Signaländerung eintritt, oder feuern zu Beginn und Ende eines Schallereignisses. Dabei nimmt die Anzahl der beteiligten Neuronen von Kern zu Kern stark zu, was darauf hindeutet, dass die Analyse immer komplexer wird. Die 3500 inneren Haarzellen in jedem Innenohr stimulieren die etwa 15.000 Fasern jedes der beiden Hörnerven. Der Nucleus cochlearis hat zusammengenommen 90.000 Neuronen, der Olivenkern 34.000, der Leminiscus lateralis 38.000, der Colliculus inferior 400.000 und der Corpus geniculatum mediale 500.000. [12] Ohne die zunehmende Spezialisierung der Informationsverarbeitung entlang der Hörbahn wäre es nicht möglich, den Nutzschall (z. B.: Sprache und Musik) von der übrigen Schallinformation (z. B.: Hintergrundgeräusche, nicht interessierende Sprache bei mehreren Sprechern) zu unterscheiden. Nur ein vergleichsweise geringer Anteil der akustischen Information, die an das Ohr gelangt, erreicht am Ende den auditorischen Kortex.
Der Aufbau des auditiven Systems und vor allem die Eigenschaften der Basilarmembran lassen erkennen, dass das Gehör nicht beliebig genau ist. Vielmehr ist die Tatsache, ob etwas gehört wird, vor allem von der Frequenz und dem Pegel des Schallereignisses abhängig.
Der vom Menschen hörbare Frequenzbereich liegt zwischen 20 Hz und 20 kHz.
Pegelmäßig wird der Hörbereich nach unten durch die Ruhehörschwelle und nach oben durch die Schmerzgrenze beschränkt. Die Ruhehörschwelle ist definiert als derjenige Schalldruckpegel eines Sinustones, der in Abhängigkeit von seiner Frequenz gerade noch wahrgenommen wird. [16] Die Schmerzgrenze ist definiert als der niedrigste Pegel eines Sinustones, der in Abhängigkeit von seiner Frequenz als schmerzhaft empfunden wird. Hier wird deutlich, dass die Lautstärkeempfindung an sich stark frequenzabhängig ist.
Und diese Frequenzabhängigkeit fällt für unterschiedliche Schalldruckpegel auch noch unterschiedlich aus. Abbildung 10 zeigt, mit wie viel Schalldruckpegel Sinustöne verschiedener Frequenzen wiedergegeben werden müssen, um gleichlaut wahrgenommen zu werden.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 10: Frequenzabhängigkeit der Lautstärkeempfindung für unterschiedliche Pegel
Hier zeigt sich, dass Lautstärke als physikalische Größe und die Lautstärke, die wahrgenommen wird, zwei grundverschiedene Dinge sind.
In der Psychoakustik ist Schall der akustische Reiz, der das Gehör trifft und eine Hörempfindung auslöst. Beschreiben lässt sich der Schallreiz als Schalldruck, der am Trommelfell wirkt. Als Schalldruck bezeichnet man Druckschwankungen, die bei der Ausbreitung von Schall entstehen. Dabei ist der Schalldruck als Wechselgröße dem statischen Druck des Übertragungsmediums überlagert. Im Übertragungsmedium Luft ist der Schalldruck somit der sich zeitlich ändernde Anteil des Luftdrucks. Er wird als Kraft pro Flächeneinheit beschrieben:
Abbildung in dieser Leseprobe nicht enthalten
Die Einheit des Schalldrucks ist Pascal [Abbildung in dieser Leseprobe nicht enthalten]. Man kann den Momentanwert Abbildung in dieser Leseprobe nicht enthalten(t) des Schalldrucks als zeitliche Folge einer Funktion angeben. Um die Leistung einer Wechselgröße über längere Zeiträume hinweg angeben zu können, bedient man sich des Effektivwertes Abbildung in dieser Leseprobe nicht enthalteneff. Für das Übertragungsmedium Luft wurde der Schalldruck eines gerade noch hörbaren Sinustons der Frequenz 1 kHz als Bezugschalldruck Abbildung in dieser Leseprobe nicht enthalten festgelegt. Für den Schalldruckpegel L gilt:
Abbildung in dieser Leseprobe nicht enthalten
Bildet man den dekadischen Logarithmus vom Verhältnis zweier gleichartiger Leistungsgrößen, dient das Bell [Abbildung in dieser Leseprobe nicht enthalten] als Kennzeichnung. Für den Schalldruckpegel benutzt man den zehnten Teil des Bells, das Dezibel [Abbildung in dieser Leseprobe nicht enthalten]. Um Verwechselung vorzubeugen, wird oft der Zusatz „Sound Pressure Level“ [Abbildung in dieser Leseprobe nicht enthaltenSPL] benutzt.
Bei mehreren hörbaren Schallereignissen werden vom Gehör allerdings nicht die Amplituden der verschiedenen Schalldrucke, sondern die Schallintensitäten der Schallereignisse addiert.
Die Schallintensität Abbildung in dieser Leseprobe nicht enthalten erhält man, indem man den Effektivwert des Schalldrucks durch den Schallwiderstand des Übertragungsmediums teilt:
Abbildung in dieser Leseprobe nicht enthalten
Für das Übertragungsmedium Luft ist der Schallwiderstand Abbildung in dieser Leseprobe nicht enthalten = 415 Ns/m3. Setzt man nun für den Effektivwert des Schalldrucks den Bezugsschalldruck ein, erhält man für Luft eine Bezugsschallintensität von:
Abbildung in dieser Leseprobe nicht enthalten
Löst man Gleichung [4.3] und Gleichung [4.4] nach dem Schalldruck auf und setzt in Gleichung [4.2] ein, ergibt sich für den Schalldruckpegel:
Abbildung in dieser Leseprobe nicht enthalten
Der Schalldruckpegel kann also auch als Schallintensitätspegel angegeben werden.
Es ist zwar möglich, mit Sondenmikrofonen den Schalldruck direkt am Trommelfell zu messen, aber dieses Verfahren ist recht umständlich. Da ein fester, nur von der Frequenz abhängiger Zusammenhang zwischen dem Schalldruck am Trommelfell und dem Schalldruck in der ungestörten Welle besteht, hat man sich darauf geeinigt, den Schalldruck im ebenen Schallfeld an der Stelle anzugeben, an dem sich der Kopf des Probanden befindet. Dies vereinfacht die Kalibrierung von Hörtests ungemein. [16]
In der Psychoakustik unterscheidet man in Reizgrößen (Schalldruckpegel [dB], Frequenz [Hz]) und den dazugehörigen Empfindungsgrößen (Lautheit [sone], Tonhöhenempfindung [mel]). Genau wie bei den physikalisch exakt umschriebenen Reizgrößen werden auch die Empfindungsgrößen als Produkt aus Zahlenwert und Einheit angegeben. So ist es möglich die Zusammenhänge zwischen Reizen und Empfindungen zu beschreiben. Sobald die Reizgrößen hörbare Werte erreichen, lösen sie eine Empfindung aus. Dabei beschreiben die Reizgrößen eindeutig den Schall, der unser Gehör trifft und die Empfindungsgrößen beschreiben die Hörempfindung, die dieser Reiz verursacht.
Der Zusammenhang zwischen Reizgrößen und Empfindungsgrößen wird als kontinuierliche Empfindungsfunktion angegeben. Allerdings gibt es auch Reizgrößenänderungen, die so gering sind, dass die Empfindungsgröße sich nicht wahrnehmbar ändert. Im Hinblick auf eine gültige kontinuierliche Empfindungsfunktion wird in diesem Falle von einer so geringen Änderung der Empfindungsgröße ausgegangen, dass es von der Versuchsperson nicht als Änderung wahrgenommen wird.
Eine gerade wahrnehmbare Reizgrößenänderung wird als Reizstufe bezeichnet. Zu dieser Reizstufe gehört eine Empfindungsstufe, die aus der Transformation der Reizstufe über die Empfindungsfunktion hervorgeht. Sie kann nicht direkt gemessen werden. Sie geht vielmehr aus der Reizstufe und aus der als bekannt vorausgesetzten Empfindungsfunktion hervor. [16]
Da die Hörempfindung von Mensch zu Mensch verschieden ist und selbst die Hörempfindung eines einzelnen Menschen durch Faktoren wie Müdigkeit oder schwankende Aufmerksamkeit variiert, können Empfindungsgrößen nicht eindeutig beschrieben werden. Sie sind statistische Mittelwerte, die sich dadurch auszeichnen, dass bei diesbezüglichen Hörtests 50 % der Probanden über und 50 % der Probanden unter diesem Wert lagen.
Der Begriff „Ton“ ist in der Physik anders belegt als in der Musik, weswegen es hier einer genauen Differenzierung bedarf. Im physikalischen Sinne ist ein Ton eine einzelne Sinusschwingung, dessen Tonhöhe direkt über die Frequenz angegeben werden kann. Ein solcher Ton, auch reiner Ton genannt, kann nur elektrisch erzeugt werden. Erklingen mehrere reine Töne gleichzeitig, spricht man in der Physik von einem Klang.
In der Musik spricht man hier allerdings von einem Ton, der im Normalfall aus dem Grundton und mehreren Teiltönen besteht. Dieser wird vom Hörer als ein Ton wahrgenommen und als natürlicher Ton bezeichnet.
Da die Empfindungsfunktion der Tonhöhenempfindung direkt nur durch die Messung von Verhältnissen ausgemessen werden kann, spricht man von Verhältnistonhöhe. [16]
Sie gibt die Tonhöhenempfindung als Funktion der Frequenz an. Will man die Tonhöhenempfindung als Funktion der Frequenz messen, muss man die Größen, von denen die Verhältnistonhöhe abhängt, konstant halten. Für die Messung der Verhältnistonhöhe H eines Tones wurde daher ein Schallpegel von 80dB und eine Dauer von 1,0 sec festgelegt. Dem Ton mit einer Frequenz von 125 Hz wurde der Wert 125 mel als Fixpunkt zugeordnet. Dadurch stimmt in tiefen Tonlagen der Zahlenwert der Frequenz in Hz mit dem Zahlenwert der Verhältnistonhöhe in mel überein. [17]
Die durchgezogene Linie in Abbildung 11 zeigt den Zusammenhang zwischen Frequenz in kHz und der Verhältnistonhöhe in mel. Die gepunktete Linie zeigt den vermuteten Zusammenhang zwischen Frequenz und Tonhöheninformation aus dem Erregungsmaximum der Basilarmembran (ERB-Skala), die gestrichelte den Zusammenhang zwischen Frequenz und Tonhöheninformation aus der Zeitstruktur. Hier scheint sich die in 3.2.2. diskutierte Annahme, dass das Gehör im Bereich tiefer Frequenzen die zeitliche Kodierung und im Bereich hoher Frequenzen die örtliche Kodierung zur Verarbeitung von Schallereignissen nutzt, zu bestätigen.
[...]
Kommentare