- II -

- III -

Danksagung Die vorliegende Arbeit entstand während meiner Tätigkeit als wissenschaftlicher Mitarbeiter am Lehrstuhl für allgemeine Elektrotechnik und Akustik (AEA) an der Ruhr-Universität Bochum. Dem Inhaber des Lehrstuhl, Herrn Prof. Dr.-Ing. J. Blauert, der diese Arbeit ermöglichte, möchte ich an dieser Stelle herzlich danken. Mein besonderer Dank gilt auch meinen ehemaligen Kollegen Dr.-Ing. Markus Bodden, Dr.-Ing. Werner Gaik, Priv.-Doz. Dr.-Ing. Herbert Hudde und Dr.-Ing. Siegbert Wolf sowie allen Mitarbeitern und Studenten am Lehrstuhl AEA, die mich durch ihre freundschaftliche Zusammenarbeit und konstruktive Kritik unterstützten. Zu guter Letzt danke ich Herrn Prof. Dr.-Ing. U. Heute für sein freundliches Interesse an dieser Arbeit und für die Übernahme des Korreferats.

- IV -

-V-

Inhalt 1.

Einleitung .................................................................................................................. 1

2. 2.1. 2.2. 2.3.

Psychoakustische Grundlagen Erkennen von Richtungen............................................................................................ 5 Verarbeiten von Signalen bestimmter Richtungen ........................................................ 7 Merkmale und Leistungen der binauralen Signalverarbeitung ....................................... 8

3. 3.1. 3.2. 3.3. 3.4.

Hörversuche zur Lokalisation mehrerer Schallquellen Aufbau der Hörversuche.............................................................................................. 9 Ergebnisse der Hörversuche ...................................................................................... 12 Thesen zur Signalverarbeitung des Gehörs................................................................. 22 Vergleich Hörversuche - binaurale Modelle ............................................................... 23

4. 4.1. 4.2. 4.3. 4.4. 4.5. 4.6.

Grundlagen der binauralen Signalverarbeitung Die Übertragungsstrecke Schallquelle-Ohr................................................................. 27 Binaurale Informationen bei Anwesenheit mehrerer Schallquellen .............................. 31 Algorithmen zur binauralen Verarbeitung der Ohrsignale ........................................... 38 Kreuzkorrelationsmodelle bei einer Schallquelle ........................................................ 39 Die Kreuzkorrelationsfunktion bei mehreren Schallquellen......................................... 39 Das komplexe Kreuzprodukt ..................................................................................... 44

5.

Algorithmen zur Auswertung interauraler Phasenunterschiede ("Phasendifferenz-Cocktail-Party-Prozessor") Forderungen an einen Cocktail-Party-Prozessor......................................................... 46 Das interaurale Kreuzprodukt.................................................................................... 46 Der Phasendifferenz-Cocktail-Party-Prozessor .......................................................... 48 Das interaurale Kreuzprodukt bei zwei Schallquellen ................................................. 48 Der Cocktail-Party-Prozessor-Algorithmus................................................................ 49 Signalverarbeitungs-Beispiele .................................................................................... 51 Eine Schallquelle mit veränderlicher Amplitude ......................................................... 55 Komplexe Schallfelder............................................................................................... 57 Das interaurale Kreuzprodukt bei beliebigen Quellen ................................................. 57 Zwei Schallquellen mit zeitveränderlichen Amplituden............................................... 59 Mehr als zwei Schallquellen mit konstanter Amplitude............................................... 61 Diffuses Schallfeld..................................................................................................... 61 Dominante Quellen.................................................................................................... 64 Abbildung von Quellenschätzern auf eine gewünschte Richtung................................. 65 Zusammenfassung ..................................................................................................... 71

5.1. 5.2. 5.3. 5.3.1. 5.3.2. 5.3.3. 5.3.4. 5.4. 5.4.1. 5.4.2. 5.4.3. 5.4.4. 5.5. 5.6. 5.7.

- VI -

6. 6.1. 6.2. 6.2.1. 6.2.2. 6.2.3. 6.2.4. 6.2.5. 6.3. 6.4. 6.5.

Algorithmen zur Auswertung interauraler Pegelunterschiede ("Pegeldifferenz-Cocktail-Party-Prozessor") Problemstellung......................................................................................................... 74 Bestimmung von Schallquellen-Parametern aus der Analyse interauraler Pegeldifferenzen........................................................................................................ 74 Eine Schallquelle ....................................................................................................... 74 Zwei Schallquellen .................................................................................................... 75 Mehr als zwei Schallquellen....................................................................................... 76 Diffuses Schallfeld..................................................................................................... 77 Dominante Quellen.................................................................................................... 79 Abbildung von Schätzern auf die gewünschte Richtung ............................................. 81 Verknüpfung von Schätzern aus interauralen Zeit- und Pegeldifferenzen.................... 83 Ausblick: Verbindung unterschiedlicher räumlicher Analyse- und Verarbeitungsverfahren ............................................................................................. 86

7. 7.1. 7.1.1. 7.1.2. 7.1.3. 7.2. 7.2.1. 7.2.2. 7.2.3. 7.2.4. 7.3. 7.3.1. 7.3.2.

Ein Signalverarbeitungs-Rahmen für binaurale Modelle Verarbeitung der Eingangssignale.............................................................................. 87 Frequenzgruppen-Filter ............................................................................................. 87 Erzeugung des analytischen Zeitsignals...................................................................... 89 Datenreduktion ......................................................................................................... 89 Verarbeitung der Ausgangssignale............................................................................. 91 Anforderungen an ein Resynthese-Verfahren ............................................................. 91 Anpassung der Eingangssignale an Signalschätzer...................................................... 92 Verringern der Anzahl der Ausgangskanäle ............................................................... 95 Bildung der Zeitfunktion aus Abtastwerten des analytischen Zeitsignals ..................... 95 Gesamtdarstellung des Cocktail-Party-Prozessor-Modells.......................................... 96 Modellstruktur .......................................................................................................... 96 Leistungsfähigkeit der Cocktail-Party-Prozessoren .................................................... 97

8. 8.1. 8.2. 8.3. 8.4. 8.5.

Steuerung des Cocktail-Party-Prozessors Detektionskriterien für Richtungsinformationen: Das Hören in Räumen ...................102 Dynamische Effekte der Richtungserkennung: Der Präzedenz-Effekt ........................103 Beschreibung des Präzedenz-Effekts durch ein binaurales Cocktail-Party-Prozessor-Modell ..............................................104 Konsequenzen für die Steuerung eines Cocktail-Party-Prozessors.............................106 Von der Prozessor-Steuerung zum Präzedenz-Prozessor ..........................................107

9.

Zusammenfassung und Ausblick...........................................................................108

Anhang A: Auswerteverfahren für Hörversuche...................................................................112 Anhang B: Frequenzgruppen-Modelle .................................................................................113 Anhang C: Vereinfachte Freifeld-Außenohr-Übertragungsfunktionen ..................................117 Anhang D: Ein flexibles Filterverfahren im Frequenzbereich ................................................118 Anhang E: Weitere Algorithmen zur Lösung des Cocktail-Party-Prozessor-Problems ..........123

- VII -

Anhang F: Eine Programmstruktur für komplexe Prozesse (Parallelstrukturen auf sequentiellen Rechnern)...................................................125 Anhang G: Literatur ............................................................................................................129

- VIII -

Verwendete Symbole Indices a abt b c d f FG G HE i k korr l m max min o p q r soll SQ u x

µ σ θ

Signal a Abtastung, abgetastet Signal b Signal c Diffusfeld Freifeld-Übertragungsfunktion Frequenzgruppe Gewichtungsfaktor Hörereignis Summationsindex (z.B. Frequenzlinien) Summationsindex (z.B. Frequenzlinien) Korrigierter Wert linkes Ohr auf den Bezugspunkt Kopfmitte bezogen maximal vorkommender Wert minimal vorkommender Wert obere Grenze der Frequenzgruppe Summationsindex für Schallquellen Schallquelle (auch Summationsindex) rechtes Ohr Wert der Sollrichtung Schallquelle untere Grenze der Frequenzgruppe Parameter eines beliebigen Schätzers x (x= a oder b) Mittelwert Standardabweichung Einfallswinkel

Exponenten ' + *

Schätzer Kreuzleistungsdichte eines Signals konjugiert komplex

- IX -

Formelzeichen a(t) am(t) am'(t) am(t) A(f) Am(t)² Am'(t)² Am(f,τ) Am+(f,t)² AntwB b(t) bm(t) bm'(t) bm(t) B(f) Bm(t)² Bm'(t)² Bm(f,τ) Bm+(f,τ)² cschall d d(t) Em'² em θ f fabt fkorr fm fmin fmax fo foi fu fui f()

F F

Zeitfunktion des Schallsignals a Zeitfunktion des Schallsignals a am Bezugspunkt Kopfmitte Schätzer für den auf Kopfmitte bezogenen Betrag des Schallsignals analytische Zeitfunktion des Schallsignals a am Bezugspunkt Kopfmitte Fourier-Transformierte des Schallsignals a Quellenvektor (Bezugspunkt Kopfmitte) Quellenschätzer (Bezugspunkt Kopfmitte) auf Kopfmitte bezogene Fourier-Transformierte des Schallsignals a spektrale Kreuzleistungsdichte des Schallsignals a(t) am Bezugspunkt Kopfmitte Antwortbereich für Hörversuche (z.B. ±90°) Zeitfunktion eines Schallsignals b Zeitfunktion des Schallsignals b am Bezugspunkt Kopfmitte Schätzer für den auf Kopfmitte bezogenen Betrag des Schallsignals analytische Zeitfunktion des Schallsignals b am Bezugspunkt Kopfmitte Fourier-Transformierte des Schallsignals b Quellenvektor (Bezugspunkt Kopfmitte) Quellenschätzer (Bezugspunkt Kopfmitte) Fourier-Transformierte des Schallsignals am Bezugspunkt Kopfmitte spektrale Kreuzleistungsdichte des Schallsignals b(t) am Bezugspunkt Kopfmitte Schallgeschwindigkeit Mikrofonabstand interaurale Differenz Leistungsdichte im diffusen Schallfeld analytisches Zeitsignal von Spiegelschallquellen Frequenz Abtastfrequenz Korrekturfaktor Mittenfrequenz des Frequenzgruppen-Filters untere Grenze des Übertragungsbereiches obere Grenze des Übertragungsbereiches obere Grenzfrequenz obere Grenzfrequenz der Frequenzgruppe i untere Grenzfrequenz untere Grenzfrequenz der Frequenzgruppe i Funktion von Fangbereich um eine Schallquelle, in dem Hörereignisse als korrekt lokalisiert gelten Fourier-Transformierte

-X-

F-1

FG g Gm'² hl(t,τ) hr(t,τ) Hl(f,τ) Hlf(f,τ) Hm(f,τ) Hqk(f,τ) Hql(f,τ) Hqr(f,τ) Hr(f,τ) Hrf(f,τ) Hrl(f,τ) HE k(t) l(t) l(t) L(f) LG Lt noi nui M, N NHE NSQ r(t) r(t) R(f) s sm sm'² Sm'² Srl(τ) Srl(τ,t) Srl(f,t) SE

inverse Fourier-Transformierte Frequenzgruppe Bewertungsfaktor Ausgleichs-Signal für Korrekturverfahren Außenohr-Impulsantwort des linken Ohres Außenohr-Impulsantwort des rechten Ohres Übertragungsfunktion linkes Ohr - "Kopfmitte" Freifeld-Außenohr-Übertragungsfunktion des linken Ohres Freifeld-Übertragungsfunktion Kopfposition - "Kopfmitte" Freifeld-Übertragungsfunktion Quelle - Kopfposition Übertragungsfunktion Quelle - linkes Ohr Übertragungsfunktion Quelle - rechtes Ohr Übertragungsfunktion rechtes Ohr - "Kopfmitte" Freifeld-Außenohr-Übertragungsfunktion des rechten Ohres interaurale Übertragungsfunktion Hörereignis Kreuzprodukt reelle Zeitfunktion des linken Ohrsignals. analytisches Zeitsignal des linken Ohrsignals. Fourier-Transformierte des linken Ohrsignals. Lokalisationsgrad: Grad der Übereinstimmung von Schallereignis- und HörereignisRichtung Lateralisation (-10=links, 0=mitte, 10=rechts) Flankensteilheit der hochfrequenten Filterflanke der Frequenzgruppe i Flankensteilheit der niederfrequenten Filterflanke der Frequenzgruppe i Gesamtanzahl Anzahl der Hörereignisse bei einem Versuch Anzahl der Schallquellen reelle Zeitfunktion des rechten Ohrsignals. analytisches Zeitsignal des rechten Ohrsignals. Fourier-Transformierte des linken Ohrsignals. Signal der Sollrichtung Signal der Sollrichtung am Bezugspunkt Kopfmitte Schätzer für die Leistung des Signal der Sollrichtung am Bezugspunkt Kopfmitte Schätzer für den Quellenvektor der Sollrichtung (Bezugspunkt Kopfmitte) Kreuzkorrelationsfunktion gleitende Kreuzkorrelationsfunktion Fourier-Transformierte der gleitenden Kreuzkorrelationsfunktion Schallereignis

- XI -

t T Tµ Vers VP wr w(t) W(f) Wx x xm'² Xm'²

α α' β β' βx' ∆f ∆f L ∆fL2 ∆fFG ∆L µ µl µr Φ ∆Φab Ω σ σl σr τ τ' τL τmax τm τo θ

Zeit Zeitintervall Integrationszeit zur Bestimmung statistischer Parameter Versuch (Nummer) Versuchsperson (Nummer) Rate-Wahrscheinlichekeit Fensterfunktion Fourier-Transformierte der Fensterfunktion Bewertungsfunktion für den Schätzer x beliebiger Schätzer (x = a oder b) Leistung eines beliebigen Schätzers am Bezugspunkt Kopfmitte beliebiger Quellenschätzer (Bezugspunkt Kopfmitte) interaurale Dämpfung Schätzer für die interaurale Dämpfung interaurale Phase Schätzer für die interaurale Phase interaurale Phase des beliebigen Quellenschätzers Xm'² (Mitten-)Frequenzdifferenz bei den Hörversuchen (Mitten-)Frequenzdifferenz, ab der eine Schallquelle korrekt lokalisierbar wird. (Mitten-)Frequenzdifferenz, ab der beide Schallquellen gleichzeitig korrekt lokalisierbar werden. Bandbreite einer Frequenzgruppe interaurale Pegeldifferenz komplexer Mittelwert der Kreuzkorrelationsfunktionen oder des Kreuzprodukts Mittelwert des quadratischen Betrags des linken Ohrsignals Mittelwert des quadratischen Betrags des rechten Ohrsignals Signalphase Differenz der Signalphasen der Signale a und b Momentankreisfrequenz komplexe Standardabweichung der Kreuzkorrelationsfunktion oder des Kreuzprodukts Standardabweichung des quadratischen Betrags des linken Ohrsignals Standardabweichung des quadratischen Betrags des rechten Ohrsignals interaurale Zeitdifferenz Verschiebungsparameter (Kreuzkorrelationsfunktion) Normierte interaurale Zeitdifferenz (±90° entspricht ±625µs) maximale interaurale Laufzeit mittlere interaurale Laufzeit im betrachteten Frequenzbereich. mittlere Laufzeit Quelle-Emfänger Einfallswinkel