Forschungsergebnisse auf diesem Gebiet sind bisher u. a. von Giovanni De Poli und Piero Cosi (Universität
Padua)1
Mein Konzept für ein modulares System baut auf diesen Resultaten auf und bezieht Lösungen aus dem Bereich der automatischen Spracherkennung mit ein. Das System gliedert sich in drei Stufen, die vom Eingangsignal der Reihe nach durchlaufen werden:
Die Realisierung dieses Konzepts wird mit dem Programm MATLAB erfolgen, das eine einheitliche Umgebung für numerische Berechnung und graphische Darstellung sowie eine leichtverständliche Programmiersprache bietet. Für die Bereiche Digitale Signalverarbeitung, Gehörmodellierung (auditory modelling) und neuronale Netzwerke sind sogar spezielle „toolboxes“ erhältlich.
1. Stufe: VorverarbeitungDie Vorverarbeitung stellt eine für den gesamten Prozeß entscheidende Stufe dar, da sie bestimmt, welche Merkmale des Klangsignals an das nachfolgende neuronale Netz übermittelt und zur Klassifizierung verwendet werden. Die Aufgabe der Vorverarbeitung besteht darin, den Datenstrom so zu reduzieren, daß die für unsere Klangwahrnehmung entscheidenden Parameter bewahrt und redundante Informationen möglichst weitgehend entfernt werden. Dies geschieht in der Regel durch eine Umwandlung der eindimensionalen Wellenform-Darstellung in eine zweidimensionale Zeit-Frequenz-Repräsentation unter Berücksichtigung charakteristischer Übertragungseigenschaften des menschlichen Gehörs. Dazu gehören vor allem das Konzept der kritischen Bandbreite und die nichtlineare Reaktion der Cochlea.
|