Samstag, 28. März 2009

Bye bye Psychoakustik

Seit etwa 10 Jahren (seit meinem Medienprojekt) hatte ich eine Psychoakustik-Klasse in meinem Melodieextraktionscode, welche die hörbaren Amplitudenmaxima in einem Fourier-Spektrum bestimmt. Es ist nämlich so, dass der Mensch in der Musik nicht alle spektralen Anteile wahrnimmt. Durch Maskierungseffekte und absolute Hörschwelle kann man vieles aus dem Audio einfach weglassen oder nur sehr vereinfacht abbilden, ohne dass der Mensch es merkt(wie bei mp3).

Nun ist es so, dass ein Peak im Spektrum per Definition eine herausragende Bedeutung besitzt. Es ist nun mal ein Maximum. Und es geht ja hier nicht um die Zuteilung von Bits zur Quantisierung der Magnitude, sondern um Sein oder Nichtsein. Der Hauptgrund für meine Psychoakustik-Klasse war die Einsparung von Rechenzeit in der weiteren Verarbeitung. Deshalb war die Implementierung sehr, sehr einfach. Wahrscheinlich zu einfach. Je mehr interessante Musikbeispiele ich ausprobiert hatte, umso mehr musste ich die Schwellwerte nach unten korrigieren. Jeder zusätzliche Peak kann bei der Bestimmung der Tonhöhen helfen. Am Ende musste ich einsehen: Durch die Anwendung der Psychoakustik konnte ich keine Rechenzeit mehr einsparen. Also hab ich die Klasse weggeschmissen.

So brauche ich schon nicht darüber in meiner Dissertation zu berichten. Und der Abschnitt über die Psychoakustik hätte schon extrem gut sein müssen - bei meinem Doktorvater ;-) Eigentlich doch sehr positiv das Ganze!

Keine Kommentare: