DITHERING
Über die Bedeutung und Funktion des Dithering gibt es viel Unsicherheit. Viele DAWs exportieren Audiodaten (z. B. beim Bouncen) automatisch (voreingestellt) mit irgendeiner Form von Dithering. Das muss nicht falsch sein, wird aber vom Anwender oft gar nicht bewusst hinterfragt, zumal die Vor- oder Nachteile der verwendeten Einstellungen klanglich meist nur subtil in Erscheinung treten.
Zunächst ein Grundsatz: Dithering wird immer nur dann sinnvoll angewendet, wenn die Wortlänge (Bitbreite) heruntergerechnet wird (z. B. von 24 auf 16 Bit). Das sollte immer "so spät wie möglich" geschehen, im Idealfall erst beim Erzeugen der Master-CD, auf der die Audiodaten entsprechend dem CD-Audio-Standard im Format 44.1 kHz und 16 Bit vorliegen müssen. Das Dithering sollte im Zuge der Audio-Bearbeitung auf digitaler Ebene möglichst nur ein einziges Mal angewendet werden – und zwar dann, wenn danach kein weiteres Processing vorgesehen ist. Ein Grund, Dithering schon vorher einzusetzen, könnte höchstens sein, dass man einen Submix aus irgendwelchen Gründe in ein 16-Bit-Audiofile bouncen muss. Der Hintergrund: Dithering kann beim Verkürzen der Wortlänge (Bitbreite) = "Truncate" das Entstehen von unerwünschten Verzerrungen vermeiden helfen.
Das betrifft in erster Linie Bereiche mit sehr geringem Pegel, wo also die verringerten Wortlängen eine deutlichere Vegröberung der Auflösung mit sich bringt.
Wirkungsprinzip und Algorithmen
Um das grundsätzliche Dithering-Prinzip besser zu verstehen, lesen Sie am besten diesen Beitrag. Grob vereinfacht wird beim Dithering ein Rauschen mit extrem niedrigen Pegel dem Nutzsignal hinzugemischt. Aber es gibt verschiedene Dithering-Algorithmen, bei denen das Rauschen nach psychoakustischen Gesichtspunkten unterschiedlich gefiltert wird, sodass es möglichst den subjektiven Höreindruck verbessert. Interessanterweise ist einer der effektivsten Algorithmen auf der Basis von Noise Shaping mit der Bezeichnung "POW-r #3" derjenige, bei dem der messbare Rauschpegel am höchsten ist, dessen Rauschen aber gleichzeitig subjektiv am wenigsten wahrgenommen wird.
Die Wirkungsweise des Dithering und die Unterschiede zwischen verschiedenen Algorithmen können Sie hier hören bzw. als Wave-File (44.1 kHz, 16 Bit) downloaden:
Klangbeispiel mit linearem Dithering-Algorithmus (Breitband-Rauschen)
Klangbeispiel mit Dreieck-Dithering-Algorithmus (in mittleren Frequenzen betont)
Klangbeispiel mit dem Dithering-Algorithmus POW-r #3 (Noise Shaping)
"Noise Shaping" bedeutet vereinfacht gesagt, dass das Rauschen nach psychoakustischen Aspekten (also an der Wahrnehmungsempfindlichkeit des Ohrs orientiert) geformt/gefiltert wird.
In allen 4 Beispielen hören Sie einen letzten leisen Ton einer Piano-Aufnahme und anschließend ein paar leise Geräusche. Diese kurzen Ausschnitte entstammen einer Produktion mit Aufnahmen im Format 88,2 kHz / 24 Bit. Sie wurden hierfür auf das CD-Audio-Format (44,1 kHz / 16 Bit) "heruntergerechnet" und ohne bzw. mit den verschiedenen Dithering-Algorithmen exportiert.
Der Piano-Klang geht noch auf einen Reverb, der nach den Geräuschen ausklingt. Beachten Sie dabei bitte, dass die Audio-Files um ca. 25 dB lauter gemacht wurden, damit Sie die Unterschiede hören können. Dennoch sollten Sie diese sehr laut über hochwertige Boxen (oder noch besser: über gute Kopfhörer) anhören, um die Unterschiede deutlich zu erkennen. Achten Sie dabei besonders auf die letzte Phase im Ausklingen während und vor allem nach den durch den Pianisten verursachten Geräuschen.
Sie werden bemerken, dass im Audiofile ohne Dithering der Klang in einem "kratzigen" Geräusch verebbt, wonach dann allerdings Ruhe herrscht (bzw. nur noch das Eigenrauschen Ihres Verstärkers zu hören ist). Dieses "Kratzen" ist darauf zurückzuführen, dass die Wortlänge (Bitbreite) bei insgesamt 16 Bit bei dem extrem geringen Pegel nicht mehr ausreicht, den "Restklang" annähernd natürlich klingend aufzulösen. Das Fehlen von Dithering lässt diesen "Missklang" auch bei sehr leisem Abhören noch erkennbar werden.
Die Unterschiede der Dithering-Algorithmen
Bei allen mit Dithering bearbeiteten Files verebbt der Klang in einem mehr oder weniger deutlich wahrnehmbaren Rauschen - also in zufällig auftretenden Audio-Bytes, die dem zunehmend schlecht aufgelösten Audiosignal hinzugerechnet werden und die, sobald kein Nutzsignal mehr vorhanden ist, nur noch als Rauschen wahrnehmbar werden. Bei normaler Lautstärke wird dadurch der unnatürlich "kratzige" Klang der extrem leisen Nutzsignale kompensiert, indem - vereinfacht dargestellt - in der Summierung mit dem Dithering-Rauschen ein Summen-Signal entsteht, dessen Datenworte "im Durchschnitt" das "Nutzsignals" entsprechend psychoakustischer Prinzipien natürlicher abbildet. (Die Experten, Wissenschaftler, Toningeneure etc. unter den Lesern mögen mir diese unpräzise Darstellung verzeihen.) Sehen Sie sich zur Veranschaulichung ggf. noch mal auf dieser Webseite den Vergleich mit dem Dithering im Grafikbereich an.
Besonders effektiv wirkt dieser Effekt beim Noise-Shaping Algorithmus POW-r #3. Obwohl dessen Rauschen im Bereich der Stille (am Schluss des Audio-Files) den messbar höchsten Pegel hat, ist es bei normalem Pegel kaum noch wahrnehmbar. Der Grund dafür ist die selektive Empfindlichkeit bei der Wahrnehmung leiser Klänge. Diese ist besonders im Mittenberich (z. B. bei 2-3 kHzs) ausgeprägt – also in dem Bereich, der insbesondere vom Dreieck-Dithering-Algorithmus genutzt wird.
Nun sind solche Dithering-Effekte besonders deutlich im Ausklang z. B. einer Klaviersaite oder in der letzten Phase eines Fade-out wahrnehmbar. Es muss allerdings klar sein, dass das Dithering auch dann aktiv ist, wenn die Signale einen höheren Pegel haben - auch wenn es dann kaum auffällt. Auf vielen Audio-Systemen wird es ohnehin vom Eigenrauschen des Verstärkers oder anderer Komponenten übertönt. Aber beim Mastering müssen wir natürlich immer audiophile Konsumenten mit höchsten Ansprüchen voraussetzen.
Es muss außerdem unbedingt darauf hingewiesen werden, dass es keinen allgemeingültig besten Dithering-Algorithmus gibt. Es kommt auf die Musik an, welcher im konkreten Fall am besten passt. Beispielsweise kann bei Heavy Metal oder Grunge lineares oder dreieckiges Dithering besser geeignet sein, als bei klassischer Musik mit extremer Dynamik, wo wiederum POW-r #3 angebracht wäre. Verlassen Sie sich im Zweifelsfall immer auf Ihre Ohren!
© 2012 by W. Fiedler