Abbildung
Die Fähigkeit eines wirklich guten Stereosystems, das musikalische Geschehen dreidimensional abzubilden, ist sicherlich einer der eindrücklichsten Erfahrungen und letztlich die hohe Kunst in der Stereophonie. In Zeiten, in denen Musik überwiegend über Kopfhörer, Blutooth Lautsprecher oder Soundbars/Mehrkanal-systeme gehört wird, scheint eine klassische Stereoanlage recht antiquiert. Sie vermag aber die Illusion, „der/die Musiker sind physisch anwesend“, erfolgreicher zu erzeugen als jedes andere Format – meines Erachtens auch besser als Mehrkanalsysteme.
Dort wird zwar durch die Anzahl der Kanäle und Lautsprecher eine größere Immersion erzielt, aber Ortbarkeit, Tiefenstaffelung sowie die für die Illusion wichtige „Körperhaftigkeit“ der Musik erreicht nicht das Niveau einer gut eingestellten Stereoanlage. An dieser Stelle ist es wahrscheinlich ratsam darauf hinzudeuten, dass die Musikanlage nur die Zutaten liefert, die Komposition selbst - also die Zusammensetzung der gelieferten Bausteine zu einer möglichst perfekten Illusion- erfolgt im Kopf des Hörers. Je besser die Zutaten, desto einfacher ist die „Hirnarbeit“, desto „realer“ ist die Illusion.
Die Zutatenliste ist nahezu endlos und sie schließt genau genommen auch die Tagesverfassung des Hörers mit ein. Ist man gestresst, hat man den nächsten Termin im Kopf, dann kann sich ein immersives Erlebnis nicht einstellen. Bevor ich jedoch auf die mehr offensichtlichen, technischen Zutaten eingehe, lohnt ein kurzer vereinfachter Blick auf die Aufnahme von Musik und darauf, wie Töne (Musik ist die Summation von Tönen in einer geordneten, nachvollziehbaren Abfolge – Geräusche sind eher die chaotische Summation von Tönen) technisch beschrieben werden.
Träger der Akustik ist die Luft die uns umgibt – im luftleeren Raum existiert kein Ton, keine Musik, kein noch so winzig hörbares Ereignis. Schall ist die periodische, sich wiederholende Verdichtung und Entspannung von Luft – oder einer anderen Materie (Körperschall). Wird an einer Stelle Schall erzeugt, erfolgt die Ausbreitung oder Übertragung mit Schallgeschwindigkeit (in Luft ca. 340 m/s). Die Schallwelle beinhaltet im wesentlichen drei Informationen – Frequenz (wie schnell ist die Abfolge der Verdichtungen und Entspannungen), Amplitude (wie stark wird die Luft verdichtet) und Phase (wie stehen Verdichtungen/Entspannung im zeitlichen Verhältnis zu anderen Schallereignissen). Diese Information kann nun an anderer Stelle aufgenommen werden, durch ein Trommelfell, Sinneshärchen oder technisch mit Hilfe eines Mikrofons. Natürliche Schallereignisse sind in der Regel sehr komplex und beinhalten somit eine hohe Informationstiefe – im Gegensatz zu einem simplen Sinuston, erzeugt durch einen Frequenzgenerator.
Die Evolution hat es den Lebewesen ermöglicht, Informationen aus den Schallereignissen zu extrahieren und für ihr Überleben zu nutzen. Aus den simplen Parametern Frequenz, Amplitude und Phase können somit Information über die Distanz, die Richtung und das Bedrohungspotential des Ereignisses „herausgehört“ werden. Dabei wird die Information mit der eigenen Datenbank im Kopf permanent abgeglichen, um „Gefahr“ von „keine Gefahr“ zu unterscheiden. Nun unterstelle ich Audiophilen eine positive Grundeinstellung zu Musik und viele werden regelmäßig durch den Besuch von Livekonzerten ihre Datenbank mit Informationen gefüttert haben. Sie haben eine klare Vorstellung von dem Klang einer Geige, einer Gitarre, mithin von der richtigen Tonalität – ein Thema für ein noch folgendes Kapitel. Bei der Abbildung eines Musikereignisses hilft uns unsere Datenbank nur bedingt weiter – wer war schon dabei, als die Aufnahme entstand.
Zudem wird die Abbildung häufig erst im Mix festgelegt, unabdingbar bei jeder Studioaufnahme. Die räumliche Abbildung des Ereignisses müssen wir also aus Frequenz, Amplitude und Phase im Moment des Hörens „herauslesen“. Für die räumliche Orientierung braucht es mindestens 2 Sensoren. Eventuell auch genau 2 Sensoren – es scheint zumindest das favorisierte Konzept der Natur zu sein. Die meisten höheren Lebensformen haben genau 2 Augen und 2 Ohren für die räumliche Erfassung ihrer Umwelt. Die Sensoren liegen nun nicht auf gleicher Stelle, sondern haben einen definierten Abstand. Nur so kann eine weitere Informationsebene eingezogen werden – nämlich der Unterschied zwischen beiden Sensorinformationen aufgrund eines definierten Abstands. Höre ich ein Geräusch nur rechts, aber kaum links, wird die Quelle sich wohl rechts befinden (oder mein linkes Ohr ist taub, dann arbeite ich aber tatsächlich nur mit einem Sensor und die räumliche Orientierung ist dahin).
Das heißt, die Mischung der Intensitäten des Geräusches zwischen rechtem und linkem Ohr erlaubt die Orientierung mindestens in der horizontalen Achse. Wir wissen aber in Bruchteilen von Sekunden, ob ein Geräusch von vorne, hinten, oben, unten kommt, in welchem Winkel die Quelle sich befindet und in welchem Abstand. Alle diese Informationen ziehen wir alleine aus Frequenz, Amplitude und Phase, sowie dem Zeitunterschied (Phasenunterschied) beim Eintreffen eines Geräusches auf das linke bzw. rechte Ohr.
In der Stereophonie wird versucht, diese Informationen möglichst verlustfrei aufzunehmen, zu verarbeiten und wiederzugeben. An Stelle unserer selbst bzw. unserer Ohren wird ein Mikrofonpaar genutzt, um dem musikalischen Ereignis zu lauschen. Die so aufgezeichneten Informationen können örtlich und zeitlich beliebig über „umgedrehte“ Mikrofone, sprich Lautsprecher, wiedergegeben werden. Würde alles verlustfrei funktionieren, hätte man tatsächlich eine exakte Kopie. In der Realität ist das natürlich nicht so – Verluste, Ungenauigkeiten, Abweichung stellen sich an jeder Stelle der „Übertragungskette“ ein. Mikrofone, Mischpulte, Mastering, Speichermedium, Wiedergabekette, Wiedergaberaum usw. – jeder Schritt trägt zu einer Verfälschung bei.
Der Audiophile strebt eine möglichst realistische Wiedergabe an, kann aber tatsächlich nur die Wiedergabekette und den Wiedergaberaum positiv beeinflussen. Aufnahme und Aufnahmetechnik entziehen sich – sehr zu seinem Leidwesen - seiner Einflussnahme. Viele Aufnahmen entsprechen heutzutage nicht den audiophilen Ansprüchen, da das Mastering häufig auf kurzzeitige Effekte abzielt – wie ein zu grell eingestellter Fernseher im Vorführraum. Mit einer guten Aufnahme, ob analog oder digital gespeichert, und einer sorgfältig abgestimmten Anlage in einem adäquaten Raum kann ein tiefes emotionales und authentisches Musikerlebnis erreicht werden, einschließlich einer nahezu holographischen Abbildung. Aber woran erkennt man nun eine gute Abbildung?
Zunächst erzeugt eine gute Anlage die Illusion des Raums, in dem die Musik sich ereignet hat. Man „fühlt“ die Abmessung des Raums in Breite, Höhe und Tiefe. Bei sehr guten Anlagen und einer perfekten Aufnahme fühlt man diesen Raum bereits kurz bevor die Musik überhaupt einsetzt. Man wird sozusagen an den Ort des Geschehens teleportiert. Wenn auch die Basisbreite der Lautsprecher im wesentlichen die Bühnenbreite bestimmt, kann der Raum auch seitlich über die Lautsprecher hinausragen – dank eines zeitrichtigen Zusammenspiels des rechten und des linken Lautsprechers.
Gleiches gilt für die Vertikale – ein singender Gitarrenspieler wird so abgebildet, dass die Stimme „oben“ und die Gitarre weiter „unten“ zu hören ist. Die Tiefeninformation ist erfahrungsgemäß etwas kniffliger und hängt sehr von der Aufstellung der Lautsprecher und den räumlichen Gegebenheiten ab. Ein Abrücken der Lautsprecher von der Wand und der Einsatz von Diffusoren können hier Wunder wirken. Eine gut abgestimmte Anlage staffelt zudem korrekt und „fühlbar“ unterschiedliche Tiefen - also die Anordnung der Musiker /Instrumente in der Tiefe.
Erst diese Tiefenstaffelung ermöglicht ein holographisches Abbild und die plastische, körperliche Reproduktion der Musik. Eine gute Anlage baut das Bühnenbild aus der Phantommitte auf, die hinter der Ebene der Lautsprecher zu hören sein sollte. Die Distanz zwischen Lautsprecher und virtueller Bühne beschreibt dabei die Distanz der Musiker zum Mikrofon bei der Aufnahme. Natürlich hängt das auch von dem Klangcharakter der Anlage und nicht zuletzt von dem Aufnahmetechniker ab. In der Regel baut sich die Bühne aber hinter den Lautsprechern auf und diese gefühlte Distanz sollte sich über die gesamte Breite erhalten (bei vielen Systemen geht die Tiefe zu den Bühnenrändern verloren – die Bühne beschreibt somit fälschlicherweise eine Parabol).
Nur so lässt sich das eindrückliche Phänomen erfahren, dass die Lautsprecher „verschwinden“. Sie verschwinden natürlich nicht real, aber man hat als Hörer das Gefühl das sie nichts zum Klanggeschehen beitragen – sozusagen nur da „rumstehen“. Der Klang hat sich vollständig gelöst und schwebt nun im Raum. Eine weiterer wichtiger Aspekt bei der stereophonen Abbildung ist die Ortbarkeit der Instrumente und Musiker auf der audiovisuellen Bühne. Was nützt einem die nahezu perfekte Wiedergabe der Rauminformationen, wenn die Instrumente (ich schließe hier den Gesang mit ein) diffus – also verwaschen, ohne Kontur und räumlicher Abgrenzung im Raum stehen. Eventuell mit all den anderen Instrumenten zu einem Klangbrei verschmelzen und damit die Illusion zerstören.
Oder die Instrumente haben zwar ihren definierten Platz auf der Bühne, „wandern“ aber je nach Tonlage mal ein wenig nach rechts oder links – ein typisches Zeichen, dass der Frequenzgang der beiden Lautsprecher unterschiedlich ist, was häufig ein Aufstellungsproblem ist. Oder die Instrumente werden messerscharf, als Punkte oder Striche ohne Ausdehnung dargestellt – auch das entspricht nicht einer realen Konzerterfahrung. Auch hier macht die Dosis das Gift. Die Abbildungsgröße eines Instruments wird überwiegend durch die Lautstärke bestimmt und ist somit ein Stück weit variabel. Es gibt einige Audiophile, die für nahezu jedes Stück in ihrer Sammlung eine Anweisung bereithalten, bei welcher Lautstärke das Stück abgespielt werden sollte, um eine möglichst realistische Abbildungsgröße der Instrumente zu erreichen.
Technisch setzt eine gute Abbildungsfähigkeit eine Menge voraus. Ein möglichst gleicher, homogener Frequenzgang der Lautsprecher und ein zeitrichtiges Abstrahlverhalten der einzelnen Lautsprecherchassis ist zwingend – häufig finden sich Phasenkorrekturglieder in der Frequenzweiche, um das Abstrahlverhalten zu optimieren. Im Sinne des Ideals der „Punktschallquelle“ sind koaxiale Lautsprechersysteme bei der Abbildung theoretisch im Vorteil, da störende Interferenzen zwischen den Chassis aufgrund der Bauweise ausgeschlossen sind.
Nichtsdestotrotz gibt es auch hervorragend abbildende konventionelle Lautsprecher. Neben einer guten Kette aus Quellgerät und Verstärker sind meiner Erfahrung nach zwei, sehr häufig wenig beachtete Aspekte tatsächlich wesentlich für eine wirklich befriedigende Abbildung der Musik. Dies ist zum einen der Abhörraum und die Positionierung der Lautsprecher in demselben. Frühe Reflexionen mischen sich mit dem Direktschall der Lautsprecher auf unkontrollierte Weise und stören so die wichtigen Beziehungen zwischen Amplitude, Frequenz und Phase und mithin die Rauminformation. Um frühe Reflexionen (ein Problem besonders bei kleinen Räumen) zu vermeiden oder zumindest zu minimieren, sollten die Lautsprecher ein gutes Stück von der Rück- und Seitenwand entfernt aufgestellt werden. Eine Regel besagt, dass der optimale Abstand zur rückwärtigen Wand bei etwa einem Drittel der Raumlänge liegt. Der Abstand zur seitlichen Wand sollte etwa einem Meter oder mehr betragen.
Ist das nicht möglich, kann durch den Einsatz von Diffusoren an der Rückwand bzw. den Seitenwänden der Raum „psychoakustisch“ vergrößert werden – Schallanteile werden dann nicht gebündelt reflektiert, sondern ungeordnet gestreut, was unser Gehirn als größeren Raum interpretiert. Darüber hinaus trägt die Qualität der Stromversorgung nicht unerheblich zur Abbildungsfähigkeit der Anlage bei. Der sensible „Dreiklang“ zwischen Frequenz, Amplitude und Phase ist ja wesentlich für ein überzeugendes, dreidimensionales Stereobild.
Das, was wir tatsächlich hören, ist der über unsere Anlage modulierte Netzstrom. Ist der Netzstrom „unsauber“, ist auch die „Musikübertragung“ gestört bzw. erreicht nicht das volle Potential. Auf dem Markt gibt es hierzu Trenntrafos, Netzfilter oder „Power Conditioner“, wahlweise auch Geräte die einen komplett neuen, sauberen „Netzstrom“ generieren. Zudem sollten immer leistungsfähige Netzkabel verwendet werden.
Wie sensibel die Abbildungsfähigkeit der Stereoanlage auf Störungen und Unzulänglichkeiten reagiert, kann sehr anschaulich durch einen Vergleich zwischen verlustfreien Musikdateien (flac; alac; wmv) und verlustbehafteten Musikdateien, beispielsweise mp3, demonstriert werden. Während Tonalität und Dynamik weitgehend erhalten bleiben, bricht die Bühne bei verlustbehafteten Dateien buchstäblich zusammen.
Offensichtlich müssen alle Faktoren „passen“, die akustische Information maximal unverfälscht an unser Ohr gelangen – erst dann eröffnet sich die ganze Weite des musikalische Geschehens. Somit zeigt sich gerade bei der dreidimensionalen, holographischen Abbildung der Musik die hohe Kunst der Stereophonie.