Dienstag, 4. April 2023

Sprach-Kompression bei SSB

 


Über dieses Thema habe ich bereits vor 18 Jahren geschrieben. Aber es ist heute noch genauso aktuell wie damals:

In der Zeit als Telefone eine Wählscheibe hatten und oft noch an der Wand hingen, war bereits klar, dass man für eine ausreichend gute Sprachkommunikation den Bereich 300 bis 3400 Hertz übertragen musste. Damit ließen sich Frauen- und Männerstimmen unterscheiden und man konnte in der Regel den Sprecher, bzw. die Sprecherin anhand der Stimme identifizieren. Dies obwohl sonore Sprecher Frequenzen bis zu 200 Hz hinunter und brillante Sprecherinnen Frequenzen bis 4000 Hz benutzen.
Im Amateurfunk wird bei SSB in der Regel oben noch etwas abgezwackt und man begnügt sich mit 300 bis 2800 Hz - also einer Bandbreite von 2500 Hz. Trotzdem können so die Sprecher – und in einem etwas geringeren Maße auch die Sprecherinnen – noch identifiziert werden. Dank der „Interpretationsfähigkeit“ unseres Gehirns.

Darum sollte man bei SSB zum Nachbar-QSO mindestens einen Abstand von 2.5 kHz einhalten. Höfliche Amateure halten 3 kHz Abstand.

Unsere Sprache weist eine sehr hohe Dynamik auf. Also einen großen Unterschied zwischen leisen und lauten Passagen. Gelingt es, die Dynamik zu verringern, steigt die Verständlichkeit unter schwierigen Bedingungen (kleiner Signal-Rauschabstand, QRM, QRN).
Mit dieser Erkenntnis wurde das „Clipping“ geboren. Man schnitt im Sender die höchsten Sprachspitzen ab und erhöhte dann den durchschnittlichen Pegel. Doch je mehr man abschneidet, desto grösser werden die Verzerrungen.
Daher suchte man nach anderen Verfahren um die Dynamik des Sprachsignals zu verringern. Aus Clippern wurden Kompressoren und schließlich sogar Sprachprozessoren. Sie alle taten vor allem eins: sie reduzierten die Dynamik der Sprache. Sie machten leise Stellen lauter und laute leiser.

Doch die Lautstärke (Sprachenergie) ist im Frequenzband nicht gleich verteilt. Vokale (die stimmhaften Laute i, u, a, o etc.) sind am stärksten und sie befinden sich im unteren Teil des Frequenzbandes, meistens unter 500 Hz. Darum sind Hundenamen reich an Vokalen ;-)
Die Konsonanten wie B, K, T, L sitzen im mittleren Teil des Sprachbandes bei etwa 1000 bis 2500 Hz. Sie sind wesentlich schwächer als die Vokale. Doch gerade sie sind essentiell für die Verständlichkeit.
Dann gibt es noch die Sibilanten, die Zischlaute. Sie sind für die Verständlichkeit weniger wichtig und liegen im oberen Teil des Sprachbandes, zum großen Teil über 3000 Hz. Während sie beim Telefon noch teilweise durchkommen, werden sie im SSB-Sender meistens abgeschnitten. Unser Gehirn rekonstruiert sie aber aus dem Kontext des Gesprochenen.
Bei der Sprachkompression im SSB-Sender muss man also darauf achten, die Konsonanten zu bevorzugen. Sie brauchen die meiste Unterstützung, damit das Sprachsignal auch unter widrigen Umständen verständlich wird.

Wer an seinem Transceiver über einen ZF-Shift verfügt oder sogar die untere und obere Grenzfrequenz des Filters einstellen kann wie bei vielen modernen Transceivern, kann leicht feststellen, wie sich die Beschneidung der Bandbreite auswirkt. Erstaunlich wie schmal man das Frequenzband machen kann, ohne viel an Verständlichkeit zu verlieren – solange man die Konsonanten „leben lässt“.


Um in SSB unter schwierigen Umständen optimal zu kommunizieren, müssen also die mittleren Frequenzen bevorzugt und die Dynamik verringert werden.
Neben analogen und digitalen Verfahren im Audio-Bereich, also zwischen Mikrofon und Modulator, kann man die Kompression auch über einen Umweg über eine "Zwischenfrequenz" bewerkstelligen.

Eine auf den ersten Blick etwas verwirrende Methode: Das Audio-Signal wird auf ein HF-Signal amplitudenmoduliert. Dann durchläuft dieses Signal einen Begrenzer (Clipper) und wird nach einem HF-Filter wieder demoduliert. Die Verzerrungen entstehen dabei im HF-Bereich und werden ausgefiltert. Das resultierende Audiosignal ist verzerrungsfrei und je nach Clippgrad mehr oder weniger komprimiert. Erst jetzt gelangt es in den richtigen Sender-Modulator.

Ein solcher HF-Clipper wurde von Joachim Münch, DJ4ZS (SK 30.8.2015), angeboten. Er passte u.a. perfekt in das MH31 von Yaesu. Dieses Mikrofon wurde mit dem FT-817, FT-857 und FT-897 geliefert. Es hat im Original eine große dynamische Kapsel. Leider nicht mit einem optimalen Frequenzgang und es klingt daher (je nach Sprecher) ziemlich dumpf. Doch Joachims Umbausatz enthielt ein Elektretmikrofon und die Modulation war ausgezeichnet. Wer heute noch ein solches Mikrofon besitzt, kann sich glücklich schätzen.
Schon im ausgeschalteten Zustand ist das modifizierte Mikrofon bereits besser, denn die Elektretkapsel ist weniger tiefenlastig als die dynamische Kapsel.
Wird der Clipper zugeschaltet, erhöht sich die mittlere Sprechleistung – Talk Power – um ca. 6 bis 9 dB.
Durch den HF-Clipper gewinnt man also mindestens eine S-Stufe. Um denselben Effekt zu erzielen, müsste man die Sendeleistung vervierfachen.

Doch Joachim ist nicht mehr und sein genialer Umbausatz gibt es auch nicht mehr. Doch moderne Geräte haben in der Regel eine eingebaute Kompressions-Schaltung. Diese sollte man unbedingt nutzen. Die Kompressoren in modernen Transceivern sind in der Regel sehr gut und beeinträchtigen die Klangqualität kaum. Ich empfehle, die Kompression immer eingeschaltet zu lassen (6 bis 10dB).  

Die PEP (Peak Envelope Power), die Spitzenleistung eines SSB-Senders verändert sich dabei nicht. Doch die mittlere Sendeleistung (Talk Power) steigt. 
PEP entspricht in der Regel der CW-Leistung des Senders und ist deshalb einfach zu messen. 
Doch die mittlere Sprechleistung zu messen, ist für den OM nicht so einfach. Es gibt aber eine Reihe von PWR/SWR-Meter bei denen man zwischen PEP und Sprechleistung (Average) umschalten kann. Doch Vergleiche zwischen Geräten lassen sich auch mit simplen Powermetern anstellen. Man braucht bloß zu beobachten um welchen Wert der Zeiger des Meters beim Sprechen schwankt. Während es beim einen Gerät bei „Eins-Zwei-Drei“ kaum den Zeiger lupft, pendelt bei einem anderen Gerät mit Kompression das Instrument um die 20 oder gar 30 Watt-Marke.
 

1 Kommentar:

  1. Unser Gehirn ist ein mächtiges Tool und dank langer Evolution knallhart auf Weak Signal Detection getrimmt. Ein Umstand den man als Eltern kennt wenn man mal wieder ein Kinderweinen im Geschirrspüler oder Kühlschrank vermutet.

    Was ich oft vermisse ist der Hinweis das die Japaner einen für unsere gutural geprägten Sprachen völlig falschen Frequenzgang haben. Da ist das abhören des eigenen Signals Pflicht. Finde ich.

    AntwortenLöschen