Nowe spojrzenie na liniowość w kolumnach głośnikowych RCF - FiRPHASE Biała Księga

2017-05-26

RCF FiRPHASE biała księga.pdf

Nowe spojrzenie na liniowość w kolumnach głośnikowych RCF

W tej białej księdze omówimy znaczenie wykluczenia zniekształceń fazowych w systemach wzmacniania dźwięku, oraz w jaki sposób RCF umożliwił, poprzez przetwarzanie FiRPHASE, osiągnąć liniowość fazową częstotliwości bez irytujących opóźnień czasowych.

Krótka historia percepcji fazy

Prawo akustyczne Georga Ohma (1843) stwierdza, że dźwięk muzyczny jest postrzegany przez ucho jako zestaw kilku składowych czystych tonów harmonicznych. Później Von Helmholtz zgodził się z prawem Ohma i pogłębił swoje przyszłe badania, mówiące, że percepcja auralna zależy tylko od widma amplitudy dźwięku i jest niezależna od kątów fazowych różnych uzupełnień zawartych w widmie.

Rys.1 - Przykładowy obraz monoauralnych zakłóceń fazowych generowanych przez system dźwiękowy, który może być wytworzony przez przetworniki, EQ, zwrotnice i wzmacniacze.

W 1841 r. August Seebeck, naukowiec z Uniwersytetu w Dreźnie, dowodził, że w jego eksperymentach różnice  w fazie są wyraźnie słyszalne. Brak fundamentalnego efektu wyjaśnia, w jaki sposób postrzeganie wysokości dźwięku może być zmienione przez różnice fazowe harmonicznych. Debata trwała przez dwadzieścia lat w czasopiśmie naukowym Annalen der Physik und Chemie, wtedy Seebeck zmarł w młodym wieku i jego wiedza została zapomniana aż do 1959r., kiedy Schroeder, w swojej pracy zatytułowanej „Nowe wyniki dotyczące czułości fazy monofonicznej” (1959), wykazał ten fenomen. Schroeder stwierdza, że wniosek Ohma jest nieprawidłowy i jest tylko prawdziwy w niektórych konkretnych przypadkach. Postuluje wówczas efekt maskowania faz Schroedera: po prostu zmieniając poszczególne składowe fazy dwóch sygnałów o identycznych obwiedniach, możliwe jest uzyskanie silnej percepcji różnicy wysokości dźwięku, na przykład podczas odtwarzania melodii.

Dzisiaj mamy kilka demonstracji, które sprzeciwiają się wcześniejszej wierze, że ludzkie ucho jest głuche na fazę, jak dzieło Lipshitz i wsp. W Journal of Audio Engineering Society w 1982 roku: „Odkryliśmy, że zniekształcenie faz w średnim paśmie można usłyszeć nie tylko na prostych kombinacjach sinusoid, ale także na wielu wspólnych sygnałach akustycznych”. Wskazał, że problemy te istnieją, ale mogą być subtelne i projektanci przetworników mogą podejmować inteligentną decyzję co do znaczenia (a nie istnienia) efektów fazowych.

W innej, późniejszej konferencji AES w 1996 r. Johansen & Rubak stwierdził, że „wniosek powinien brzmieć: nie możemy pozwolić, aby nadmiar fazy był zaniedbywany i musimy poruszać się w zagadnieniu korekcji w inny sposób”.
Percepcję widma fazowego badano także w odniesieniu do wielu tematów, takich jak akustyka hali koncertowej, percepcja wysokości dźwięku, identyfikacja samogłosek, maskowanie, przetwarzanie mowy i rendering biauralny.

0° Liniowość fazy

Rys.2 – Wizualne przedstawienie systemu idealnie liniowego.

Liniowość fazy stałej grupy opóźnienia opisują charakterystykę systemów liniowych, w których wszystkie składowe widma sygnału przemieszczają się przez ten układ z tą samą prędkością. W szczególnym przypadku system liniowo fazowy może być nazywany „faza - 0°”: wszystkie składowe widma sygnału docierają do wyjścia w tym samym czasie.

W systemie o liniowej odpowiedzi częstotliwościowej i fazie 0 ° kształt sygnału wyjściowego jest idealnie dokładną repliką sygnału wejściowego, przy czym wielkość zależy tylko od wzmocnienia systemu.

Wielodrożne kolumny głośnikowe i tradycyjne analogowe lub cyfrowe filtry drugiego rzędu są typowymi przykładami systemów nieliniowo fazowych z pewną ilością „rozmycia czasowego” ze względu na całą charakterystykę przejścia sumy elektrycznej lub odpowiedzi akustycznej.

Celem projektanta głośników jest dostarczenie „transparentnego” dźwięku, w którym głośnik może odtworzyć dźwięk możliwie najbardziej zbliżony do oryginału, co jest istotną cechą aplikacji głosowych. Jakakolwiek charakteryzacja dźwięku, taka jak korekcja lub zniekształcania, powinny być dokonywana przez np. muzyków i inżynierów dźwięku, dając im swobodę prezentowania publice własnego brzmienia. W klasycznych zastosowaniach muzycznych dźwięk może być przetwarzany doskonale, bez zmian.

Problem fali kwadratowej

 
Oryginalny sygnał fali kwadratowej na wejściu głośnika
(a)
Sygnał fali kwadratowej rekonstruowany przez głośnik z harmonicznymi poza fazą
(b)
Sygnał fali kwadratowej rekonstruowany przez głośnik z harmonicznymi w fazie

Tabela 1 -Wizualny  przykład rekonstrukcji fali prostokątnej z (a) systemu zniekształconego w fazie i (b) systemu spójnego w fazie.

Głośnik o 0° fazie dostarcza słuchaczowi wszystkie częstotliwości w tym samym czasie, bez względnych opóźnień, w wyniku prawdziwej rekonstrukcji oryginalnego dźwięku. Jednym z najbardziej istotnych i słyszalnych efektów w przejściu między „nie 0° fazie” a „0° fazie” jest optymalna rekonstrukcja transjentów. Zastanówmy się nad werblem lub uchwyceniu strun gitary: dużo energii i częstotliwości w bardzo małej ilości czasu. Jeśli częstotliwość uderzenia lub podciągnięcia przychodzą na ucho nie zbite, ale nieco rozproszone w czasie, impuls traci energię, dynamikę, detale. Można to zrozumieć za pomocą fali kwadratowej, która jest sumą głównej fali sinusoidalnej i pewnej liczby parzystych harmonicznych w wyższych częstotliwościach. Jeśli harmoniczne są opóźnione w odniesieniu do podstawy, rekonstrukcja nie powiedzie się.

Głośnik jest wykonany nie tylko z przetworników, ale filtrów wyrównujących oraz zwrotnicy odgrywających fundamentalną rolę w końcowym efekcie. Filtry analogowe lub cyfrowe filtry II rzędu powodują zniekształcenia fazowe wokół częstotliwości, na której działają, dodając je do tych już obecnych w przetwornikach.

Filtry FIR dla linearyzacji fazy

Współczesne układy DSP w celu dostarczenia sygnału o 0° fazie, umożliwiają wstępną kompensację tych zniekształceń fazowych. Najbardziej użytecznym i wydajnym sposobem jest użycie filtrów FIR (Finite Impulse Response - filtry o Skończonej Odpowiedzi Impulsowej). Filtr FIR jest tylko zbiorem współczynników, reprezentatywnych jako odpowiedź impulsowa (IR) w dziedzinie czasowej. Cyfrowy sygnał audio jest filtrowany, a tym samym zmodyfikowany przez FIR jako matematyczna operacja zwaną „splotem”.

Ten rodzaj filtrów wprowadza opóźnienie, czas potrzebny do przesłania sygnału przez całą długość filtra. Na szczęście opóźnienie czasowe jest równe dla wszystkich częstotliwości (brak relatywnych opóźnień między poszczególnymi częstotliwościami): w tym konkretnym przypadku są one nazwane fazą liniową. Filtr FIR z liniowym filtrem fazowym może manipulować korekcją amplitudy sygnału bez zniekształcania jego fazy, może działać jako Biała Księga FiRPHASE z filtrów II rzędu bez ich skutków ubocznych w fazie sygnału. Na przykład filtry FIR mogą być używane do filtru zwrotnicy zamiast wspólnych filtrów dolno i górno przepustowych II rzędu, osiągając bardzo strome zbocza bez modyfikacji fazy.

Problem opóźnień filtrów FIR

Rys.3 – Suma fazy filtru FIR z fazą głośnika.

Niestety, nie wszystko złoto co się świeci: używanie filtrów FIR ma swoją cenę. Najmniejsza częstotliwość kontrolowana przez filtr (jego rozdzielczość) jest proporcjonalna do długości filtra pod względem próbek, a tym samym do opóźnienia wprowadzanego w łańcuchu DSP. Jak pokazano w Tabeli 2, minimalna długość filtra użyteczna do zarządzania wszystkimi słyszalnymi częstotliwościami powoduje opóźnienie wynoszące 21 ms (przy częstotliwości próbkowania 48 kHz), opóźnienie niedopuszczalne w przypadku występów na żywo. Zastosowanie tego rodzaju filtrów staje się kompromisem między rozdzielczością a opóźnieniem.
Biorąc pod uwagę cenę pod kątem opóźnień, filtry FIR mogą być wykorzystane do skorygowania dużej części odchyleń fazowych od 0° tworząc pewien rodzaj delty Diraca (filtr pełno przepustowy): impuls, który nie wpływa na widmo amplitudowe sygnału, ale modyfikuje fazę, aby tymczasowo wyrównać składowe częstotliwości dźwięku.

  Częstotliwość
Próbkowania 48kHz
Częstotliwość
Próbkowania 96kHz

Liczba
próbek

Rozdzielczość
(Hz)
Opóźnienie
(ms)
Rozdzielczość
(Hz)
Opóźnienie
(ms)
32 1500 0,33 3000 0,17
256 188 2,7 375 1,3
1024 47 11 94 5,3
2048 23 21 47 11
4096 12 43 23 21

Tabela.2 – Opóźnienia wprowadzane przez filtry FIR

Tymczasowe wyrównanie elementów częstotliwości jest wyraźnie widoczne w warunkach pomiarów odpowiedzi impulsowych. Wyrównanie faz zwiększa dynamikę sygnału odtwarzanego przez głośnik, ponieważ energia jest skoncentrowana w tym samym czasie i nie rozproszona, jak w przypadku braku filtru FIR. Projekt filtru FIR dla tego konkretnego celu powinien rozpocząć się od dokładnego pomiaru fazy głośnika.

FiRPHASE

Proces RCF FiRPHASE używa tych pomiarów i próbuje odwrócić fazę głośnika bez dotykania korekcji amplitudy. Sercem zaawansowanej techniki wykorzystywanej przez FiRPHASE jest metoda rekurencyjna (metoda Mniejszych Kwadratów) w połączeniu z własnym algorytmem RCF, który oblicza najlepsze współczynniki filtru FIR ustawione zgodnie z wymuszeniami  amplitudy i fazy. Algorytm koryguje fazę i amplitudę (w razie konieczności), biorąc pod uwagę słabe punkty przetworników, rezonanse lub tłumienia spowodowane obudową głośnika. Ta technika pozwala projektantom na głęboką kontrolę fazy w średnich i  niskich częstotliwości przy użyciu stosunkowo niewielkich filtrów, osiągając wyższą rozdzielczość niż tą sugerowana przez teorię.

Bez fitru FIR Z filtrem FiRPHASE

A

B

Rys. 4
A - Odpowiedź impulsowa bez filtru FIR,
B - Odpowiedź impulsowa z filtrem FIR,
C - Krzywa Czasowa Energii bez FIR,
D - Krzywa Czasowa Energii za filtrem FIR,
E - Wykres fazy bez FIR,
F - Wykres fazy za filtrem FIR

Katalog Produktów