Jak znormalizować głośność podcastu?

  • Normalizacja nie służy do wyrównania różnic pomiędzy głośnymi i cichymi fragmentami, do tego służy kompresja
  • Tradycyjna normalizacja nie bierze pod uwagę średniej głośności, a najgłośniejszy moment całego pliku
  • Aby nagranie miało zadaną, średnią głośność, należy skorzystać z normalizacji LUFS
  • Jak to zrobić w Audacity? Dowiesz się z tekstu.

Nagrałeś podcast albo narrację do swojego filmu, a dźwięk jest zbyt cichy i nie wiesz, jak sobie z tym poradzić? W dodatku okazało się, że zwykła normalizacja dostępna w programie, w którym pracujesz, nic nie dała. To ważne, żeby głośność tego, co wypuszczasz w świat była spójna z innymi podcacstami czy filmami. Nie chcesz przecież, żeby odbiorcy musieli rzucać się na przyciski do regulacji, bo jest zbyt cicho albo zbyt głośno. Jak o to zadbać? Już wyjaśniam.

Jak komputer zapisuje dźwięk i czym jest jego normalizacja?

Jeśli potrzebujecie superszybkiego odświeżenia informacji o tym, czym jest dźwięk, przeczytacie o tym w drugim akapicie tego tekstu.

Najprostsza forma cyfrowego zapisu dźwięku to zapisanie kolejnych liczb odpowiadających zmianom ciśnienia powietrza na mikrofonie. Pliki audio zapisane w taki sposób mają zazwyczaj rozszerzenie .WAV i nazywane są wave’ami.

Tutaj mały przykład. Taką falę moglibyśmy zapisać po prostu po kolei liczbami 1,2; 3,5 i tak dalej. Plik dźwiękowy WAV to po prostu sekwencja liczb.

Każde urządzenie rejestrujące dźwięk ma maksymalną wartość, którą może zmierzyć. Umówmy się na chwilę, że ta maksymalna wartość to 5. Co się stanie, jeśli dźwięk będzie jeszcze głośniejszy? Kiedy powinien zostać zapisany jako 6 albo 7? Komputer mimo to, zapisze „5”. I zamiast falki, będziemy mieli przez chwilę płaski wykres, czyli tzw. przester, przesterowanie. To samo dotyczy przetwarzania już nagranych plików audio (z wyjątkiem plików 32 bitowych, ale to na razie wyjątek i nie chcę teraz wchodzić w tak zaawansowaną tematykę – jeśli Cię to ciekawi, zajrzyj tutaj)

Dźwięk nieprzesterowany
Dźwięk przesterowany
Dźwięk nieprzesterowany i przesterowany

Po co o tym wszystkim wspominam? Już tłumaczę.

Jak działa zwykła normalizacja dźwięku?

Najprostsza normalizacja sprawdza, jaka jest najwyższa wartość występująca w pliku i skaluje całość tak, by pokrywała się ona z najwyższą wartością, jaką możemy zapisać.

Dźwięk przed normalizacją
Dźwięk po normalizacji. Został tylko nieznacznie zgłośniony, bo blokuje to najgłośniejszy fragment, z którego powodu nie można bardziej wzmocnić pliku bez przesterowania.

Dlaczego normalizacja nie zapewnia nam określonej głośności całego pliku? Bo to równomierne wzmocnienie całego nagrania, oparte o głośność najgłośniejszego momentu. Jeśli w całe nagranie jest ciche, ale w 15 minucie uderzyłeś w mikrofon i to jest akurat ten najgłośniejszy moment, całość będzie zgłośniona tylko trochę. A reszta i tak będzie zbyt cicha.

Jeśli więc chcesz wyrównać między sobą głośność wielu plików albo osiągnąć konkretną, postrzeganą głośność jednego z nich, taka normalizacja nie ma sensu. Co w takim razie zrobić?

Normalizacja oparta na średniej głośności pliku (LUFS)

Jeśli chcesz sprawić, żeby nagranie miało konkretną głośność jako całość, trzeba skorzystać z innej metody, która mierzy średnią głośność całości i wzmacnia lub ścisza odpowiednio cały plik.

Sposoby te są oparte o tzw. pomiar LUFS, który mierzy średnią wartość w całym pliku, a potem wprowadza jeszcze poprawkę związaną z właściwościami słuchu, dla którego różne częstotliwości o jednej amplitudzie nie są wcale równie głośne.

Z taką normalizacją jest jednak pewien problem. Wróćmy do przykładu, kiedy całe nagranie jest ciche i ma tylko jeden głośny moment. Żeby jego głośność była prawidłowa, to całość trzeba wzmocnić np. o 12 decybeli. Co jeśli przy takim wzmocnieniu ten najgłośniejszy fragment znajdzie się poza skalą, czyli poza maksymalną wartością, jaką możemy zapisać w pliku?

I tu dochodzimy do tego, dlaczego w tak wielu programach mamy tyko zwykłą “normalizację” opartą na maksymalnej wartości. Sytuacja, o której teraz wspominam (czyli wzmocnienie takie, które powoduje w jakimś momencie przekroczenie maksymalnej wartości), jest problematyczna, ponieważ nie ingerując w brzmienie, nie jesteśmy w stanie tego zrobić unikając przesterowania (czyli charczącego fragmentu z płaskim wykresem).

To trochę jakby chcieć napompować balonik zamknięty w pudełku. Do pewnego momentu będzie się zwiększać równomiernie, ale kiedy dojdzie do ścianek, to zacznie zmieniać kształt, dostosowując się do kształtu pudełka.

Potrzebne jest jeszcze narzędzie, które zapewni, że najgłośniejszy fragment w takiej sytuacji się nie przesteruje. To narzędzie nazywa się limiterem i zapewni, że po normalizacji opartej o LUFS powstanie dostaniemy dźwięk bez charczącego przesterowania.

Normalizacja bez limitera i wyraźne przesterowanie głośnego fragmentu
Normalizacja z limiterem

Tak więc normalizacja do określonej głośności wymaga użycia dodatkowo limitera. Może on być wbudowany w narzędzie, którego używasz do normalizacji, może być też użyty świadomie osobno.

Ważne też jest to, że jeśli zdecydujesz się znormalizować nagranie do zbyt wysokiej wartości, działanie limitera będzie bardzo zauważalne.

Jak w takim razie prosto i szybko znormalizować głośność nagrania w Audacity?

Nie w kazdym programie łatwo to zrobić, ale na szczęście idealną funkcję oferuje Audacity. Wystarczy kilka prostych kroków.

Najpierw dowiedz się, do jakiej wartości chcesz znormalizować audio. Jeśli jesteś na etapie obróbki nagrania podcastu, standardem jest -16 LUFS. Natomiast w przypadku dźwięku na Youtube, jest to -14 LUFS.

  1. Kiedy już znasz docelową wartość, otwórz dźwięk w Audacity, zaznacz całość (lub wybrany fragment) i upewnij się, że format ścieżki to 32-bitowy float (na 99% tak właśnie będzie).

2. Następnie wybierz z menu Efekt → Normalizacja głośności, wpisz zadaną wartość (koniecznie zaznacz opcje Postrzegana głośność oraz Traktuj mono jako dual-mono).

Dźwięk po takiej normalizacji może wydawać się przesterowany. Dzięki formatowi 32-bit float jednocześnie jest i nie jest (tekst jest dla poczatkujących i nie zagłębiam się tu w temat, jeśli jesteś ciekaw, to odsyłam tu: Magiczne 32 bity? gadesound.blogspot.com).

3. Kiedy dalej zaznaczony jest cały dźwięk, wybierz z menu Efekty Limiter i zastosuj poniższe parametry. Oczywiście można je zmieniać. Podaję jednak coś, co dla większości przypadków nagrań podcastowych będzie OK.

Po tych zabiegach dźwięk powinien mieć już docelową zadaną głośność. Jeśli w ten sposób potraktujesz nagrania, które pierwotnie miały różną głośność, po tej procedurze, będą brzmiały już spójnie.

Jeśli chcesz mocniej zagłębić się w temat, to bardzo polecam ten materiał, na zaprzyjaźnionym blogu GadeSound.

Jeśli zastanawiasz się, jaki sprzęt wybrać do nagrywania swojego podcastu albo masz kłopoty z właściwym nagraniem, umów się ze mną na bezpłatną konsultację. Pomogę Ci się odnaleźć w tym gąszczu tak, żeby dobrać odpowiedni zestaw do Twoich potrzeb.

Skomentuj