Loudness inconsistente é o maior denunciador.
O maior denunciador de que uma gravação é de criador e não de estúdio é loudness inconsistente. O espectador rola até o seu vídeo e ele está mais baixo que o anterior. Ele aumenta o volume. O próximo vídeo dá autoplay mais alto e ele se assusta. Ele lembra do seu como "o vídeo baixo".
Toda plataforma grande normaliza o áudio para um alvo de loudness, medido em LUFS (Loudness Units relative to Full Scale):
A maioria das gravações cruas de criador fica entre −28 LUFS (baixo demais) e −8 LUFS (alto demais, muitas vezes clipado). Normalizar para −14 LUFS em todos os seus vídeos é a única mudança que de forma mais confiável faz seu áudio soar consistente com tudo no feed. O objetivo de normalizar é casar com o que a plataforma espera, pra seu vídeo tocar no mesmo nível percebido do que está ao redor, não simplesmente ficar mais alto.
Plataformas só normalizam pra baixo. O YouTube e o Spotify abaixam vídeos altos demais, mas não aumentam vídeos baixos demais. Se sua gravação a −24 LUFS toca ao lado de uma a −14 LUFS, a sua continua mais baixa. Normalize antes de subir.
Sua gravação tem um ruído de fundo.
Sua gravação tem um ruído de fundo, ouvindo você ou não. Ar-condicionado, ventoinha do notebook, o chiado leve de um pré-amplificador barato, clique de teclado. Tudo isso fica embaixo da sua voz, e o cérebro do espectador registra como "barato", mesmo quando ele não consegue dizer o que está errado.
Reduzir ruído corta o ruído de fundo sem mexer na voz. Ferramentas que fazem isso bem (iZotope RX, Adobe Enhance Speech, Clean Sweep do Sapari, e similares) usam processamento por FFT pra amostrar o ruído ambiente e subtrair do sinal da fala. No padrão, a diferença é sutil; no agressivo, a voz começa a soar com artefato, como se a pessoa falasse por um filtro.
O teste é comparar A/B com um fone de qualidade. Se a versão sem ruído soa mais apertada sem soar processada, você está na agressividade certa. Se ficou limpa demais (tipo áudio de estúdio que perdeu a textura da sua sala), pisa no freio.
Consistência entre host e convidado.
Se você faz entrevista, a diferença de volume entre os participantes é a terceira coisa que mais soa amadora. Um gravou em Shure SM7B local, o outro no microfone do notebook pelo Zoom. Sem normalização, o espectador mexe no volume toda vez que alguém fala.
A solução é rodar as duas faixas pelo mesmo alvo de loudness. Se você captura no Riverside ou Zencastr com faixas separadas por participante, normalize cada uma para −14 LUFS de forma independente que o mix se equilibra sozinho. Se você só tem a gravação já mixada, ferramentas que fazem normalização por trecho conseguem corrigir parcialmente o desencontro, mas faixas separadas são sempre melhor.
Como fazer no Sapari.
O Clean Sweep é um toggle único que roda redução de ruído mais normalização de loudness para −14 LUFS em todo clipe do projeto. Roda na mesma análise da remoção de silêncio e da legendagem.
Faça upload da gravação
MP4, MOV ou qualquer formato de vídeo comum.
Ative o Clean Sweep
Um toggle único nas configurações de análise. Roda redução de ruído por FFT mais normalização EBU R128 para −14 LUFS.
Deixe a análise rodar
A saída tem áudio normalizado e sem ruído em todo clipe do projeto. Roda na mesma análise de silêncio e legendas.
Confira na preview
Se algo soar processado demais, desligue o Clean Sweep no nível do projeto e reexporte.
Para podcasts com faixas separadas (Riverside, Zencastr), o processamento por faixa está no roadmap, mas ainda não vivo. Faça o mixdown antes de subir.
Perguntas comuns.
Reduzir ruído deixa minha voz com som robótico?
No padrão, não. Reduzir ruído em alta agressividade introduz artefatos, especialmente em vozes gravadas perto de ruído significativo. O padrão do Sapari é ajustado pra preservar os transientes da fala.
Qual microfone eu deveria usar?
Um microfone capaz importa muito. Blue Yeti, Shure MV7 ou SM7B ganha de um microfone embutido em notebook por uma boa margem. Dinâmicos tipo o SM7B captam menos da sala, o que facilita a pós. Não é a única coisa, mas também não é intercambiável.
Por que ainda preciso normalizar se as plataformas normalizam na hora do play?
A normalização das plataformas só abaixa conteúdo alto demais, não levanta conteúdo baixo demais. Se sua gravação está abaixo de −14 LUFS, o YouTube e o Spotify deixam onde está.
Dá pra fazer isso no CapCut ou no Premiere?
Dá. O Premiere tem Essential Sound com medidor de loudness. O CapCut tem normalização básica. A questão é se você quer aprender e rodar essas ferramentas clipe a clipe, ou rodar um toggle único por projeto.