Como fazer áudio gravado soar profissional

Loudness inconsistente é o maior denunciador.

O maior denunciador de que uma gravação é de criador e não de estúdio é loudness inconsistente. O espectador rola até o seu vídeo e ele está mais baixo que o anterior. Ele aumenta o volume. O próximo vídeo dá autoplay mais alto e ele se assusta. Ele lembra do seu como "o vídeo baixo".

Toda plataforma grande normaliza o áudio para um alvo de loudness, medido em LUFS (Loudness Units relative to Full Scale):

Plataforma Alvo

Spotify −14 LUFS

integrado

YouTube · Amazon Music · Tidal · TikTok · Instagram −14 LUFS

integrado

Apple Music −16 LUFS

integrado

Podcasts (convenção do mercado) −16 LUFS

mono com −1 dBTP

Padrão de broadcast EBU R128 −23 LUFS

A maioria das gravações cruas de criador fica entre −28 LUFS (baixo demais) e −8 LUFS (alto demais, muitas vezes clipado). Normalizar para −14 LUFS em todos os seus vídeos é a única mudança que de forma mais confiável faz seu áudio soar consistente com tudo no feed. O objetivo de normalizar é casar com o que a plataforma espera, pra seu vídeo tocar no mesmo nível percebido do que está ao redor, não simplesmente ficar mais alto.

Plataformas só normalizam pra baixo. O YouTube e o Spotify abaixam vídeos altos demais, mas não aumentam vídeos baixos demais. Se sua gravação a −24 LUFS toca ao lado de uma a −14 LUFS, a sua continua mais baixa. Normalize antes de subir.

Sua gravação tem um ruído de fundo.

Sua gravação tem um ruído de fundo, ouvindo você ou não. Ar-condicionado, ventoinha do notebook, o chiado leve de um pré-amplificador barato, clique de teclado. Tudo isso fica embaixo da sua voz, e o cérebro do espectador registra como "barato", mesmo quando ele não consegue dizer o que está errado.

Reduzir ruído corta o ruído de fundo sem mexer na voz. Ferramentas que fazem isso bem (iZotope RX, Adobe Enhance Speech, Clean Sweep do Sapari, e similares) usam processamento por FFT pra amostrar o ruído ambiente e subtrair do sinal da fala. No padrão, a diferença é sutil; no agressivo, a voz começa a soar com artefato, como se a pessoa falasse por um filtro.

O teste é comparar A/B com um fone de qualidade. Se a versão sem ruído soa mais apertada sem soar processada, você está na agressividade certa. Se ficou limpa demais (tipo áudio de estúdio que perdeu a textura da sua sala), pisa no freio.

Consistência entre host e convidado.

Se você faz entrevista, a diferença de volume entre os participantes é a terceira coisa que mais soa amadora. Um gravou em Shure SM7B local, o outro no microfone do notebook pelo Zoom. Sem normalização, o espectador mexe no volume toda vez que alguém fala.

A solução é rodar as duas faixas pelo mesmo alvo de loudness. Se você captura no Riverside ou Zencastr com faixas separadas por participante, normalize cada uma para −14 LUFS de forma independente que o mix se equilibra sozinho. Se você só tem a gravação já mixada, ferramentas que fazem normalização por trecho conseguem corrigir parcialmente o desencontro, mas faixas separadas são sempre melhor.

Como fazer no Sapari.

O Clean Sweep é um toggle único que roda redução de ruído mais normalização de loudness para −14 LUFS em todo clipe do projeto. Roda na mesma análise da remoção de silêncio e da legendagem.

Faça upload da gravação

MP4, MOV ou qualquer formato de vídeo comum.

Ative o Clean Sweep

Um toggle único nas configurações de análise. Roda redução de ruído por FFT mais normalização EBU R128 para −14 LUFS.

Deixe a análise rodar

A saída tem áudio normalizado e sem ruído em todo clipe do projeto. Roda na mesma análise de silêncio e legendas.

Confira na preview

Se algo soar processado demais, desligue o Clean Sweep no nível do projeto e reexporte.

Para podcasts com faixas separadas (Riverside, Zencastr), o processamento por faixa está no roadmap, mas ainda não vivo. Faça o mixdown antes de subir.

Começar teste grátis Feature de limpeza de áudio →

Perguntas comuns.

Reduzir ruído deixa minha voz com som robótico? +

No padrão, não. Reduzir ruído em alta agressividade introduz artefatos, especialmente em vozes gravadas perto de ruído significativo. O padrão do Sapari é ajustado pra preservar os transientes da fala.

Qual microfone eu deveria usar? +

Um microfone capaz importa muito. Blue Yeti, Shure MV7 ou SM7B ganha de um microfone embutido em notebook por uma boa margem. Dinâmicos tipo o SM7B captam menos da sala, o que facilita a pós. Não é a única coisa, mas também não é intercambiável.

Por que ainda preciso normalizar se as plataformas normalizam na hora do play? +

A normalização das plataformas só abaixa conteúdo alto demais, não levanta conteúdo baixo demais. Se sua gravação está abaixo de −14 LUFS, o YouTube e o Spotify deixam onde está.

Dá pra fazer isso no CapCut ou no Premiere? +

Dá. O Premiere tem Essential Sound com medidor de loudness. O CapCut tem normalização básica. A questão é se você quer aprender e rodar essas ferramentas clipe a clipe, ou rodar um toggle único por projeto.

Como fazer
áudio gravado
soar profissional.

Loudness inconsistente é o maior denunciador.

Sua gravação tem um ruído de fundo.

Consistência entre host e convidado.

Como fazer no Sapari.

Faça upload da gravação

Ative o Clean Sweep

Deixe a análise rodar

Confira na preview

Perguntas comuns.

Um toggle.
Som de quase estúdio.

Como fazeráudio gravadosoar profissional.

Loudness inconsistente é o maior denunciador.

Sua gravação tem um ruído de fundo.

Consistência entre host e convidado.

Como fazer no Sapari.

Faça upload da gravação

Ative o Clean Sweep

Deixe a análise rodar

Confira na preview

Perguntas comuns.

Um toggle.Som de quase estúdio.

Como fazer
áudio gravado
soar profissional.

Um toggle.
Som de quase estúdio.