El loudness inconsistente es lo que más delata.
Lo que más delata que una grabación es de un creador y no de un estudio es el loudness inconsistente. Un espectador llega a tu video y está más bajo que el anterior. Sube el volumen. El próximo video arranca más fuerte y se asusta. Se queda con la idea de que el tuyo es "el bajito".
Toda plataforma grande normaliza el audio a un objetivo de loudness, medido en LUFS (Loudness Units relative to Full Scale):
La mayoría de las grabaciones crudas de creadores van de −28 LUFS (muy bajo) a −8 LUFS (muy fuerte, muchas veces saturado). Normalizar a −14 LUFS en todos tus videos es el único cambio que de manera más confiable hace que tu audio suene consistente con todo lo demás del feed. El punto de normalizar es coincidir con lo que la plataforma espera, así tu video se reproduce al mismo nivel percibido que lo que tiene alrededor, no simplemente más fuerte.
Las plataformas solo normalizan hacia abajo. YouTube y Spotify bajan videos demasiado fuertes, pero no suben videos demasiado bajos. Si tu grabación a −24 LUFS suena al lado de una a −14 LUFS, la tuya sigue más baja. Normalizá antes de subir.
Tu grabación tiene un piso de ruido.
Tu grabación tiene un piso de ruido lo escuches o no. Aire acondicionado, los coolers del notebook, el siseo leve de un preamplificador barato, clicks de teclado. Todo eso queda abajo de tu voz, y el cerebro del espectador lo registra como "barato" aunque no pueda nombrar qué está mal.
La reducción de ruido corta el piso de ruido sin tocar la voz. Las herramientas que lo hacen bien (iZotope RX, Adobe Enhance Speech, el Clean Sweep de Sapari, y similares) usan procesamiento por FFT para tomar muestras del ruido ambiente y restarlo de la señal de voz. Con la configuración por defecto la diferencia es sutil; con configuración agresiva la voz empieza a sonar con artefactos, como si la persona hablara a través de un filtro.
La prueba es un A/B con buenos auriculares. Si la versión sin ruido suena más apretada sin sonar procesada, estás en la agresividad correcta. Si suena demasiado limpia (como audio de estudio que perdió la textura de tu sala), bajá un poco.
Consistencia entre host e invitados.
Si hacés entrevistas, la diferencia de volumen entre participantes es la tercera cosa que más delata como amateur. Una persona grabada en un Shure SM7B local, otra en el micro del notebook por Zoom. Sin normalización, el espectador ajusta el volumen cada vez que habla otro.
La solución es pasar las dos pistas por el mismo objetivo de loudness. Si capturás en Riverside o Zencastr con pistas separadas por invitado, normalizá cada una a −14 LUFS de forma independiente y la mezcla se equilibra sola. Si solo tenés la grabación ya mezclada, las herramientas que hacen normalización por tramo pueden corregir parcialmente el desajuste, aunque las pistas separadas son siempre mejor.
Cómo hacerlo en Sapari.
Clean Sweep es un único toggle que corre la reducción de ruido más la normalización de loudness a −14 LUFS en cada clip del proyecto. Corre en el mismo pase de análisis que la eliminación de silencios y la subtitulación.
Subí la grabación
MP4, MOV o cualquier formato de video común.
Activá Clean Sweep
Un único toggle en la configuración de análisis. Corre reducción de ruido por FFT más normalización EBU R128 a −14 LUFS.
Dejá correr el análisis
La salida es audio normalizado y sin ruido en cada clip del proyecto. Corre en el mismo pase de análisis que silencios y subtítulos.
Revisá en la preview
Si algo suena sobre-procesado, apagá Clean Sweep a nivel proyecto y re-exportá.
Para podcasts con pistas separadas (Riverside, Zencastr), el procesamiento por pista está en el roadmap pero no está vivo todavía. Hacé el mixdown antes de subir.
Preguntas frecuentes.
¿La reducción de ruido va a hacer que mi voz suene robótica?
Con la configuración por defecto, no. La reducción de ruido en agresividad alta introduce artefactos, sobre todo en voces grabadas cerca de un ruido importante. El default de Sapari está ajustado para preservar los transitorios del habla.
¿Qué micro debería usar?
Un micro capaz importa de verdad. Un Blue Yeti, Shure MV7 o SM7B le gana al micro integrado del notebook por mucho. Los dinámicos como el SM7B captan menos sala, lo que facilita la post. No es lo único, pero tampoco es intercambiable.
¿Por qué tengo que normalizar igual si las plataformas normalizan al reproducir?
La normalización de las plataformas solo baja el contenido fuerte, no sube el contenido bajo. Si tu grabación está debajo de −14 LUFS, YouTube y Spotify la dejan ahí.
¿Puedo hacer esto en CapCut o Premiere?
Sí. Premiere tiene Essential Sound con medidor de loudness. CapCut tiene normalización básica. La pregunta es si querés aprender y correr esas herramientas clip por clip, o correr un único toggle por proyecto.