Tamanho e posição por plataforma.
O maior erro é usar o mesmo estilo de legenda em todas as plataformas. Feed no celular e feed no desktop são contextos de leitura diferentes. Legendas que parecem ok no YouTube desktop ficam ilegíveis em 9:16 no celular, e legendas dimensionadas para o TikTok parecem grandes demais no YouTube.
Padrões que rodam nas comunidades de criadores (não são specs publicadas pelas plataformas, são convenções gerais; ajuste para sua audiência):
Peso da fonte importa mais que a escolha da fonte. Sans-serif em negrito (Inter Bold, Montserrat SemiBold, Helvetica Black) sobrevive em fundo carregado no celular; fontes finas somem. Texto branco com contorno preto grosso funciona em quase tudo. A própria orientação de anúncios do LinkedIn recomenda 4:5 vertical ou 1:1 quadrado para performance no feed, então o dimensionamento de 1:1 acima é o padrão mais seguro para audiências profissionais.
Embutidas vs opcionais.
A maioria das plataformas suporta legendas soft: legendas opcionais que o espectador precisa ativar. Mesmo assim, a maioria dos criadores embute a legenda no vídeo, por três motivos específicos:
Considerando que a maior parte significativa do vídeo social é assistida sem som, embutir a legenda troca flexibilidade por exibição garantida.
Uma exceção: YouTube long-form. Suba legendas soft (um arquivo .srt) por acessibilidade e SEO. O YouTube indexa a transcrição na busca. Mesmo assim, embuta a legenda visualmente nos primeiros 30 segundos, porque essa é a janela crítica de retenção em que você não pode confiar que a legenda fechada está ativa.
O que o estilo da legenda diz sobre você.
Legendas são o elemento de design mais visível na maioria dos vídeos de criador. Se as suas têm cara de template (o padrão do Submagic com palavra-a-palavra saltitante, a fonte padrão do CapCut), o espectador registra que você usou uma ferramenta. Não é necessariamente ruim, mas não tem distinção. Legendas que combinam com a sua marca (sua fonte, sua cor, seu ritmo) passam a sensação de pensado, coisa que preset padrão não passa.
Animação é separada do estilo. As legendas animadas palavra-a-palavra que dominam o TikTok são uma convenção do short-form: parecem certas no short-form e exageradas em qualquer outra coisa. Se você publica nas várias plataformas a partir da mesma fonte, legendas estilizadas estáticas viajam melhor que as animadas.
Como fazer no Sapari.
Faça upload da gravação
Legendas são geradas na mesma análise de silêncio, falsos inícios e limpeza de áudio.
Escolha a proporção primeiro
Os padrões se adaptam automaticamente a cada formato.
Sobrescreva se precisar
Fonte, cor, posição, fundo e destaque palavra-a-palavra são editáveis.
Exporte com legenda embutida
Exportar SRT está no roadmap; hoje a legenda é renderizada dentro do vídeo.
As legendas são regeneradas automaticamente depois de cada corte, então remoção de silêncio e descarte de falso início não quebram o tempo.
Perguntas comuns.
Devo manter o "é..." na legenda se cortei do áudio?
Não. Se o áudio corta, a legenda também tem que cortar. Ferramentas que rodam remoção de silêncio e legendagem em passos separados às vezes ficam fora de sincronia aqui. Um pipeline bom regenera a legenda depois da edição.
E áudio em outro idioma?
Legende no idioma falado. Auto-tradução é uma decisão à parte. Plataformas tratam audiências multilíngues de jeitos diferentes e a resposta certa depende da sua audiência.
Preciso me preocupar com quebras de linha?
Para short-form, sim: de uma a três palavras por linha lê melhor do que deixar quebrar sozinho. Para long-form, quebras automáticas nos limites de frase resolvem.
Qual é a menor legenda que dá pra usar?
Num feed de celular em 9:16, 56px é o piso prático. Abaixo disso, gente mais velha não consegue ler com conforto.