TTSbox
Clonagem de voz para TTSProcessamento localSem cadastroDownload WAV

Clonagem de voz para síntese de fala

Forneça uma amostra de voz autorizada, digite texto e gere nova fala diretamente no navegador. Use apenas vozes que você possui ou tem permissão para clonar.

1
2
3

Modelo de voz local

Armazenado em cache após o primeiro carregamento

Envie apenas sua própria voz ou uma voz com autorização explícita.

1
2
3

Guia

Como usar a clonagem de voz para síntese

Fluxo de trabalho

Como funciona a clonagem de voz

3 passos para clonar uma voz.

Ver detalhes
  1. Carregar modelo: O modelo de voz IA (~150 MB) é baixado para o cache. Uma vez por idioma.
  2. Escolher fonte: Selecione «Clonar uma voz» e envie um clip autorizado de 5–10 s.
  3. Gerar: Digite texto (até 1500 caracteres) e gere um WAV.

A clonagem é uma fonte de voz opcional no fluxo TTS.

Privacidade

Processamento local, sem envio

Sua amostra permanece no navegador.

Ver detalhes
  • Sem envio de amostra ou áudio gerado.
  • Processamento local via WebGPU.
  • Sem cadastro ou chaves API.
  • WAVs salvos no seu dispositivo.
Fonte de voz

Voz integrada ou clonagem

Duas opções de fonte.

Ver detalhes
  • Voz integrada: Vozes sintéticas licenciadas.
  • Clonar voz: Envie um clip de 5–10 s ou grave diretamente.
Idiomas

Geração de voz multilíngue

6 idiomas suportados.

Ver detalhes
  • Inglês, francês, alemão, espanhol, português, italiano
  • Cada idioma requer download (~150 MB).
  • Vozes licenciadas disponíveis para cada idioma.
Requisitos

Requisitos técnicos

O que você precisa.

Ver detalhes
  • Navegador: Chrome ou Edge desktop.
  • API: WebGPU habilitado.
  • Hardware: GPU. Mobile não recomendado.
  • Armazenamento: ~150 MB cache por idioma.
Casos de uso

Quem usa clonagem de voz?

Ideal para

  • Criadores testando narrações antes do estúdio
  • Desenvolvedores explorando IA de áudio
  • Pesquisadores avaliando inferência local
  • Equipes prototipando clonagem segura

Não para

  • Falsidade ideológica ou mídia enganosa
  • Fraude ou phishing
  • Uso comercial sem licença de voz

FAQ

Frequently asked questions

A clonagem é uma ferramenta separada?
Não. É uma fonte de voz opcional no fluxo TTS do TTSBox.
Como funciona no navegador?
TTSBox carrega um modelo (~150 MB). Você fornece uma amostra, digita texto e o modelo gera fala via WebGPU.
Preciso de conta?
Não. TTSBox é gratuito, sem cadastro ou servidor.
Quais idiomas?
Inglês, francês, alemão, espanhol, português e italiano. Cada ~150 MB.
Duração da amostra?
5–10 segundos em ambiente silencioso. Máximo 15 segundos.
No celular?
Não recomendado. Requer WebGPU e GPU. Use navegador desktop.
Diferença da clonagem cloud?
Local roda no seu dispositivo. Cloud processa em servidores mas exige upload dos seus dados.