Clonagem de voz para TTSProcessamento localSem cadastroDownload WAV
Clonagem de voz para síntese de fala
Forneça uma amostra de voz autorizada, digite texto e gere nova fala diretamente no navegador. Use apenas vozes que você possui ou tem permissão para clonar.
1
2
3
Modelo de voz local
Armazenado em cache após o primeiro carregamento
Envie apenas sua própria voz ou uma voz com autorização explícita.
Guia
Como usar a clonagem de voz para síntese
Fluxo de trabalho Como funciona a clonagem de voz
3 passos para clonar uma voz.
Ver detalhes
- Carregar modelo: O modelo de voz IA (~150 MB) é baixado para o cache. Uma vez por idioma.
- Escolher fonte: Selecione «Clonar uma voz» e envie um clip autorizado de 5–10 s.
- Gerar: Digite texto (até 1500 caracteres) e gere um WAV.
A clonagem é uma fonte de voz opcional no fluxo TTS.
Privacidade Processamento local, sem envio
Sua amostra permanece no navegador.
Ver detalhes
- Sem envio de amostra ou áudio gerado.
- Processamento local via WebGPU.
- Sem cadastro ou chaves API.
- WAVs salvos no seu dispositivo.
Fonte de voz Voz integrada ou clonagem
Duas opções de fonte.
Ver detalhes
- Voz integrada: Vozes sintéticas licenciadas.
- Clonar voz: Envie um clip de 5–10 s ou grave diretamente.
Idiomas Geração de voz multilíngue
6 idiomas suportados.
Ver detalhes
- Inglês, francês, alemão, espanhol, português, italiano
- Cada idioma requer download (~150 MB).
- Vozes licenciadas disponíveis para cada idioma.
Requisitos Requisitos técnicos
O que você precisa.
Ver detalhes
- Navegador: Chrome ou Edge desktop.
- API: WebGPU habilitado.
- Hardware: GPU. Mobile não recomendado.
- Armazenamento: ~150 MB cache por idioma.
Casos de uso
Quem usa clonagem de voz?
Ideal para
- •Criadores testando narrações antes do estúdio
- •Desenvolvedores explorando IA de áudio
- •Pesquisadores avaliando inferência local
- •Equipes prototipando clonagem segura
Não para
- •Falsidade ideológica ou mídia enganosa
- •Fraude ou phishing
- •Uso comercial sem licença de voz
FAQ
Frequently asked questions
A clonagem é uma ferramenta separada?
Não. É uma fonte de voz opcional no fluxo TTS do TTSBox.
Como funciona no navegador?
TTSBox carrega um modelo (~150 MB). Você fornece uma amostra, digita texto e o modelo gera fala via WebGPU.
Preciso de conta?
Não. TTSBox é gratuito, sem cadastro ou servidor.
Quais idiomas?
Inglês, francês, alemão, espanhol, português e italiano. Cada ~150 MB.
Duração da amostra?
5–10 segundos em ambiente silencioso. Máximo 15 segundos.
No celular?
Não recomendado. Requer WebGPU e GPU. Use navegador desktop.
Diferença da clonagem cloud?
Local roda no seu dispositivo. Cloud processa em servidores mas exige upload dos seus dados.