Clonagem de voz para TTSProcessamento localSem cadastroDownload WAV

Clonagem de voz para síntese de fala

Forneça uma amostra de voz autorizada, digite texto e gere nova fala diretamente no navegador. Use apenas vozes que você possui ou tem permissão para clonar.

1Carregar modelo

2Escolher voz

3Gerar

Idioma

Modelo de voz local

Armazenado em cache após o primeiro carregamento

Digite seu texto0 / 1500

Fonte de voz

Upload voice sampleWAV, MP3, M4A, or WebM. 3–10 seconds recommended.

Envie apenas sua própria voz ou uma voz com autorização explícita.

Guia

Como usar a clonagem de voz para síntese

Fluxo de trabalho

Como funciona a clonagem de voz

3 passos para clonar uma voz.

Ver detalhes

Carregar modelo: O modelo de voz IA (~150 MB) é baixado para o cache. Uma vez por idioma.
Escolher fonte: Selecione «Clonar uma voz» e envie um clip autorizado de 5–10 s.
Gerar: Digite texto (até 1500 caracteres) e gere um WAV.

A clonagem é uma fonte de voz opcional no fluxo TTS.

Privacidade

Processamento local, sem envio

Sua amostra permanece no navegador.

Ver detalhes

Sem envio de amostra ou áudio gerado.
Processamento local via WebGPU.
Sem cadastro ou chaves API.
WAVs salvos no seu dispositivo.

Fonte de voz

Voz integrada ou clonagem

Duas opções de fonte.

Ver detalhes

Voz integrada: Vozes sintéticas licenciadas.
Clonar voz: Envie um clip de 5–10 s ou grave diretamente.

Idiomas

Geração de voz multilíngue

6 idiomas suportados.

Ver detalhes

Inglês, francês, alemão, espanhol, português, italiano
Cada idioma requer download (~150 MB).
Vozes licenciadas disponíveis para cada idioma.

Requisitos

Requisitos técnicos

O que você precisa.

Ver detalhes

Navegador: Chrome ou Edge desktop.
API: WebGPU habilitado.
Hardware: GPU. Mobile não recomendado.
Armazenamento: ~150 MB cache por idioma.

Casos de uso

Quem usa clonagem de voz?

Ideal para

•Criadores testando narrações antes do estúdio
•Desenvolvedores explorando IA de áudio
•Pesquisadores avaliando inferência local
•Equipes prototipando clonagem segura

Não para

•Falsidade ideológica ou mídia enganosa
•Fraude ou phishing
•Uso comercial sem licença de voz

FAQ

Frequently asked questions

A clonagem é uma ferramenta separada?

Não. É uma fonte de voz opcional no fluxo TTS do TTSBox.

Como funciona no navegador?

TTSBox carrega um modelo (~150 MB). Você fornece uma amostra, digita texto e o modelo gera fala via WebGPU.

Preciso de conta?

Não. TTSBox é gratuito, sem cadastro ou servidor.

Quais idiomas?

Inglês, francês, alemão, espanhol, português e italiano. Cada ~150 MB.

Duração da amostra?

5–10 segundos em ambiente silencioso. Máximo 15 segundos.

No celular?

Não recomendado. Requer WebGPU e GPU. Use navegador desktop.

Diferença da clonagem cloud?

Local roda no seu dispositivo. Cloud processa em servidores mas exige upload dos seus dados.