Clonación de voz para TTSProcesamiento localSin registroDescarga WAV

Clonación de voz para síntesis de voz

Proporcione una muestra de voz autorizada, ingrese texto y genere nueva voz directamente en su navegador. Solo use voces que posea o tenga permiso para clonar.

1Cargar modelo

2Elegir voz

3Generar

Idioma

Modelo de voz local

Almacenado en caché tras la primera carga

Ingrese su texto0 / 1500

Fuente de voz

Upload voice sampleWAV, MP3, M4A, or WebM. 3–10 seconds recommended.

Suba solo su propia voz o una voz con autorización explícita.

Guía

Cómo usar la clonación de voz para síntesis

Flujo de trabajo

Cómo funciona la clonación de voz

3 pasos para clonar una voz.

Ver detalles

Cargar modelo: El modelo de voz IA (~150 MB) se descarga al caché. Una vez por idioma.
Elegir fuente: Seleccione «Clonar una voz» y suba un clip autorizado de 5–10 s.
Generar: Ingrese texto (hasta 1500 caracteres) y genere un WAV.

La clonación es una fuente de voz opcional en el flujo TTS.

Privacidad

Procesamiento local, sin envío al servidor

Su muestra permanece en el navegador.

Ver detalles

Sin envío de muestra ni audio generado.
Procesamiento local vía WebGPU.
Sin registro ni claves API.
Los WAV se guardan en su dispositivo.

Fuente de voz

Voz integrada o clonación autorizada

Dos opciones de fuente.

Ver detalles

Voz integrada: Voces sintéticas con licencia.
Clonar voz: Suba un clip de 5–10 s o grabe directamente.

Idiomas

Generación de voz multilingüe

6 idiomas soportados.

Ver detalles

Inglés, francés, alemán, español, portugués, italiano
Cada idioma requiere su descarga (~150 MB).
Voces con licencia disponibles para cada idioma.

Requisitos

Requisitos técnicos

Lo que necesita.

Ver detalles

Navegador: Chrome o Edge de escritorio.
API: WebGPU habilitado.
Hardware: GPU. Móvil no recomendado.
Almacenamiento: ~150 MB en caché por idioma.

Casos de uso

¿Quién usa la clonación de voz?

Ideal para

•Creadores probando narraciones antes del estudio
•Desarrolladores explorando IA de audio
•Investigadores evaluando inferencia local
•Equipos prototipando clonación segura

No para

•Suplantación de identidad o medios engañosos
•Fraude o phishing
•Uso comercial sin licencia de voz

FAQ

Frequently asked questions

¿La clonación es una herramienta separada?

No. Es una fuente de voz opcional en el flujo TTS de TTSBox.

¿Cómo funciona en el navegador?

TTSBox carga un modelo (~150 MB). Usted proporciona una muestra, ingresa texto y el modelo genera voz vía WebGPU.

¿Necesito una cuenta?

No. TTSBox es gratuito, sin registro ni servidor.

¿Qué idiomas?

Inglés, francés, alemán, español, portugués e italiano. Cada uno ~150 MB.

¿Duración de la muestra?

5–10 segundos en ambiente tranquilo. Máximo 15 segundos.

¿En móvil?

No recomendado. Requiere WebGPU y GPU. Use navegador de escritorio.

¿Diferencia con clonación cloud?

Local se ejecuta en su dispositivo. Cloud procesa en servidores pero requiere subir sus datos.