Clonación de voz para TTSProcesamiento localSin registroDescarga WAV
Clonación de voz para síntesis de voz
Proporcione una muestra de voz autorizada, ingrese texto y genere nueva voz directamente en su navegador. Solo use voces que posea o tenga permiso para clonar.
1
2
3
Modelo de voz local
Almacenado en caché tras la primera carga
Suba solo su propia voz o una voz con autorización explícita.
Guía
Cómo usar la clonación de voz para síntesis
Flujo de trabajo Cómo funciona la clonación de voz
3 pasos para clonar una voz.
Ver detalles
- Cargar modelo: El modelo de voz IA (~150 MB) se descarga al caché. Una vez por idioma.
- Elegir fuente: Seleccione «Clonar una voz» y suba un clip autorizado de 5–10 s.
- Generar: Ingrese texto (hasta 1500 caracteres) y genere un WAV.
La clonación es una fuente de voz opcional en el flujo TTS.
Privacidad Procesamiento local, sin envío al servidor
Su muestra permanece en el navegador.
Ver detalles
- Sin envío de muestra ni audio generado.
- Procesamiento local vía WebGPU.
- Sin registro ni claves API.
- Los WAV se guardan en su dispositivo.
Fuente de voz Voz integrada o clonación autorizada
Dos opciones de fuente.
Ver detalles
- Voz integrada: Voces sintéticas con licencia.
- Clonar voz: Suba un clip de 5–10 s o grabe directamente.
Idiomas Generación de voz multilingüe
6 idiomas soportados.
Ver detalles
- Inglés, francés, alemán, español, portugués, italiano
- Cada idioma requiere su descarga (~150 MB).
- Voces con licencia disponibles para cada idioma.
Requisitos Requisitos técnicos
Lo que necesita.
Ver detalles
- Navegador: Chrome o Edge de escritorio.
- API: WebGPU habilitado.
- Hardware: GPU. Móvil no recomendado.
- Almacenamiento: ~150 MB en caché por idioma.
Casos de uso
¿Quién usa la clonación de voz?
Ideal para
- •Creadores probando narraciones antes del estudio
- •Desarrolladores explorando IA de audio
- •Investigadores evaluando inferencia local
- •Equipos prototipando clonación segura
No para
- •Suplantación de identidad o medios engañosos
- •Fraude o phishing
- •Uso comercial sin licencia de voz
FAQ
Frequently asked questions
¿La clonación es una herramienta separada?
No. Es una fuente de voz opcional en el flujo TTS de TTSBox.
¿Cómo funciona en el navegador?
TTSBox carga un modelo (~150 MB). Usted proporciona una muestra, ingresa texto y el modelo genera voz vía WebGPU.
¿Necesito una cuenta?
No. TTSBox es gratuito, sin registro ni servidor.
¿Qué idiomas?
Inglés, francés, alemán, español, portugués e italiano. Cada uno ~150 MB.
¿Duración de la muestra?
5–10 segundos en ambiente tranquilo. Máximo 15 segundos.
¿En móvil?
No recomendado. Requiere WebGPU y GPU. Use navegador de escritorio.
¿Diferencia con clonación cloud?
Local se ejecuta en su dispositivo. Cloud procesa en servidores pero requiere subir sus datos.