Eleven v3
Eleven v3 es un modelo expresivo de diálogo a voz para generar voces de varios hablantes con etiquetas de audio y soporte multilingüe.
Eleven v3 Texto a voz
Líneas de diálogo ordenadas. Cada elemento contiene texto y un ID de voz de ElevenLabs.
Controla qué tan estable o variada debe ser la locución generada.
Pista de idioma para el diálogo. Auto permite que el modelo lo detecte.
Resultado
Los resultados aparecerán aquí
Costo: $0.12/1000 carácter
Eleven v3 Guía de implementación de la API
Crear cuenta
Regístrese para obtener una cuenta gratuita en ModelHunter.AI para comenzar.
Regístrese gratis →Obtener clave de API
Genera tu clave de API desde el panel de control y configúrala como una variable de entorno.
export MODELHUNTER_KEY="your_api_key"Realiza tu primera llamada
Sigue la documentación de la API para ver ejemplos de código completos en cURL, JavaScript y Python, incluyendo el formato de solicitud, sondeo (polling) y manejo de errores.
Ver documentación de la API →Eleven v3 Información clave
Capacidades
- Texto a voz
Precios
Texto a voz
$0.12 / 1000 carácter
Se cobra $0.12 por cada 1000 caracteres de entrada sumando todas las líneas del diálogo.
Casos de uso
Formatos de salida
Eleven v3 Documentación de API
Primero ejecuta el playground y luego abre la documentación completa de la API para la integración.
Acerca de
Genera audio de diálogo expresivo con varios hablantes a partir de texto
Ejemplos de código
1curl -X POST https://api.modelhunter.ai/api/v1/elevenlabs/text-to-speech \2-H "Authorization: Bearer YOUR_API_KEY" \3-H "Content-Type: application/json" \4-d '{5"model": "elevenlabs/text-to-dialogue-v3",6"input": {7"dialogue": [8{9"text": "[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?",10"voice": "TX3LPaxmHKxFdv7VOQHJ"11},12{13"text": "[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.",14"voice": "cgSgspJ2msm6clMCkdW9"15}16],17"language_code": "auto"18}19}'
Entrada
modelID del modelo para esta capacidad.
Valor: elevenlabs/text-to-dialogue-v3
dialogueLíneas de diálogo ordenadas. Cada elemento contiene texto y un ID de voz de ElevenLabs.
Predeterminado: [{"text":"[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?","voice":"TX3LPaxmHKxFdv7VOQHJ"},{"text":"[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.","voice":"cgSgspJ2msm6clMCkdW9"}]
stabilityControla qué tan estable o variada debe ser la locución generada.
Predeterminado: 0.5
Rango: 0 a 1
language_codePista de idioma para el diálogo. Auto permite que el modelo lo detecte.
Opciones: auto, af, ar, hy, as, az, be, bn, bs, bg, ca, ceb, ny, hr, cs, da, nl, en, et, fil, fi, fr, gl, ka, de, el, gu, ha, he, hi, hu, is, id, ga, it, ja, jv, kn, kk, ky, ko, lv, ln, lt, lb, mk, ms, ml, zh, mr, ne, no, ps, fa, pl, pt, pa, ro, ru, sr, sd, sk, sl, so, es, sw, sv, ta, te, th, tr, uk, ur, vi, cy
Predeterminado: auto
webhookUrlURL para recibir una notificación webhook cuando se complete la tarea.
metadataMetadatos personalizados clave-valor para adjuntar a la tarea y su seguimiento.
Respuesta (HTTP 202)
successSi la solicitud fue aceptada correctamente.
data.idID único de tarea. Úsalo para consultar GET /api/v1/tasks/{id} resultados.
data.statusEstado de la tarea: pending, processing, completed, failed.
data.typeTipo de generación: text-to-speech.
data.providerProveedor: elevenlabs.
data.modelID de modelo usado para la generación.
data.created_atMarca de tiempo ISO 8601 de creación de la tarea.
data.estimated_secondsTiempo estimado en segundos hasta completar la tarea.