Eleven v3
Eleven v3 é um modelo expressivo de diálogo para fala para geração de voz com múltiplos locutores, tags de áudio e suporte multilíngue.
Eleven v3 Texto para fala
Linhas de diálogo em ordem. Cada item contém texto e um ID de voz da ElevenLabs.
Controla quão estável ou variada a locução gerada deve ser.
Dica de idioma para o diálogo. Auto permite que o modelo faça a inferência.
Resultado
Os resultados aparecerão aqui
Custo: $0.12/1000 caractere
Eleven v3 Guia de Implementação da API
Criar Conta
Cadastre-se em uma conta gratuita do ModelHunter.AI para começar.
Cadastre-se gratuitamente →Obter Chave de API
Gere sua chave de API a partir do painel de controle e configure-a como uma variável de ambiente.
export MODELHUNTER_KEY="your_api_key"Faça sua Primeira Chamada
Siga a documentação da API para exemplos de código completos em cURL, JavaScript e Python, incluindo formato de requisição, polling e tratamento de erros.
Ver Documentação da API →Eleven v3 Informações Principais
Capacidades
- Texto para fala
Preços
Texto para fala
$0.12 / 1000 caractere
Cobrança de $0.12 por 1000 caracteres de entrada somando todas as linhas do diálogo.
Casos de Uso
Formatos de Saída
Eleven v3 Documentação da API
Primeiro execute no playground e depois abra a documentação completa da API para integração.
Sobre
Gere áudio de diálogo expressivo com múltiplos locutores a partir de texto
Exemplos de código
1curl -X POST https://api.modelhunter.ai/api/v1/elevenlabs/text-to-speech \2-H "Authorization: Bearer YOUR_API_KEY" \3-H "Content-Type: application/json" \4-d '{5"model": "elevenlabs/text-to-dialogue-v3",6"input": {7"dialogue": [8{9"text": "[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?",10"voice": "TX3LPaxmHKxFdv7VOQHJ"11},12{13"text": "[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.",14"voice": "cgSgspJ2msm6clMCkdW9"15}16],17"language_code": "auto"18}19}'
Entrada
modelID do modelo para esta capacidade.
Valor: elevenlabs/text-to-dialogue-v3
dialogueLinhas de diálogo em ordem. Cada item contém texto e um ID de voz da ElevenLabs.
Padrão: [{"text":"[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?","voice":"TX3LPaxmHKxFdv7VOQHJ"},{"text":"[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.","voice":"cgSgspJ2msm6clMCkdW9"}]
stabilityControla quão estável ou variada a locução gerada deve ser.
Padrão: 0.5
Faixa: 0 até 1
language_codeDica de idioma para o diálogo. Auto permite que o modelo faça a inferência.
Opções: auto, af, ar, hy, as, az, be, bn, bs, bg, ca, ceb, ny, hr, cs, da, nl, en, et, fil, fi, fr, gl, ka, de, el, gu, ha, he, hi, hu, is, id, ga, it, ja, jv, kn, kk, ky, ko, lv, ln, lt, lb, mk, ms, ml, zh, mr, ne, no, ps, fa, pl, pt, pa, ro, ru, sr, sd, sk, sl, so, es, sw, sv, ta, te, th, tr, uk, ur, vi, cy
Padrão: auto
webhookUrlURL para receber notificação via webhook quando a tarefa for concluída.
metadataMetadados personalizados em chave-valor para anexar à tarefa e rastrear.
Resposta (HTTP 202)
successSe a solicitação foi aceita com sucesso.
data.idID único da tarefa. Use para consultar GET /api/v1/tasks/{id} resultados.
data.statusStatus da tarefa: pending, processing, completed, failed.
data.typeTipo de geração: text-to-speech.
data.providerProvedor: elevenlabs.
data.modelID do modelo usado para geração.
data.created_atTimestamp ISO 8601 de criação da tarefa.
data.estimated_secondsTempo estimado em segundos até a conclusão da tarefa.