Eleven v3
Eleven v3 è un modello espressivo di dialogo in voce per la generazione multi-speaker con tag audio e supporto multilingue.
Eleven v3 Testo in voce
Righe di dialogo ordinate. Ogni elemento contiene testo e un ID voce ElevenLabs.
Controlla quanto deve essere stabile o variata la resa generata.
Indicazione della lingua per il dialogo. Auto lascia che il modello la rilevi.
Risultato
I risultati appariranno qui
Costo: $0.12/1000 carattere
Eleven v3 Guida all'implementazione API
Crea un account
Registrati per un account gratuito su ModelHunter.AI per iniziare.
Registrati gratuitamente →Ottieni la chiave API
Genera la tua chiave API dalla dashboard e impostala come variabile d'ambiente.
export MODELHUNTER_KEY="your_api_key"Effettua la tua prima chiamata
Consulta la documentazione API per esempi di codice completi in cURL, JavaScript e Python, inclusi il formato della richiesta, il polling e la gestione degli errori.
Visualizza la documentazione API →Eleven v3 Informazioni chiave
Funzionalità
- Testo in voce
Prezzi
Testo in voce
$0.12 / 1000 carattere
Addebito di $0.12 per ogni 1000 caratteri di input sommando tutte le righe del dialogo.
Casi d'uso
Formati di output
Eleven v3 Documentazione API
Esegui prima il playground, poi apri la documentazione API completa per i dettagli di integrazione.
Panoramica
Genera audio di dialogo espressivo multi-speaker a partire dal testo
Esempi di codice
1curl -X POST https://api.modelhunter.ai/api/v1/elevenlabs/text-to-speech \2-H "Authorization: Bearer YOUR_API_KEY" \3-H "Content-Type: application/json" \4-d '{5"model": "elevenlabs/text-to-dialogue-v3",6"input": {7"dialogue": [8{9"text": "[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?",10"voice": "TX3LPaxmHKxFdv7VOQHJ"11},12{13"text": "[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.",14"voice": "cgSgspJ2msm6clMCkdW9"15}16],17"language_code": "auto"18}19}'
Input
modelID modello per questa capacità.
Valore: elevenlabs/text-to-dialogue-v3
dialogueRighe di dialogo ordinate. Ogni elemento contiene testo e un ID voce ElevenLabs.
Predefinito: [{"text":"[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?","voice":"TX3LPaxmHKxFdv7VOQHJ"},{"text":"[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.","voice":"cgSgspJ2msm6clMCkdW9"}]
stabilityControlla quanto deve essere stabile o variata la resa generata.
Predefinito: 0.5
Intervallo: 0 a 1
language_codeIndicazione della lingua per il dialogo. Auto lascia che il modello la rilevi.
Opzioni: auto, af, ar, hy, as, az, be, bn, bs, bg, ca, ceb, ny, hr, cs, da, nl, en, et, fil, fi, fr, gl, ka, de, el, gu, ha, he, hi, hu, is, id, ga, it, ja, jv, kn, kk, ky, ko, lv, ln, lt, lb, mk, ms, ml, zh, mr, ne, no, ps, fa, pl, pt, pa, ro, ru, sr, sd, sk, sl, so, es, sw, sv, ta, te, th, tr, uk, ur, vi, cy
Predefinito: auto
webhookUrlURL per ricevere una notifica webhook quando l’attività è completata.
metadataMetadati personalizzati chiave-valore da allegare all’attività per il tracciamento.
Risposta (HTTP 202)
successSe la richiesta è stata accettata correttamente.
data.idID attività univoco. Usalo per interrogare GET /api/v1/tasks/{id} i risultati.
data.statusStato attività: pending, processing, completed, failed.
data.typeTipo di generazione: text-to-speech.
data.providerProvider: elevenlabs.
data.modelID modello usato per la generazione.
data.created_atTimestamp ISO 8601 di creazione dell’attività.
data.estimated_secondsTempo stimato in secondi fino al completamento dell’attività.