Eleven v3
Eleven v3는 오디오 태그와 다국어 지원을 갖춘 다중 화자용 표현력 높은 대화형 음성 생성 모델입니다.
Eleven v3 텍스트 음성 변환
순서가 있는 대화 줄입니다. 각 항목에는 텍스트와 ElevenLabs 음성 ID가 포함됩니다.
생성되는 발화가 얼마나 안정적이거나 다양하게 들릴지 조절합니다.
대화용 언어 힌트입니다. Auto를 선택하면 모델이 자동으로 추론합니다.
결과
결과가 여기에 표시됩니다
비용: $0.12/1000 문자
Eleven v3 API 구현 가이드
Eleven v3 주요 정보
기능
- 텍스트 음성 변환
요금
텍스트 음성 변환
$0.12 / 1000 문자
모든 대사 줄의 입력 문자를 합산해 1000자당 $0.12가 청구됩니다.
활용 사례
출력 형식
Eleven v3 API 문서
먼저 플레이그라운드에서 실행한 뒤, 통합을 위해 전체 API 문서를 여세요.
소개
텍스트에서 표현력 있는 다중 화자 대화 음성을 생성합니다
코드 예제
1curl -X POST https://api.modelhunter.ai/api/v1/elevenlabs/text-to-speech \2-H "Authorization: Bearer YOUR_API_KEY" \3-H "Content-Type: application/json" \4-d '{5"model": "elevenlabs/text-to-dialogue-v3",6"input": {7"dialogue": [8{9"text": "[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?",10"voice": "TX3LPaxmHKxFdv7VOQHJ"11},12{13"text": "[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.",14"voice": "cgSgspJ2msm6clMCkdW9"15}16],17"language_code": "auto"18}19}'
스키마
전체 API 문서 보기입력
model이 기능에 대한 모델 ID입니다.
값: elevenlabs/text-to-dialogue-v3
dialogue순서가 있는 대화 줄입니다. 각 항목에는 텍스트와 ElevenLabs 음성 ID가 포함됩니다.
기본값: [{"text":"[excitedly] Hey Jessica! Have you tried the new ElevenLabs V3?","voice":"TX3LPaxmHKxFdv7VOQHJ"},{"text":"[curiously] Yeah, just got it! The emotion is so amazing. I can actually do whispers now.","voice":"cgSgspJ2msm6clMCkdW9"}]
stability생성되는 발화가 얼마나 안정적이거나 다양하게 들릴지 조절합니다.
기본값: 0.5
범위: 0 부터 1
language_code대화용 언어 힌트입니다. Auto를 선택하면 모델이 자동으로 추론합니다.
옵션: auto, af, ar, hy, as, az, be, bn, bs, bg, ca, ceb, ny, hr, cs, da, nl, en, et, fil, fi, fr, gl, ka, de, el, gu, ha, he, hi, hu, is, id, ga, it, ja, jv, kn, kk, ky, ko, lv, ln, lt, lb, mk, ms, ml, zh, mr, ne, no, ps, fa, pl, pt, pa, ro, ru, sr, sd, sk, sl, so, es, sw, sv, ta, te, th, tr, uk, ur, vi, cy
기본값: auto
webhookUrl작업 완료 시 webhook 알림을 받을 URL입니다.
metadata추적을 위해 작업에 첨부하는 사용자 정의 키-값 메타데이터입니다.
응답 (HTTP 202)
success요청이 정상적으로 접수되었는지 여부입니다.
data.id고유 작업 ID입니다. 다음을 조회하여 GET /api/v1/tasks/{id} 결과를 확인합니다.
data.status작업 상태: pending, processing, completed, failed.
data.type생성 유형: text-to-speech.
data.provider공급자: elevenlabs.
data.model생성에 사용된 모델 ID입니다.
data.created_at작업 생성 시각(ISO 8601)입니다.
data.estimated_seconds작업 완료까지의 예상 시간(초)입니다.