링크된 문서
ElevenLabs
ElevenLabs
ElevenLabs MCP 서버는 고품질 텍스트 음성 변환(TTS) API와의 통합을 제공합니다. 이 서버를 통해 LLM은 다양한 음성과 스타일로 자연스러운 음성 콘텐츠를 생성할 수 있으며, 전체 보이스오버, 오디오북, 교육 콘텐츠 등의 제작이 가능합니다. 사실적인 감정 표현과 다국어 지원으로 다양한 오디오 콘텐츠 제작에 활용할 수 있습니다.
특징
- 다양한 음성 모델: 다양한 성별, 나이, 억양을 가진 고품질 사전 제작 음성
- 사용자 정의 음성: 자신만의 고유한 음성 클론 생성 및 사용
- 감정 표현: 다양한 감정과 어조를 표현할 수 있는 고급 제어
- 다국어 지원: 영어, 한국어, 일본어, 중국어, 스페인어 등 다양한 언어 지원
- 음성 조정: 안정성, 명확성, 음색 등의 세부 파라미터 조정
- 배치 처리: 대규모 텍스트의 효율적인 음성 변환
- 스트리밍 지원: 실시간 음성 생성 및 스트리밍
- 클라우드 스토리지: 생성된 오디오 파일의 저장 및 관리
API
도구
텍스트 음성 변환 도구
- text_to_speech: 텍스트를 음성으로 변환
- 입력: 텍스트, 음성 ID, 안정성, 명확성, 기타 파라미터
-
출력: 오디오 파일 URL 또는 바이너리 데이터
-
text_to_speech_stream: 실시간 스트리밍으로 텍스트를 음성으로 변환
- 입력: 텍스트, 음성 ID, 품질 파라미터
-
출력: 오디오 스트림 URL 또는 청크 데이터
-
batch_convert: 여러 텍스트 항목을 일괄 변환
- 입력: 텍스트 항목 배열, 음성 설정
- 출력: 생성된 오디오 파일 목록
음성 관리 도구
- list_voices: 사용 가능한 음성 목록 조회
- 입력: 필터링 기준(선택적)
-
출력: 사용 가능한 음성 목록 및 세부 정보
-
get_voice_settings: 특정 음성의 기본 설정 조회
- 입력: 음성 ID
-
출력: 음성 설정 파라미터
-
clone_voice: 새로운 사용자 정의 음성 생성
- 입력: 음성 이름, 샘플 오디오 파일, 설명
- 출력: 생성된 음성 ID 및 정보
콘텐츠 관리 도구
- list_history: 이전에 생성된 오디오 항목 목록 조회
- 입력: 페이지 크기, 페이지 번호
-
출력: 오디오 항목 목록
-
get_audio: 특정 오디오 항목 정보 조회
- 입력: 오디오 항목 ID
-
출력: 오디오 메타데이터 및 URL
-
delete_audio: 오디오 항목 삭제
- 입력: 오디오 항목 ID
- 출력: 삭제 상태 및 결과
고급 설정 도구
- optimize_voice: 특정 텍스트에 맞게 음성 최적화
- 입력: 음성 ID, 샘플 텍스트, 최적화 기준
-
출력: 최적화된 설정 파라미터
-
add_voice_effect: 음성에 효과 적용(반향, 이퀄라이저 등)
- 입력: 오디오 데이터, 효과 유형, 효과 파라미터
- 출력: 수정된 오디오 데이터
사용 방법
설치
# npm을 통한 설치
npm install -g elevenlabs-mcp-server
# 또는 GitHub 저장소에서 직접 설치
git clone https://github.com/author/elevenlabs-mcp-server
cd elevenlabs-mcp-server
npm install
필요 조건
- ElevenLabs API 키가 필요합니다.
- Node.js 14 이상이 설치되어 있어야 합니다.
구성
Claude Desktop에서 이 서버를 사용하려면 다음과 같이 설정할 수 있습니다:
{
"mcpServers": {
"elevenlabs": {
"command": "npx",
"args": ["-y", "elevenlabs-mcp-server"],
"env": {
"ELEVENLABS_API_KEY": "YOUR_API_KEY",
"OUTPUT_DIRECTORY": "/path/to/output"
}
}
}
}
사용 예시
// 사용 가능한 음성 목록 조회
const voices = await list_voices();
console.log(voices.map(v => `${v.name} (${v.id})`));
// 텍스트를 음성으로 변환
const result = await text_to_speech({
text: "안녕하세요, 이것은 ElevenLabs를 통한 텍스트 음성 변환 예시입니다.",
voice_id: "21m00Tcm4TlvDq8ikWAM", // 음성 ID
model_id: "eleven_multilingual_v2", // 모델 ID
voice_settings: {
stability: 0.5,
similarity_boost: 0.75
}
});
console.log(`오디오 생성 완료: ${result.audio_url}`);
// 여러 단락을 배치로 변환
const scriptParts = [
"첫 번째 단락입니다.",
"두 번째 단락입니다.",
"세 번째 단락입니다."
];
const batchResults = await batch_convert({
texts: scriptParts,
voice_id: "EXAVITQu4vr4xnSDxMaL",
model_id: "eleven_multilingual_v2"
});
console.log(`${batchResults.length}개의 오디오 파일이 생성되었습니다.`);
연결된 구성 요소
- DaVinci Resolve - 비디오 편집 프로젝트에 생성된 음성 통합
- Video Editor - 비디오 콘텐츠에 음성 나레이션 추가
- Reaper - 생성된 음성에 고급 오디오 처리 적용
- YouTube - 음성이 포함된 콘텐츠 업로드 및 게시