MCP 문서 관리

메뉴

ElevenLabs

ElevenLabs

ElevenLabs MCP 서버는 고품질 텍스트 음성 변환(TTS) API와의 통합을 제공합니다. 이 서버를 통해 LLM은 다양한 음성과 스타일로 자연스러운 음성 콘텐츠를 생성할 수 있으며, 전체 보이스오버, 오디오북, 교육 콘텐츠 등의 제작이 가능합니다. 사실적인 감정 표현과 다국어 지원으로 다양한 오디오 콘텐츠 제작에 활용할 수 있습니다.

특징

  • 다양한 음성 모델: 다양한 성별, 나이, 억양을 가진 고품질 사전 제작 음성
  • 사용자 정의 음성: 자신만의 고유한 음성 클론 생성 및 사용
  • 감정 표현: 다양한 감정과 어조를 표현할 수 있는 고급 제어
  • 다국어 지원: 영어, 한국어, 일본어, 중국어, 스페인어 등 다양한 언어 지원
  • 음성 조정: 안정성, 명확성, 음색 등의 세부 파라미터 조정
  • 배치 처리: 대규모 텍스트의 효율적인 음성 변환
  • 스트리밍 지원: 실시간 음성 생성 및 스트리밍
  • 클라우드 스토리지: 생성된 오디오 파일의 저장 및 관리

API

도구

텍스트 음성 변환 도구

  • text_to_speech: 텍스트를 음성으로 변환
  • 입력: 텍스트, 음성 ID, 안정성, 명확성, 기타 파라미터
  • 출력: 오디오 파일 URL 또는 바이너리 데이터

  • text_to_speech_stream: 실시간 스트리밍으로 텍스트를 음성으로 변환

  • 입력: 텍스트, 음성 ID, 품질 파라미터
  • 출력: 오디오 스트림 URL 또는 청크 데이터

  • batch_convert: 여러 텍스트 항목을 일괄 변환

  • 입력: 텍스트 항목 배열, 음성 설정
  • 출력: 생성된 오디오 파일 목록

음성 관리 도구

  • list_voices: 사용 가능한 음성 목록 조회
  • 입력: 필터링 기준(선택적)
  • 출력: 사용 가능한 음성 목록 및 세부 정보

  • get_voice_settings: 특정 음성의 기본 설정 조회

  • 입력: 음성 ID
  • 출력: 음성 설정 파라미터

  • clone_voice: 새로운 사용자 정의 음성 생성

  • 입력: 음성 이름, 샘플 오디오 파일, 설명
  • 출력: 생성된 음성 ID 및 정보

콘텐츠 관리 도구

  • list_history: 이전에 생성된 오디오 항목 목록 조회
  • 입력: 페이지 크기, 페이지 번호
  • 출력: 오디오 항목 목록

  • get_audio: 특정 오디오 항목 정보 조회

  • 입력: 오디오 항목 ID
  • 출력: 오디오 메타데이터 및 URL

  • delete_audio: 오디오 항목 삭제

  • 입력: 오디오 항목 ID
  • 출력: 삭제 상태 및 결과

고급 설정 도구

  • optimize_voice: 특정 텍스트에 맞게 음성 최적화
  • 입력: 음성 ID, 샘플 텍스트, 최적화 기준
  • 출력: 최적화된 설정 파라미터

  • add_voice_effect: 음성에 효과 적용(반향, 이퀄라이저 등)

  • 입력: 오디오 데이터, 효과 유형, 효과 파라미터
  • 출력: 수정된 오디오 데이터

사용 방법

설치

# npm을 통한 설치
npm install -g elevenlabs-mcp-server

# 또는 GitHub 저장소에서 직접 설치
git clone https://github.com/author/elevenlabs-mcp-server
cd elevenlabs-mcp-server
npm install

필요 조건

  • ElevenLabs API 키가 필요합니다.
  • Node.js 14 이상이 설치되어 있어야 합니다.

구성

Claude Desktop에서 이 서버를 사용하려면 다음과 같이 설정할 수 있습니다:

{
  "mcpServers": {
    "elevenlabs": {
      "command": "npx",
      "args": ["-y", "elevenlabs-mcp-server"],
      "env": {
        "ELEVENLABS_API_KEY": "YOUR_API_KEY",
        "OUTPUT_DIRECTORY": "/path/to/output"
      }
    }
  }
}

사용 예시

// 사용 가능한 음성 목록 조회
const voices = await list_voices();
console.log(voices.map(v => `${v.name} (${v.id})`));

// 텍스트를 음성으로 변환
const result = await text_to_speech({
  text: "안녕하세요, 이것은 ElevenLabs를 통한 텍스트 음성 변환 예시입니다.",
  voice_id: "21m00Tcm4TlvDq8ikWAM", // 음성 ID
  model_id: "eleven_multilingual_v2", // 모델 ID
  voice_settings: {
    stability: 0.5,
    similarity_boost: 0.75
  }
});

console.log(`오디오 생성 완료: ${result.audio_url}`);

// 여러 단락을 배치로 변환
const scriptParts = [
  "첫 번째 단락입니다.",
  "두 번째 단락입니다.",
  "세 번째 단락입니다."
];

const batchResults = await batch_convert({
  texts: scriptParts,
  voice_id: "EXAVITQu4vr4xnSDxMaL",
  model_id: "eleven_multilingual_v2"
});

console.log(`${batchResults.length}개의 오디오 파일이 생성되었습니다.`);

연결된 구성 요소

  • DaVinci Resolve - 비디오 편집 프로젝트에 생성된 음성 통합
  • Video Editor - 비디오 콘텐츠에 음성 나레이션 추가
  • Reaper - 생성된 음성에 고급 오디오 처리 적용
  • YouTube - 음성이 포함된 콘텐츠 업로드 및 게시