링크된 문서
역링크
Apify MCP 서버
Apify MCP 서버
Apify MCP 서버(Actors MCP Server)는 Apify 플랫폼에서 제공하는 Model Context Protocol(MCP) 서버 구현체입니다. 이 서버를 통해 LLM(대규모 언어 모델)은 3,000개 이상의 사전 구축된 클라우드 도구를 활용하여 웹사이트, 이커머스, 소셜 미디어, 검색 엔진, 지도 등에서 데이터를 추출할 수 있습니다.
주요 기능
- Apify Actors 통합: 다양한 웹 데이터 추출 액터 실행 및 관리
- 고급 웹 스크래핑: 복잡한 웹사이트 및 SPA(Single Page Application)에서 데이터 추출
- 작업 실행 및 모니터링: 데이터 추출 작업 실행, 상태 확인, 결과 조회
- 데이터 저장 및 조회: 추출된 데이터 관리 및 검색
- 다양한 데이터 소스 지원: 웹사이트, 이커머스, 소셜 미디어, 지도 등 다양한 소스 지원
제공 도구
Apify MCP 서버는 다음과 같은 도구를 제공합니다:
Actors 관리 도구
- list_actors: 사용 가능한 모든 액터 목록 조회
- search_actors: 특정 기준으로 액터 검색
- get_actor_details: 특정 액터의 세부 정보 조회
- list_actor_versions: 액터의 모든 버전 조회
실행 관리 도구
- run_actor: 특정 액터 실행
- get_run_details: 실행에 대한 세부 정보 조회
- get_run_status: 실행 상태 확인
- stop_run: 진행 중인 실행 중지
- delete_run: 실행 기록 삭제
데이터 관리 도구
- get_dataset_items: 특정 데이터셋의 항목 조회
- list_datasets: 모든 데이터셋 목록 조회
- download_dataset: 데이터셋 다운로드
- list_key_value_stores: 모든 키-값 저장소 목록 조회
- get_key_value_store_record: 특정 키-값 저장소에서 레코드 조회
특화된 도구
- extract_website_data: 웹사이트에서 구조화된 데이터 추출
- extract_search_results: 검색 엔진 결과 추출
- extract_social_profiles: 소셜 미디어 프로필 데이터 추출
- extract_e_commerce_data: 이커머스 사이트에서 상품 데이터 추출
- extract_map_data: 지도 서비스에서 위치 데이터 추출
설정 방법
Claude Desktop에 추가하기
Claude Desktop의 claude_desktop_config.json 파일에 다음 JSON 블록을 추가합니다:
{
"mcpServers": {
"apify-mcp": {
"command": "npx",
"args": [
"-y",
"@apify/actors-mcp-server"
],
"env": {
"APIFY_API_TOKEN": "your-apify-api-token"
}
}
}
}
Apify API 토큰 얻기
- Apify 계정에 가입 또는 로그인합니다.
- 계정 설정 → 통합에서 API 토큰을 확인하거나 새로 생성합니다.
- 생성된 API 토큰을 환경 변수
APIFY_API_TOKEN에 설정합니다.
사용 사례
- 시장 조사: 경쟁 업체 웹사이트에서 가격, 제품 정보 등 추출
- 소셜 미디어 분석: 트위터, 인스타그램, 페이스북 등에서 콘텐츠 및 트렌드 분석
- 가격 모니터링: 여러 이커머스 사이트에서 가격 변동 추적
- 리뷰 및 평점 분석: 제품 리뷰 및 평점 수집 및 감성 분석
- 지도 데이터 추출: 특정 지역의 상점, 서비스 등 위치 데이터 수집
- 구인 정보 수집: 취업 사이트에서 새로운 채용 정보 추출
- 뉴스 및 콘텐츠 모니터링: 뉴스 사이트 및 블로그에서 최신 콘텐츠 추출
인기 있는 Apify Actors
Apify는 다양한 웹 데이터 추출 작업을 위한 사전 구축된 도구(Actor)를 제공합니다:
- Web Scraper: JavaScript 렌더링을 지원하는 범용 웹 스크레이퍼
- Instagram Scraper: 인스타그램 프로필, 해시태그, 게시물 데이터 수집
- Amazon Product Scraper: 아마존 제품 정보, 가격, 리뷰 수집
- Google Maps Scraper: 구글 지도에서 비즈니스 정보 추출
- LinkedIn Jobs Scraper: 링크드인에서 구인 정보 수집
- Google Search Results Scraper: 구글 검색 결과 추출
- Twitter Scraper: 트위터 프로필, 트윗, 해시태그 데이터 수집
- Price Aggregator: 여러 온라인 상점에서 가격 정보 모니터링
데이터 추출 예시
웹사이트 데이터 추출:
{
"url": "https://example.com/products",
"selectors": {
"productList": ".product-list .product-item",
"productName": ".product-name",
"productPrice": ".product-price",
"productDescription": ".product-description"
}
}
검색 결과 추출:
{
"searchEngine": "google",
"query": "best smartphones 2025",
"maxResults": 50,
"includeRelatedQueries": true
}
소셜 미디어 프로필 추출:
{
"platform": "instagram",
"username": "exampleuser",
"extractFollowers": true,
"extractPosts": true,
"maxPosts": 20
}
보안 고려사항
- Apify API 토큰은 기밀 정보로 취급하고 안전하게 관리해야 합니다.
- 웹 스크래핑 시 해당 웹사이트의 이용 약관 및 로봇 배제 표준(robots.txt)을 준수해야 합니다.
- 개인 정보가 포함된 데이터 추출은 관련 개인 정보 보호법을 준수해야 합니다.
- 서버 부하를 방지하기 위해 요청 빈도 제한 및 속도 제어를 적용해야 합니다.
- 추출된 데이터의 저장 및 처리에 있어 데이터 보안 모범 사례를 따라야 합니다.
비용 및 리소스 관리
- Apify는 사용량 기반 요금 체계를 제공합니다(플랫폼 크레딧 또는 구독 플랜).
- 데이터 추출 작업의 복잡성, 데이터 양, 실행 빈도에 따라 비용이 달라집니다.
- 자원 소비를 최적화하기 위해 필요한 데이터만 추출하고 불필요한 중복 작업을 피하세요.
- 대규모 웹 스크래핑 작업은 분산 프록시 및 고급 설정을 사용하여 효율성을 높이세요.
라이센스
이 서버는 Apache 2.0 라이센스에 따라 라이센스가 부여됩니다.