MCP 문서 관리

메뉴

문서 정보

최종 수정일:
2025-05-14 01:57

링크된 문서

browser-use

browser-use

browser-use는 도커화된 Playwright와 Chromium, VNC를 결합한 MCP 서버로, 웹 브라우저 자동화와 스크래핑을 위한 강력한 도구입니다. 이 서버는 표준 입력/출력(stdio) 및 재개 가능한 HTTP를 지원하여 다양한 환경에서 유연하게 사용할 수 있습니다.

특징

  • 도커화된 환경: Playwright와 Chromium을 도커 컨테이너에서 실행하여 격리된 환경에서 안전하게 웹 브라우저 작업 수행
  • VNC 지원: 원격으로 브라우저 활동 모니터링 및 디버깅 가능
  • 다중 전송 프로토콜: 표준 입력/출력(stdio)과 재개 가능한 HTTP 전송 모두 지원
  • 실제 브라우저 경험: 실제 브라우저를 사용하여 JavaScript가 활성화된 웹사이트와 상호작용
  • 자동화된 웹 스크래핑: 웹 콘텐츠의 자동화된 수집 및 처리 가능

API

도구

브라우저 탐색

  • navigate: 지정된 URL로 브라우저 이동
  • 입력: URL 문자열, 옵션(헤드리스 모드, 뷰포트 크기 등)
  • 출력: 탐색 성공 여부 및 페이지 정보

페이지 조작

  • click: 페이지에서 선택된 요소 클릭
  • 입력: CSS 선택자
  • 출력: 클릭 작업 성공 여부

  • fill: 입력 필드 채우기

  • 입력: CSS 선택자, 입력할 텍스트
  • 출력: 입력 작업 성공 여부

  • screenshot: 현재 페이지 또는 특정 요소의 스크린샷 생성

  • 입력: 스크린샷 설정(이름, 형식, 선택자 등)
  • 출력: 스크린샷 데이터 또는 저장 경로

브라우저 제어

  • evaluate: 브라우저 콘솔에서 JavaScript 코드 실행
  • 입력: 실행할 JavaScript 코드
  • 출력: 코드 실행 결과

  • console_logs: 브라우저 콘솔 로그 검색 및 필터링

  • 입력: 검색 필터, 로그 타입 등
  • 출력: 필터링된 콘솔 로그 메시지

사용 방법

설치

# uvx를 통한 설치
uvx mcp-server-browser-use

# 또는 NPX를 통한 설치
npx @modelcontextprotocol/browser-use

구성

Claude Desktop에서 이 서버를 사용하려면 다음과 같이 설정 파일에 추가할 수 있습니다:

{
  "mcpServers": {
    "browser-use": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-browser-use"]
    }
  }
}

사용 예시

// URL 탐색
navigate("https://example.com")

// 요소 클릭
click("#login-button")

// 입력 필드 채우기
fill("#username", "testuser")
fill("#password", "password123")

// 스크린샷 저장
screenshot({ name: "login-page", fullPage: true })

연결된 구성 요소

  • Puppeteer - 유사한 브라우저 자동화 기능을 제공하는 다른 MCP 서버
  • Playwright - Playwright를 직접 사용하는 MCP 서버
  • Fetch - 웹 콘텐츠 가져오기에 특화된 MCP 서버