agent-browser
AI 에이전트로 브라우저 작업 자동화하기
또한 다음에서 사용할 수 있습니다: inference-sh-8,vercel-labs,inferencesh,inf-sh
이 스킬은 AI 에이전트가 간단한 @e 참조 시스템을 통해 탐색, 양식 작성, 데이터 추출 및 시각적 녹화를 포함한 브라우저 상호작용을 자동화할 수 있도록 합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"agent-browser" 사용 중입니다. https://example.com 열고 요소 가져오기
예상 결과:
세션이 ID: abc123으로 시작됨. 발견된 요소: @e1 [a] "Example Domain", @e2 [h1] "Example Domain", @e3 [p] "This domain is for use..."
"agent-browser" 사용 중입니다. 로그인 양식 작성 및 제출
예상 결과:
@e1에 'user@example.com' 입력됨, @e2에 'password123' 입력됨, @e3 클릭됨. 탐색 감지됨. 재스냅샷 권장.
"agent-browser" 사용 중입니다. 스크린샷 찍기
예상 결과:
스크린샷 캡처됨: {base64 인코딩된 이미지 데이터}, 크기: 1920x1080
보안 감사
낮은 위험This is a legitimate browser automation skill using Playwright via inference.sh CLI. The static scanner flagged 606 potential issues, but upon evaluation, all findings are false positives: external_commands detections are bash command examples in documentation, network detections are legitimate test URLs, and the heuristic 'dangerous combination' flag describes expected browser automation behavior (network access + code execution + session management). This skill provides standard web automation functionality for AI agents.
낮은 위험 문제 (3)
위험 요인
⚙️ 외부 명령어 (5)
🌐 네트워크 접근 (2)
📁 파일 시스템 액세스 (1)
품질 점수
만들 수 있는 것
자동화된 양식 제출
데이터 입력 자동화를 위해 프로그래밍 방식으로 웹 양식 작성 및 제출
웹 콘텐츠 추출
웹사이트를 탐색하고 연구 또는 모니터링을 위해 구조화된 데이터 추출
시각적 브라우저 테스트
브라우저 상호작용을 녹화하여 시각적 문서화 생성 또는 문제 디버깅
이 프롬프트를 사용해 보세요
agent-browser 스킬을 사용하여 [URL]을(를) 열고 페이지의 모든 대화형 요소에 대한 요소 참조를 가져오세요.
세션 [SESSION_ID]을(를) 사용하여 참조 @e1인 양식 필드에 '[TEXT]' 텍스트를 입력한 다음 참조 @e2인 버튼을 클릭하세요.
현재 세션 [SESSION_ID]의 전체 페이지 스크린샷을 찍어 저장하세요.
요소 @e1을 클릭하여 다음 페이지로 이동한 다음 스냅샷을 찍고 새 페이지의 모든 제목 텍스트를 추출하세요.
모범 사례
- 탐색 후에는 항상 재스냅샷하여 새로운 요소 참조를 가져오세요
- 비동기 로딩을 트리거하는 동작 후에는 명시적 대기를 사용하세요
- 완료되면 세션을 닫아 브라우저 리소스를 해제하세요
- 디버��이 필요한 경우에만 비디오 녹화를 활성화하세요
피하기
- 재스냅샷 없이 이전 페이지의 요소 참조 사용
- 클릭 동작 후 탐색 처리하지 않음
- 세션 ID 유출 또는 세션 수명 주기 관리 부재
- 표시되지 않을 수 있는 요소와의 상호작용 시도