agent-browser
AI 에이전트로 브라우저 작업 자동화하기
또한 다음에서 사용할 수 있습니다: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh
AI 에이전트는 웹 페이지와 상호 작용해야 하지만 브라우저 기능이 없습니다. 이 스킬은 간단한 쉘 명령을 통해 헤드리스 브라우저 자동화를 제공하여 웹 스크래핑, 폼 채우기, 자동화된 테스트 워크플로우를 가능하게 합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"agent-browser" 사용 중입니다. example.com을 열고 클릭 가능한 요소 나열
예상 결과:
세션 시작됨: abc123
URL: https://example.com
제목: Example Domain
클릭 가능한 요소:
- @e1 [a] 'More information...' href='https://example.com/about'
- @e2 [a] 'Domains' href='https://example.com/domains'
- @e3 [button] 'Get Started'
- @e4 [input type='email'] placeholder='Enter your email'
스크린샷 저장 위치: ./screenshots/example.com_20240101.png
"agent-browser" 사용 중입니다. 로그인 폼 채우고 성공 확인
예상 결과:
로그인 워크플로우 완료:
1. 로그인 페이지 열림
2. 이메일 필드에 user@example.com 입력
3. 비밀번호 필드 입력
4. 로그인 버튼 클릭
5. 리다이렉트 대기
6. URL이 /login에서 /dashboard로 변경되었는지 확인
7. 대시보드 스크린샷 캡처
세션 ID: abc123 (활성)
스크린샷: ./screenshots/dashboard_20240101.png
보안 감사
중간 위험Static analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.
중간 위험 문제 (4)
위험 요인
⚙️ 외부 명령어 (4)
🌐 네트워크 접근 (3)
📁 파일 시스템 액세스 (2)
품질 점수
만들 수 있는 것
연구를 위한 웹 데이터 추출
페이지 이동, 검색 폼 채우기, 페이지 콘텐츠 수집을 통해 웹사이트에서 구조화된 데이터를 추출합니다. 시장 조사, 경쟁사 분석, 데이터 수집 작업에 유용합니다.
자동화된 폼 제출 워크플로우
잡 지원, 설문조사 완료, 데이터 입력과 같은 반복적인 폼 채우기 작업을 자동화합니다. 조건부 네비게이션 및 검증이 포함된 멀티스텝 폼을 처리합니다.
브라우저 기반 API 테스트
클라이언트 측 인증이나 JavaScript 중심 워크플로우가 있는 SPA처럼 브라우저 컨텍스트가 필요한 웹 애플리케이션을 테스트합니다. 문서화를 위해 스크린샷과 영상을 캡처합니다.
이 프롬프트를 사용해 보세요
agent-browser 스킬을 사용하여 https://example.com을 열고 스크린샷을 찍은 다음 페이지에서 클릭 가능한 모든 요소를 나열하세요.
agent-browser를 사용하여 이메일 user@example.com과 PASSWORD 환경 변수에서 가져온 비밀번호로 https://app.example.com에 로그인하세요. 로그인 후 대시보드 페이지에 접근할 수 있는지 확인하고 스크린샷을 찍으세요.
agent-browser를 사용하여 멀티스텝 등록 폼을 채우는 스크립트를 만드세요: 폼 열기, 이름과 이메일로 스텝 1 채우기, 스텝 2로 진행, 주소 상세 정보 채우기, 제출, 성공 메시지 확인.
agent-browser를 사용하여 3개의 다른 제품 페이지를 병렬 세션에서 열고 각각의 가격과 가용성을 추출한 다음 모든 세션을 닫으세요. 수집된 데이터를 비교하세요.
모범 사례
- 스크립트에 자격 증명을 하드코딩하는 대신 비밀번호 같은 민감한 데이터에 환경 변수를 항상 사용하세요
- 네비게이션이나 DOM 변경 후에는 항상 페이지를 다시 스냅샷하여 대화형 요소 참조를 새로 가져오세요
- 프로덕션에서 민감한 정보가 캡처되지 않도록 디버깅 시에만 영상 녹화를 활성화하세요
피하기
- 스크립트나 명령 인수에 비밀번호나 API 키를 하드코딩하지 마세요
- 페이지 네비게이션 후 스냅샷 단계를 건너뛰지 마세요 - 오래된 요소 참조는 오류를 일으킵니다
- 불필요하게 세션을 열어두지 마세요 - 완료되면 항상 리소스를 해제하기 위해 세션을 닫으세요