스킬 agent-browser
🌐

agent-browser

안전 ⚙️ 외부 명령어🌐 네트워크 접근📁 파일 시스템 액세스

AI 에이전트를 사용한 웹 브라우징 자동화

또한 다음에서 사용할 수 있습니다: toolshell,inference-sh-8,inferencesh,inferen-sh,inference-sh-0,inference-sh-9,supercent-io,inference-shell,tul-sh,inf-sh,vercel-labs

AI 에이전트는 웹사이트와 상호작용해야 하지만 브라우저 기능이 없습니다. 이 스킬은 inference.sh를 통한 헤드리스 브라우저 자동화를 제공하여, Claude, Codex, Claude Code가 페이지를 탐색하고, 폼을 작성하며, 스크린샷을 찍고, 세션을 녹화할 수 있게 합니다.

지원: Claude Codex Code(CC)
🥉 76 브론즈
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"agent-browser" 사용 중입니다. Open https://example.com and identify the login form elements

예상 결과:

Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'

"agent-browser" 사용 중입니다. Fill and submit the login form with test credentials

예상 결과:

Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.

"agent-browser" 사용 중입니다. Take a screenshot of the dashboard

예상 결과:

Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons

보안 감사

안전
v1 • 4/22/2026

All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.

10
스캔된 파일
2,313
분석된 줄 수
3
발견 사항
1
총 감사 수
감사자: claude

품질 점수

45
아키텍처
100
유지보수성
87
콘텐츠
50
커뮤니티
100
보안
91
사양 준수

만들 수 있는 것

연구 및 데이터 추출

AI 에이전트가 웹사이트를 탐색하여 정보를 수집하고, 페이지에서 구조화된 데이터를 추출하며, 수동 브라우징 없이 연구 보고서를 작성합니다.

자동화된 폼 제출

AI 에이전트가约会 예약, 계정 등록, 배치 데이터 입력 등의 작업으로 웹 폼을 작성하고 제출합니다.

브라우저 기반 테스트

QA 엔지니어가 AI 에이전트를 사용하여 웹사이트를 탐색하고, 스크린샷을 찍으며, UI 기능을 확인하기 위해 테스트 세션을 녹화합니다.

컨텐츠 모니터링 및 스크래핑

AI 에이전트가 웹페이지를 정기적으로 모니터링하고, 가격 변경, 재고 업데이트, 새 컨텐츠 게시 등을 추적합니다.

이 프롬프트를 사용해 보세요

기본 페이지 탐색
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
폼 작성 워크플로우
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
인증된 세션과 데이터 추출
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
다중 페이지 연구 세션
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.

모범 사례

  • 탐색이나 DOM 변경 후 항상 다시 스냅샷; 요소 참조는 페이지 로드 후 만료됨
  • 자격 증명에는 환경 변수 사용; 스크립트에 비밀번호 하드코딩 금지
  • 완료되면 세션 종료; 비디오 녹화는 close 호출 시점까지만 사용 가능

피하기

  • Do not cache element refs across different pages; always snapshot after navigation
  • Do not hardcode credentials; use environment variables like $APP_USERNAME and $APP_PASSWORD
  • Do not skip wait times after actions; allow pages to fully load before interacting

자주 묻는 질문

What is inference.sh and do I need to install it?
Yes, inference.sh is required. It provides the CLI (infsh) that runs the browser automation. Install it from raw.githubusercontent.com/inference-sh/skills/main/cli-install.md
Why do element refs like @e1 stop working?
Element refs are invalidated after page navigation, DOM changes, or dynamic content loading. Always call the snapshot function after these events to get fresh refs.
How do I handle login for protected sites?
Use the agent-browser skill to automate the login flow once, then reuse the session ID for subsequent authenticated requests. The authentication.md reference explains this pattern.
Can I record browser sessions as video?
Yes, enable record_video: true in the open function. Call close to retrieve the video file. The cursor can be shown with show_cursor: true for clearer demos.
How do I upload files through the browser?
Use the upload action with file_paths array. The ref must point to a file input element. Example: {action: upload, ref: @e5, file_paths: ['/path/to/file.pdf']}
What happens if the browser session times out?
Sessions do not persist across server restarts. Always handle errors gracefully and restart the workflow if needed. Video recordings are lost if close is not called before timeout.