agent-browser
Automatizar la navegación web con agentes de IA
متاح أيضًا من: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io
Los agentes de IA necesitan interactuar con sitios web pero carecen de capacidades de navegador. Esta skill proporciona automatización de navegador sin cabeza a través de inference.sh, permitiendo que Claude, Codex y Claude Code naveguen páginas, completen formularios, tomen capturas de pantalla y graben sesiones.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "agent-browser". Open https://example.com and identify the login form elements
النتيجة المتوقعة:
Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'
استخدام "agent-browser". Fill and submit the login form with test credentials
النتيجة المتوقعة:
Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.
استخدام "agent-browser". Take a screenshot of the dashboard
النتيجة المتوقعة:
Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons
التدقيق الأمني
آمنAll static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.
عوامل الخطر
⚙️ الأوامر الخارجية (4)
🌐 الوصول إلى الشبكة (4)
📁 الوصول إلى نظام الملفات (2)
درجة الجودة
ماذا يمكنك بناءه
Investigación y extracción de datos
Los agentes de IA navegan sitios web para recopilar información, extraer datos estructurados de páginas y compilar informes de investigación sin navegación manual.
Envío automatizado de formularios
Los agentes de IA completan y envían formularios web para tareas como reservar citas, registrar cuentas o completar ingreso de datos por lotes.
Pruebas basadas en navegador
Los ingenieros de QA usan agentes de IA para navegar sitios web, tomar capturas de pantalla y grabar sesiones de prueba para verificar la funcionalidad de la interfaz.
جرّب هذه الموجهات
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.
أفضل الممارسات
- Siempre re-snapshot después de navegación o cambios en el DOM; las referencias de elementos expiran después de cargas de página
- Usar variables de entorno para credenciales; nunca hardcodear contraseñas en scripts
- Cerrar sesiones cuando terminen; las grabaciones de video solo están disponibles hasta que se llame a close
تجنب
- No cachear referencias de elementos en diferentes páginas; siempre snapshot después de navegación
- No hardcodear credenciales; usar variables de entorno como $APP_USERNAME y $APP_PASSWORD
- No omitir tiempos de espera después de acciones; permitir que las páginas carguen completamente antes de interactuar