🌐

agent-browser

Name: agent-browser
Author: skillssh

آمن ⚙️ الأوامر الخارجية🌐 الوصول إلى الشبكة📁 الوصول إلى نظام الملفات

Automatizar la navegación web con agentes de IA

متاح أيضًا من: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

Los agentes de IA necesitan interactuar con sitios web pero carecen de capacidades de navegador. Esta skill proporciona automatización de navegador sin cabeza a través de inference.sh, permitiendo que Claude, Codex y Claude Code naveguen páginas, completen formularios, tomen capturas de pantalla y graben sesiones.

يدعم: Claude Codex Code(CC)

🥉 72 برونزي

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "agent-browser". Open https://example.com and identify the login form elements

النتيجة المتوقعة:

Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'

استخدام "agent-browser". Fill and submit the login form with test credentials

النتيجة المتوقعة:

Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.

استخدام "agent-browser". Take a screenshot of the dashboard

النتيجة المتوقعة:

Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons

التدقيق الأمني

آمن

v1 • 4/22/2026

All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.

الملفات التي تم فحصها

2,313

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

عوامل الخطر

⚙️ الأوامر الخارجية (4)

SKILL.md:21-22 references/authentication.md:24-26 references/commands.md:10-11 templates/authenticated-session.sh:40-43

🌐 الوصول إلى الشبكة (4)

SKILL.md:9 SKILL.md:37 references/authentication.md:25 references/commands.md:25

📁 الوصول إلى نظام الملفات (2)

SKILL.md:195-200 references/authentication.md:5

تم تدقيقه بواسطة: claude

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

100

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

Investigación y extracción de datos

Los agentes de IA navegan sitios web para recopilar información, extraer datos estructurados de páginas y compilar informes de investigación sin navegación manual.

Envío automatizado de formularios

Los agentes de IA completan y envían formularios web para tareas como reservar citas, registrar cuentas o completar ingreso de datos por lotes.

Pruebas basadas en navegador

Los ingenieros de QA usan agentes de IA para navegar sitios web, tomar capturas de pantalla y grabar sesiones de prueba para verificar la funcionalidad de la interfaz.

جرّب هذه الموجهات

Navegación básica de página

Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.

Flujo de trabajo de completado de formularios

Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.

Sesión autenticada con extracción de datos

Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.

Sesión de investigación de múltiples páginas

Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.

أفضل الممارسات

Siempre re-snapshot después de navegación o cambios en el DOM; las referencias de elementos expiran después de cargas de página
Usar variables de entorno para credenciales; nunca hardcodear contraseñas en scripts
Cerrar sesiones cuando terminen; las grabaciones de video solo están disponibles hasta que se llame a close

تجنب

No cachear referencias de elementos en diferentes páginas; siempre snapshot después de navegación
No hardcodear credenciales; usar variables de entorno como $APP_USERNAME y $APP_PASSWORD
No omitir tiempos de espera después de acciones; permitir que las páginas carguen completamente antes de interactuar

الأسئلة المتكررة

¿Qué es inference.sh y necesito instalarlo?

Sí, inference.sh es requerido. Proporciona la CLI (infsh) que ejecuta la automatización del navegador. Instálalo desde raw.githubusercontent.com/inference-sh/skills/main/cli-install.md

¿Por qué las referencias de elementos como @e1 dejan de funcionar?

Las referencias de elementos se invalidan después de navegación de página, cambios del DOM o carga de contenido dinámico. Siempre llama a la función de snapshot después de estos eventos para obtener referencias frescas.

¿Cómo manejo el login para sitios protegidos?

Usa la skill agent-browser para automatizar el flujo de login una vez, luego reutiliza el session ID para solicitudes autenticadas subsiguientes. La referencia authentication.md explica este patrón.

¿Puedo grabar sesiones de navegador como video?

Sí, habilita record_video: true en la función open. Llama a close para recuperar el archivo de video. El cursor puede mostrarse con show_cursor: true para demostraciones más claras.

¿Cómo subo archivos a través del navegador?

Usa la acción upload con el array file_paths. La referencia debe apuntar a un elemento de entrada de archivo. Ejemplo: {action: upload, ref: @e5, file_paths: ['/path/to/file.pdf']}

¿Qué pasa si la sesión del navegador expira?

Las sesiones no persisten entre reinicios del servidor. Siempre maneja errores gracefulmente y reinicia el flujo de trabajo si es necesario. Las grabaciones de video se pierden si close no se llama antes del timeout.