agent-browser
Automatiser la navigation web avec des agents IA
متاح أيضًا من: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io
Les agents IA doivent interagir avec les sites web mais ne disposent pas de capacités de navigateur. Cette compétence fournit une automatisation de navigateur headless via inference.sh, permettant à Claude, Codex et Claude Code de naviguer sur les pages, remplir des formulaires, capturer des captures d'écran et enregistrer des sessions.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "agent-browser". Open https://example.com and identify the login form elements
النتيجة المتوقعة:
Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'
استخدام "agent-browser". Fill and submit the login form with test credentials
النتيجة المتوقعة:
Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.
استخدام "agent-browser". Take a screenshot of the dashboard
النتيجة المتوقعة:
Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons
التدقيق الأمني
آمنAll static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.
عوامل الخطر
⚙️ الأوامر الخارجية (4)
🌐 الوصول إلى الشبكة (4)
📁 الوصول إلى نظام الملفات (2)
درجة الجودة
ماذا يمكنك بناءه
Recherche et extraction de données
Les agents IA parcourent les sites web pour rassembler des informations, extraire des données structurées des pages et compiler des rapports de recherche sans navigation manuelle.
Soumission de formulaire automatisée
Les agents IA remplissent et soumettent des formulaires web pour des tâches comme la réservation de rendez-vous, l'enregistrement de comptes ou la saisie de données par lots.
Test basé sur le navigateur
Les ingénieurs QA utilisent des agents IA pour naviguer sur les sites web, capturer des captures d'écran et enregistrer des sessions de test pour vérifier la fonctionnalité de l'interface utilisateur.
جرّب هذه الموجهات
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.
أفضل الممارسات
- Toujours re-snapshot après la navigation ou les changements DOM; les refs d'éléments expirent après le chargement des pages
- Utiliser les variables d'environnement pour les identifiants; ne jamais coder en dur les mots de passe dans les scripts
- Fermer les sessions quand terminé; les enregistrements vidéo sont disponibles seulement jusqu'à l'appel de close
تجنب
- Ne pas mettre en cache les refs d'éléments à travers les pages différentes; toujours snapshot après la navigation
- Ne pas coder en dur les identifiants; utiliser les variables d'environnement comme $APP_USERNAME et $APP_PASSWORD
- Ne pas sauter les temps d'attente après les actions; laisser les pages charger complètement avant d'interagir