المهارات agent-browser
🌐

agent-browser

آمن ⚙️ الأوامر الخارجية🌐 الوصول إلى الشبكة📁 الوصول إلى نظام الملفات

Automatiser la navigation web avec des agents IA

متاح أيضًا من: inference-sh-8,inference-shell,inference-sh-skills,inf-sh,inference-sh-0,inference-sh-9,inferencesh,inferen-sh,inference-skills,vercel-labs,qu-skills,infsh-skills,toolshell,tul-sh,supercent-io

Les agents IA doivent interagir avec les sites web mais ne disposent pas de capacités de navigateur. Cette compétence fournit une automatisation de navigateur headless via inference.sh, permettant à Claude, Codex et Claude Code de naviguer sur les pages, remplir des formulaires, capturer des captures d'écran et enregistrer des sessions.

يدعم: Claude Codex Code(CC)
🥉 72 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "agent-browser". Open https://example.com and identify the login form elements

النتيجة المتوقعة:

Page loaded successfully. Found 3 interactive elements:
@e1 [input type='text'] placeholder='Username'
@e2 [input type='password'] placeholder='Password'
@e3 [button] 'Sign In'

استخدام "agent-browser". Fill and submit the login form with test credentials

النتيجة المتوقعة:

Form submitted. Page redirected to dashboard.
@e1 [h1] 'Welcome, Test User'
@e2 [nav] 'Dashboard | Settings | Logout'
Screenshot captured.

استخدام "agent-browser". Take a screenshot of the dashboard

النتيجة المتوقعة:

Screenshot saved to dashboard-20240101.png
Page title: Dashboard | Size: 1280x720
Dashboard contains: navigation menu, user profile card, data tables, action buttons

التدقيق الأمني

آمن
v1 • 4/22/2026

All static findings are false positives. The skill uses the inference.sh CLI (infsh) to control a headless browser via documented command invocations. External command detections are hardcoded API calls to a legitimate service. Network detections are target URLs for browsing, not exfiltration. Filesystem detections are documentation navigation (../) and standard device paths. Password/crypto detections are documentation showing credential input handling, not cryptography.

10
الملفات التي تم فحصها
2,313
الأسطر التي تم تحليلها
3
النتائج
1
إجمالي عمليات التدقيق
تم تدقيقه بواسطة: claude

درجة الجودة

45
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
24
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

Recherche et extraction de données

Les agents IA parcourent les sites web pour rassembler des informations, extraire des données structurées des pages et compiler des rapports de recherche sans navigation manuelle.

Soumission de formulaire automatisée

Les agents IA remplissent et soumettent des formulaires web pour des tâches comme la réservation de rendez-vous, l'enregistrement de comptes ou la saisie de données par lots.

Test basé sur le navigateur

Les ingénieurs QA utilisent des agents IA pour naviguer sur les sites web, capturer des captures d'écran et enregistrer des sessions de test pour vérifier la fonctionnalité de l'interface utilisateur.

جرّب هذه الموجهات

Navigation de page basique
Use the agent-browser skill to open https://example.com and show me all the clickable elements on the page.
Flux de travail de remplissage de formulaire
Open the contact form at https://example.com/contact. Fill in name with 'John Doe', email with 'john@example.com', and submit the form. Take a screenshot of the result.
Session authentifiée avec extraction de données
Login to https://app.example.com using the credentials from environment variables. Navigate to the dashboard, extract all table data, and save a screenshot of the final page.
Session de recherche multi-pages
Record a video while browsing example.com/products. Click through 5 products, fill out an inquiry form for the last product, and close the session to save the recording.

أفضل الممارسات

  • Toujours re-snapshot après la navigation ou les changements DOM; les refs d'éléments expirent après le chargement des pages
  • Utiliser les variables d'environnement pour les identifiants; ne jamais coder en dur les mots de passe dans les scripts
  • Fermer les sessions quand terminé; les enregistrements vidéo sont disponibles seulement jusqu'à l'appel de close

تجنب

  • Ne pas mettre en cache les refs d'éléments à travers les pages différentes; toujours snapshot après la navigation
  • Ne pas coder en dur les identifiants; utiliser les variables d'environnement comme $APP_USERNAME et $APP_PASSWORD
  • Ne pas sauter les temps d'attente après les actions; laisser les pages charger complètement avant d'interagir

الأسئلة المتكررة

Qu'est-ce que inference.sh et dois-je l'installer?
Oui, inference.sh est requis. Il fournit le CLI (infsh) qui exécute l'automatisation du navigateur. Installez-le depuis raw.githubusercontent.com/inference-sh/skills/main/cli-install.md
Pourquoi les refs d'éléments comme @e1 arrêtent de fonctionner?
Les refs d'éléments sont invalidées après la navigation de page, les changements DOM ou le chargement de contenu dynamique. Toujours appeler la fonction snapshot après ces événements pour obtenir de nouvelles refs.
Comment gérer la connexion pour les sites protégés?
Utiliser la compétence agent-browser pour automatiser le flux de connexion une fois, puis réutiliser l'ID de session pour les requêtes authentifiées ultérieures. La référence authentication.md explique ce pattern.
Puis-je enregistrer les sessions de navigateur en vidéo?
Oui, activer record_video: true dans la fonction open. Appeler close pour récupérer le fichier vidéo. Le curseur peut être affiché avec show_cursor: true pour des démos plus claires.
Comment télécharger des fichiers via le navigateur?
Utiliser l'action upload avec le tableau file_paths. La ref doit pointer vers un élément d'entrée de fichier. Exemple: {action: upload, ref: @e5, file_paths: ['/path/to/file.pdf']}
Que se passe-t-il si la session du navigateur expire?
Les sessions ne persistent pas à travers les redémarrages du serveur. Toujours gérer les erreurs avec élégance et redémarrer le flux de travail si nécessaire. Les enregistrements vidéo sont perdus si close n'est pas appelé avant le timeout.

تفاصيل المطور

المؤلف

skillssh

الترخيص

MIT

مرجع

main