المهارات agent-browser
🌐

agent-browser

مخاطر متوسطة ⚙️ الأوامر الخارجية🌐 الوصول إلى الشبكة📁 الوصول إلى نظام الملفات

أتمتة متصفحات الويب لوكلاء الذكاء الاصطناعي

متاح أيضًا من: inference-sh-9,inferen-sh,inf-sh,toolshell,inference-sh-8,inferencesh,skillssh,inference-sh-0,supercent-io,tul-sh,vercel-labs

يحتاج وكلاء الذكاء الاصطناعي للتفاعل مع مواقع الويب لكنهم يفتقرون للوصول الأصلي للمتصفح. توفر هذه المهارة أتمتة متصفح تعتمد على Playwright من خلال inference.sh، مما يتيح التنقل والتفاعل مع العناصر ولقطات الشاشة وتسجيل الفيديو مع إدارة الجلسات سير عمل معقدة متعددة الخطوات.

يدعم: Claude Codex Code(CC)
⚠️ 62 ضعيف
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "agent-browser". Navigate to example.com and show available elements

النتيجة المتوقعة:

Session created: sess_abc123. Page loaded successfully. Available elements: @e1 [h1] 'Example Domain', @e2 [p] 'This domain is for use in documentation', @e3 [a] 'Learn more' href='https://iana.org/domains/example'

استخدام "agent-browser". Fill form and submit

النتيجة المتوقعة:

Element @e1 filled with 'test@example.com'. Element @e2 filled with 'password'. Element @e3 clicked. Page navigated to /dashboard. Session remains active.

استخدام "agent-browser". Take screenshot of current page

النتيجة المتوقعة:

Screenshot captured: screenshot_20260312_082145.png (1920x1080). Image saved to /tmp/browser-sessions/sess_abc123/screenshots/. Base64 preview available in response.

التدقيق الأمني

مخاطر متوسطة
v1 • 3/12/2026

Static analyzer flagged 606 patterns across 10 files (2313 lines). Most findings are false positives: external_commands are documentation examples showing CLI usage, network patterns are example URLs, filesystem patterns are markdown relative links. The skill legitimately requires Bash permissions for inference.sh CLI, network access for browser automation, and filesystem access for screenshots/videos. No malicious intent detected. Users should understand the powerful capabilities this skill provides.

10
الملفات التي تم فحصها
2,313
الأسطر التي تم تحليلها
8
النتائج
1
إجمالي عمليات التدقيق
مشكلات متوسطة المخاطر (3)
Extensive External Command Usage
The skill uses Bash(infsh *) permission extensively for browser automation via inference.sh CLI. While this is the intended functionality, users should understand this grants significant system access.
Browser Credential and Cookie Access
The skill can access browser cookies and storage via JavaScript execution. This is required for authenticated browsing but could expose session tokens if misused.
Screen Capture and Video Recording
The skill can capture screenshots and record video of browser sessions. This capability could capture sensitive information displayed during automation.
مشكلات منخفضة المخاطر (2)
Hardcoded Example URLs in Documentation
Documentation contains example URLs (example.com, inference.sh). These are documentation examples, not malicious endpoints.
SOCKS Proxy Configuration Support
The skill supports SOCKS proxy configuration for browser traffic routing. This is a legitimate privacy/networking feature.
تم تدقيقه بواسطة: claude

درجة الجودة

45
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
22
المجتمع
46
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

كشط الويب واستخراج البيانات

استخراج البيانات المهيكلة من مواقع الويب التي تتطلب عرض JavaScript أو تفاعل المستخدم، مثل لوحات المعلومات والمحتوى الديناميكي أو المواقع بدون واجهات برمجة تطبيقات عامة.

الاختبار الآلي وضمان الجودة

اختبار تطبيقات الويب عن طريق أتمتة سير عمل المستخدمين وتقديم النماذج ومسارات التنقل والتحقق البصري من خلال لقطات الشاشة.

بحث الوكلاء وجمع المعلومات

تمكين وكلاء الذكاء الاصطناعي من تصفح مواقع الويب وقراءة التوافر التحقق من المنتجات ومراقبة الأسعار أو جمع المعلومات من مصادر الويب.

جرّب هذه الموجهات

التنقل الأساسي للصفحة
Open a browser session and navigate to https://example.com. Show me what interactive elements are available on the page.
أتمتة النماذج
Create a browser session to fill out the contact form at https://example.com/contact. Find the name, email, and message fields, fill them with test data, and submit the form. Take a screenshot after submission.
استخراج البيانات المصادق عليها
Start a recorded browser session. Log into https://app.example.com using credentials from environment variables. Navigate to the dashboard, extract all metrics displayed in the table, and close the session returning the video.
سير عمل معقد متعدد الصفحات
Create a browser session with a SOCKS proxy. Search for products on an e-commerce site, filter by price range, open the first 3 product pages in sequence, extract product details from each, and compile a comparison summary. Record the entire workflow.

أفضل الممارسات

  • قم دائمًا بإغلاق الجلسات عند الانتهاء لتحرير الموارد واستعادة تسجيلات الفيديو إذا تم تمكينها
  • استخدم متغيرات البيئة لبيانات الاعتماد بدلاً من كتابتها بشكل صريح في نصوص الأتمتة
  • التقط لقطات بعد أي تنقيح أو إجراء يعدل DOM للحصول على مراجع عناصر جديدة
  • استخدم إجراءات الانتظار أو الشروط الصريحة قبل التفاعل مع العناصر المحملة ديناميكيًا

تجنب

  • Do not hardcode credentials directly in automation scripts or prompts
  • Do not assume element references persist after page navigation - always re-snapshot
  • Do not leave sessions running indefinitely - implement timeout and cleanup logic
  • Do not use for bypassing security measures, CAPTCHA, or unauthorized access to protected resources

الأسئلة المتكررة

ما الذي أحتاج إلى تثبيته قبل استخدام هذه المهارة؟
تحتاج إلى CLI من inference.sh (infsh). قم بتشغيل 'npx skills add inference-sh/skills@agent-tools' للحصول على تعليمات التثبيت، ثم المصادقة باستخدام 'infsh login'.
كيف تعمل مراجع العناصر (@e1، @e2)؟
عندما تفتح صفحة أو تستدعي snapshot، ترجع المهارة قائمة من العناصر التفاعلية مع مراجع @e. استخدم هذه المراجع في أوامر التفاعل مثل النقر أو الملء. تنتهي المراجع عند تغيير DOM.
هل يمكن لهذه المهارة التعامل مع تسجيل الدخول والجلسات المصادق عليها؟
نعم. تستمر ملفات تعريف الارتباط وlocalStorage للجلسة عبر استدعاءات الدوال. املأ نماذج تسجيل الدخول وارسلها، وتبقى الإجراءات اللاحقة في تلك الجلسة مصادق عليها. راجع authentication.md لأنماط OAuth و2FA.
كيف يعمل تسجيل الفيديو؟
تمكين الفيديو عن طريق إضافة 'record_video': true إلى إدخال الدالة open. يتم تسجيل الفيديو طوال الجلسة ويتم إرجاعه عند استدعاء الدالة close. الفيديو متاح فقط حتى يتم إغلاق الجلسة.
هل يمكنني استخدام وكلاء مع هذه المهارة؟
نعم. أضف 'proxy': {'server': 'http://proxy.example.com:8080'} أو SOCKS مع 'proxy': {'server': 'socks5://proxy.example.com:1080'} إلى إدخال الدالة open. راجع proxy-support.md للتفاصيل.
ماذا يحدث إذا نسيت إغلاق جلسة؟
تستهلك الجلسات موارد الخادم. بينما قد يكون هناك تنظيف تلقائي، استدعِ دائمًا close بشكل صريح عند الانتهاء. قد تنتهي مهلة الجلسات غير المغلقة لكن هذا ليس مضمونًا.