agent-browser
أتمتة مهام المتصفح باستخدام وكلاء الذكاء الاصطناعي
متاح أيضًا من: inferencesh,inferen-sh,skillssh,supercent-io,toolshell,tul-sh,inference-sh-8,inference-shell,inference-sh-0,inference-sh-9,vercel-labs,inf-sh
يحتاج وكلاء الذكاء الاصطناعي إلى التفاعل مع صفحات الويب لكنهم يفتقرون إلى قدرات المتصفح. توفر هذه المهارة أتمتة المتصفح بدون رأس من خلال أوامر shell بسيطة، مما يتيح كشط الويب وملء النماذج وسير عمل الاختبارات الآلية.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "agent-browser". فتح example.com وسرد العناصر القابلة للنقر
النتيجة المتوقعة:
Session started: abc123
URL: https://example.com
Title: Example Domain
Clickable Elements:
- @e1 [a] 'More information...' href='https://example.com/about'
- @e2 [a] 'Domains' href='https://example.com/domains'
- @e3 [button] 'Get Started'
- @e4 [input type='email'] placeholder='Enter your email'
Screenshot saved to: ./screenshots/example.com_20240101.png
استخدام "agent-browser". ملء نموذج تسجيل الدخول والتحقق من النجاح
النتيجة المتوقعة:
Login workflow completed:
1. Opened login page
2. Filled email field with user@example.com
3. Filled password field
4. Clicked Sign In button
5. Waited for redirect
6. Verified URL changed from /login to /dashboard
7. Captured dashboard screenshot
Session ID: abc123 (active)
Screenshot: ./screenshots/dashboard_20240101.png
التدقيق الأمني
مخاطر متوسطةStatic analysis detected 606 potential security issues, primarily shell command patterns in documentation files. After evaluation, all findings are FALSE POSITIVES or informational. The skill is a legitimate browser automation tool that uses the belt CLI to control Playwright. Shell commands are documented usage examples, not execution vulnerabilities. Browser credential access and session state are expected behavior for this tool type.
مشكلات متوسطة المخاطر (4)
عوامل الخطر
⚙️ الأوامر الخارجية (4)
🌐 الوصول إلى الشبكة (3)
📁 الوصول إلى نظام الملفات (2)
درجة الجودة
ماذا يمكنك بناءه
استخراج بيانات الويب للبحث
استخراج بيانات منظمة من مواقع الويب من خلال التنقل في الصفحات وملء نماذج البحث وجمع محتوى الصفحة. مفيد لبحوث السوق وتحليل المنافسين ومهام جمع البيانات.
أتمتة سير عمل إرسال النماذج
أتمتة مهام ملء النماذج المتكررة مثل طلبات التوظيف أو إكمال الاستبيانات أو إدخال البيانات. التعامل مع النماذج متعددة الخطوات مع التنقل الشرطي والتحقق.
اختبار واجهات برمجة التطبيقات المستندة إلى المتصفح
اختبار تطبيقات الويب التي تتطلب سياق المتصفح، مثل التطبيقات ذات الصفحة الواحدة مع المصادقة من جانب العميل أو سير عمل JavaScript المكثفة. التقاط لقطات شاشة وفيديو للتوثيق.
جرّب هذه الموجهات
استخدم مهارة agent-browser لفتح https://example.com، والتقاط لقطة شاشة، وسرد جميع العناصر القابلة للنقر على الصفحة.
استخدم agent-browser لتسجيل الدخول إلى https://app.example.com باستخدام البريد الإلكتروني user@example.com وكلمة المرور من متغير بيئة PASSWORD. بعد تسجيل الدخول، تحقق من أنه يمكنك الوصول إلى صفحة لوحة التحكم والتقط لقطة شاشة.
أنشئ برنامجًا نصيًا باستخدام agent-browser لملء نموذج تسجيل متعدد الخطوات: افتح النموذج، واملأ الخطوة 1 بالاسم والبريد الإلكتروني، وانتقل إلى الخطوة 2، واملأ تفاصيل العنوان، وارسل، وتحقق من رسالة النجاح.
استخدم agent-browser لفتح ثلاث صفحات منتجات مختلفة في جلسات متوازية، واستخراج الأسعار والتوفر من كل منها، وإغلاق جميع الجلسات. قارن البيانات المجمعة.
أفضل الممارسات
- استخدم دائمًا متغيرات البيئة للبيانات الحساسة مثل كلمات المرور بدلاً من ترميز بيانات الاعتماد في البرامج النصية
- أعد التقاط لقطة الصفحة بعد أي تنقل أو تغييرات في DOM للحصول على مراجع عناصر جديدة قبل التفاعل
- تمكين تسجيل الفيديو فقط أثناء التصحيح لتجنب التقاط معلومات حساسة في الإنتاج
تجنب
- لا ترمز كلمات المرور أو مفاتيح API مباشرة في البرامج النصية أو وسيطات الأوامر
- لا تتخط خطوة الالتقاط بعد التنقل في الصفحة - ستتسبب المراجع القديمة للعناصر في فشل
- لا تترك الجلسات مفتوحة دون داعٍ - أغلق الجلسات دائمًا عند الانتهاء لتحرير الموارد