المهارات agentdb-learning-plugins

🧠

agentdb-learning-plugins

Name: agentdb-learning-plugins
Author: DNYoussef

آمن 🌐 الوصول إلى الشبكة📁 الوصول إلى نظام الملفات⚙️ الأوامر الخارجية

تدريب وكلاء الذكاء الاصطناعي باستخدام خوارزميات التعلم المعزز

متاح أيضًا من: ruvnet

يتطلب بناء وكلاء ذكاء اصطناعي ذاتيين التعلم تنفيذ خوارزميات تعلم معقدة من الصفر. توفر AgentDB Learning Plugins وصولاً جاهزاً للاستخدام إلى تسع خوارزميات مثبتة الفعالية بما في ذلك Decision Transformer و Q-Learning، مما يمكّنك من تدريب وكلاء مستقلين يتحسنون من خلال الخبرة.

يدعم: Claude Codex Code(CC)

📊 69 كافٍ

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "agentdb-learning-plugins". Create a Q-Learning agent plugin for a grid navigation task with discrete actions

النتيجة المتوقعة:

Successfully created Q-Learning agent plugin named 'grid-navigator'
Algorithm: Q-Learning (Off-Policy, Value-Based Learning)
Configuration Applied:
- Learning rate: 0.001
- Discount factor (gamma): 0.99
- Exploration rate (epsilon): 0.1 with 0.995 decay
Next Steps for Training:
1. Define states as numerical arrays (example: position coordinates)
2. Store experiences with state, action, reward, next_state, and done flag
3. Call training method with epoch count and batch size
Plugin is ready to receive training experiences

استخدام "agentdb-learning-plugins". Show me the training metrics after running 100 epochs on my collected experiences

النتيجة المتوقعة:

Training Completed Successfully
Final Training Loss: 0.023
Validation Loss: 0.028
Training Duration: 1,523 milliseconds
Total Epochs: 100
Batch Size: 64
Model shows good convergence with low overfitting (validation loss close to training loss)

استخدام "agentdb-learning-plugins". List all available reinforcement learning algorithm templates I can use

النتيجة المتوقعة:

Available AgentDB Learning Algorithm Templates:
1. Decision Transformer - Offline RL via sequence modeling (recommended for beginners)
2. Q-Learning - Value-based off-policy learning for discrete actions
3. SARSA - On-policy value learning for safe exploration
4. Actor-Critic - Policy gradient with value baseline for continuous control
5. Active Learning - Query-based learning for label efficiency
6. Adversarial Training - Robustness enhancement against perturbations
7. Curriculum Learning - Progressive difficulty training
8. Federated Learning - Distributed privacy-preserving training
9. Multi-Task Learning - Transfer learning across related tasks

التدقيق الأمني

آمن

v5 • 1/17/2026

Documentation-only skill containing no executable code. All detected patterns are from instructional code examples showing users how to use the external AgentDB CLI and API. The skill itself performs no network calls, file access, or command execution.

الملفات التي تم فحصها

730

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

عوامل الخطر

🌐 الوصول إلى الشبكة (3)

skill-report.json:6 SKILL.md:537 SKILL.md:539

📁 الوصول إلى نظام الملفات (1)

skill-report.json:6

⚙️ الأوامر الخارجية (51)

SKILL.md:26-38 SKILL.md:38-42 SKILL.md:42-52 SKILL.md:52-56 SKILL.md:56-64 SKILL.md:64-70 SKILL.md:70-111 SKILL.md:111-123 SKILL.md:123-125 SKILL.md:125-134 SKILL.md:134-143 SKILL.md:143-151 SKILL.md:151-153 SKILL.md:153-162 SKILL.md:162-170 SKILL.md:170-178 SKILL.md:178-180 SKILL.md:180-188 SKILL.md:188-195 SKILL.md:195-203 SKILL.md:203-205 SKILL.md:205-213 SKILL.md:213-221 SKILL.md:221-289 SKILL.md:289-317 SKILL.md:317-321 SKILL.md:321-337 SKILL.md:337-341 SKILL.md:341-356 SKILL.md:356-364 SKILL.md:364-377 SKILL.md:377-381 SKILL.md:381-395 SKILL.md:395-399 SKILL.md:399-406 SKILL.md:406-415 SKILL.md:415-423 SKILL.md:423-437 SKILL.md:437-441 SKILL.md:441-453 SKILL.md:453-461 SKILL.md:461-477 SKILL.md:477-483 SKILL.md:483-495 SKILL.md:495-502 SKILL.md:502-509 SKILL.md:509-512 SKILL.md:512-524 SKILL.md:524-527 SKILL.md:527-530 SKILL.md:530-538

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

100

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

بناء وكلاء ألعاب ذاتيين التعلم

إنشاء وكلاء مستقلين يتحسنون في أداء اللعبة من خلال الخبرة باستخدام خوارزميات Q-Learning أو Decision Transformer.

تجربة خوارزميات RL

اختبار ومقارنة أساليب تعلم معزز مختلفة بما في ذلك Actor-Critic و SARSA لأغراض البحث الأكاديمي.

تحسين اتخاذ القرار للوكيل

تدريب الوكلاء لتحسين اتخاذ القرار في بيئات معقدة مع مساحات إجراءات مستمرة أو منفصلة لأنظمة الإنتاج.

جرّب هذه الموجهات

إنشاء وكيل Q-Learning أساسي

Use AgentDB Learning Plugins to create a Q-Learning agent plugin for a simple grid navigation task. Show me the configuration parameters and explain how to store training experiences.

التدريب دون اتصال باستخدام البيانات المسجلة

Help me implement a Decision Transformer plugin using AgentDB to train an agent from historical experience data without requiring environment interaction. Include code for loading logged experiences.

تنفيذ تجربة إعادة التشغيل

Show me how to implement experience replay buffers with AgentDB Learning Plugins. Include both standard replay and prioritized experience replay for better sample efficiency and training stability.

بناء نظام متعدد الوكلاء

Create a multi-agent training system using AgentDB where multiple agents share learned experiences through a common replay buffer and train a collaborative policy together.

أفضل الممارسات

ابدأ بـ Decision Transformer للتعلم دون اتصال من البيانات المسجلة قبل محاولة الأساليب عبر الإنترنت التي تتطلب تفاعل البيئة
استخدم انقسامات التحقق من الصحة أثناء التدريب لاكتشاف فرط التخصيص مبكراً وضبط المعاملات الفائقة وفقاً لذلك
نفّذ مخازن تجربة إعادة التشغيل لتحسين كفاءة العينات واستقرار التدريب عبر جميع الخوارزميات القائمة على القيمة

تجنب

التدريب بدون بيانات التحقق من الصحة يؤدي إلى فرط التخصيص يظل غير مكتشف حتى يتم نشر الوكيل في بيئات الإنتاج
استخدام معدلات تعلم مرتفعة بشكل مفرط يسبب عدم استقرار التدريب والتباعد والفشل في التقارب إلى السياسات المثلى
تجاهل مفاضلة الاستكشاف والاستغلال باستخدام قيم إبسيلون ثابتة ينتج عنه سياسات مكتسبة دون المستوى الأمثل

الأسئلة المتكررة

أي خوارزمية يجب أن يبدأ بها المبتدئون؟

يُنصح بـ Decision Transformer للمبتدئين لأنه يتدريب بشكل مستقر من البيانات المسجلة دون الحاجة إلى تفاعل مع البيئة عبر الإنترنت أو استكشاف معقد.

ما المتطلبات النظامية الدنيا؟

يتطلب Node.js الإصدار 18 أو أعلى و AgentDB الإصدار 1.0.7 أو أعلى. يستفيد أداء التدريب من ذاكرة RAM إضافية ومعالجات متعددة.

كيف يمكنني دمج هذا مع Claude Code؟

استورد createAgentDBAdapter من حزمة agentic-flow/reasoningbank وقم بتهيئته مع enableLearning设置为 true للدمج الكامل مع Claude Code.

هل يتم تخزين بيانات التدريب بشكل آمن؟

يخزن AgentDB جميع البيانات محلياً في مسار قاعدة البيانات الذي تحدده. لا يتم إرسال بيانات التدريب أو التجارب إلى خوادم خارجية بشكل افتراضي.

لماذا لا يتقارب نموذي في التدريب؟

حاول تقليل معدل التعلم، وزيادة حقب التدريب، والتحقق من أن التجارب لها قيم حالة ومكافأة منسقة بشكل صحيح، أو استخدام حجم دفعة أصغر.

كيف يختلف هذا عن OpenAI RLHF؟

يركز AgentDB على التعلم المعزز من تفاعلات البيئة بدلاً من التغذية الراجعة البشرية. استخدم Decision Transformer للتعلم بالتقليد من العروض التوضيحية.

تفاصيل المطور

المؤلف

DNYoussef

الترخيص

MIT

المستودع

https://github.com/DNYoussef/ai-chrome-extension/tree/main/.claude/skills/agentdb-learning

مرجع

main

بنية الملفات

📄 SKILL.md