技能 when-optimizing-agent-learning-use-reasoningbank-intelligence
🧠

when-optimizing-agent-learning-use-reasoningbank-intelligence

安全 ⚡ 包含腳本🌐 網路存取📁 檔案系統存取⚙️ 外部命令

Implementar aprendizaje adaptativo de agentes con ReasoningBank

El rendimiento de los agentes se estanca sin aprender de la experiencia. ReasoningBank captura trayectorias de decisiones, extrae patrones y entrena modelos para mejorar continuamente las estrategias de los agentes a lo largo del tiempo.

支援: Claude Codex Code(CC)
📊 69 充足
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「when-optimizing-agent-learning-use-reasoningbank-intelligence」。 Initialize ReasoningBank and capture 20 agent trajectories

預期結果:

  • Sistema de aprendizaje inicializado con 20 trayectorias capturadas
  • Extracción de patrones: 5 grupos identificados con umbral de similitud del 85 por ciento
  • Patrón principal: secuencia de recuperación de errores con tasa de éxito del 92 por ciento
  • Modelo de decisión entrenado: 100 épocas, tamaño de lote 32
  • Mejora de rendimiento: 23 por ciento más rápido en completar tareas
  • Guía de integración generada y modelo exportado

正在使用「when-optimizing-agent-learning-use-reasoningbank-intelligence」。 Train decision model on patterns and benchmark results

預期結果:

  • Modelo Decision Transformer creado con tamaño oculto de 256
  • Entrenamiento completado con pérdida de 0.002 después de 100 épocas
  • Puntuación promedio del agente base: 72 por ciento
  • Puntuación promedio del agente optimizado: 89 por ciento
  • Mejora de rendimiento: 23.6 por ciento
  • Modelo exportado a /tmp/reasoningbank-export.json

安全審計

安全
v5 • 1/17/2026

Pure documentation skill containing markdown files only (SKILL.md, PROCESS.md, README.md). No executable code files exist (.js, .py files). All 88 static findings are false positives caused by the analyzer incorrectly flagging markdown code examples as actual command execution. The skill is instructional content for ML libraries with no network calls, no credential handling, and no file system operations beyond documentation examples.

5
已掃描檔案
1,076
分析行數
4
發現項
5
審計總數

風險因素

⚡ 包含腳本
未記錄任何特定位置
🌐 網路存取
未記錄任何特定位置
📁 檔案系統存取
未記錄任何特定位置
⚙️ 外部命令
未記錄任何特定位置
審計者: claude 查看審計歷史 →

品質評分

38
架構
100
可維護性
85
內容
30
社群
100
安全
78
規範符合性

你能建構什麼

Construir agentes auto-mejorables

Crear agentes que aprendan de la experiencia y optimicen su toma de decisiones a lo largo del tiempo

Experimentar con algoritmos de RL

Probar y comparar 9 algoritmos de aprendizaje por refuerzo para optimización de estrategias de agentes

Optimizar flujos de trabajo repetitivos

Identificar y aplicar automáticamente patrones de ejecuciones de tareas exitosas

試試這些提示

Inicializar Sistema
Initialize ReasoningBank with trajectory tracking, register schema, and configure verdict criteria for my agent
Capturar Patrones
Capture agent decision trajectories and extract patterns using vector similarity with 0.85 threshold
Entrenar Modelo
Train a Decision Transformer model on extracted patterns and generate top 5 strategy recommendations
Validar e Implementar
Benchmark baseline versus optimized agent performance and export the trained model for production deployment

最佳實務

  • Recopilar trayectorias diversas incluyendo tanto intentos exitosos como fallidos para un aprendizaje equilibrado
  • Validar patrones con al menos 80 por ciento de tasa de éxito antes de aplicar optimizaciones
  • Monitorear el rendimiento en producción después del despliegue y reentrenar modelos regularmente

避免

  • Aplicar optimizaciones sin validar primero las tasas de éxito de los patrones
  • Entrenar con datos de trayectoria insuficientes con menos de 10 muestras
  • Omitir la comparación de referencia entre agentes base y optimizados

常見問題

¿Qué herramientas de IA admiten esta habilidad?
Claude, Claude Code y Codex con integración de claude-flow para orquestación de tareas
¿Cuántas trayectorias necesito?
Se recomiendan mínimo 10 a 20 trayectorias diversas para una extracción de patrones confiable
¿Puedo usar esto sin AgentDB?
Sí, pero las operaciones serán más lentas. AgentDB proporciona búsqueda vectorial 150x más rápida
¿Están seguros mis datos?
Las trayectorias permanecen locales y solo se usan para entrenamiento del modelo dentro de tu entorno
¿Por qué la mejora es menor al 15 por ciento?
Diversidad de trayectoria insuficiente o datos de baja calidad. Recopila ejemplos más variados y valida patrones
¿En qué se diferencia esto de la ingeniería de prompts?
Esto optimiza el comportamiento del agente a nivel de modelo a través de la experiencia, no solo ajuste de prompts