Skillstore Skillstore
CompétencesPluginsVersionsDocsSoumettre
Compétences Auteurs pinchbench
pinchbench

pinchbench

Actif
1
Compétences
1
Catégories
ClaudeCodexCode(CC)

Skills publiés 1

📦

pinchbench

Évaluer les performances de l'agent OpenClaw sur 23 tâches du monde réel

Risque faible 75

Tester des modèles LLM en tant qu'agents IA nécessite une évaluation cohérente et mesurable. PinchBench propose 23 tâches diverses couvrant la gestion du calendrier, la gestion des e-mails, la recherche, le codage et les workflows multi-étapes avec notation automatique et soumission au classement public.

Claude Codex Code(CC)
Installer
Skillstore Skillstore
Documentation GitHub À propos

© 2025 Skillstore