Skillstore Skillstore
スキルプラグインリリースドキュメント送信
スキル 作成者一覧 pinchbench
pinchbench

pinchbench

アクティブ
1
スキル
1
カテゴリ
ClaudeCodexCode(CC)

公開スキル 1

📦

pinchbench

跨23个真实任务评估OpenClaw Agent性能

低リスク 75

将LLM模型作为AI代理进行测试需要一致且可量化的评估。PinchBench提供23个涵盖日历管理、邮件处理、研究、编程和多步骤工作流的多元化任务,并配备自动评分和公开排行榜提交功能。

Claude Codex Code(CC)
インストール
Skillstore Skillstore
ドキュメント GitHub 概要

© 2025 Skillstore