スキル agent-orchestration-improve-agent
🔧

agent-orchestration-improve-agent

安全

AIエージェ��トのパフォーマンス最適化

このスキルは、データドリブンな分析、プロンプトエンジニアリング、構造化されたテストワークフローを通じて、AIエージェントのパフォーマンスを体系的に改善し、測定可能な結果による継続的なエージェント最適化を可能にします。

対応: Claude Codex Code(CC)
🥉 74 ブロンズ
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「agent-orchestration-improve-agent」を使用しています。 過去30日間のカスタマーサポートエージェントのパフォーマンスを分析してください

期待される結果:

パフォーマンス分析レポート:
- タスク成功率:78%(ベースライン:72%)
- 主な失敗モード:コンテキストの損失(23%)、ツールの誤使用(18%)、出力フォーマットエラー(15%)
- 推奨優先事項:会話要約プロンプトを通じてコンテキストの損失に対処
- 期待される改善:成功率8-12%の向上

「agent-orchestration-improve-agent」を使用しています。 プロンプトバージョンを比較するためのA/Bテストを設計してください

期待される結果:

A/Bテストフレームワーク:
- テストセット:100の代表的な会話
- エージェントA:元のプロンプト
- エージェントB:思考連鎖で強化
- 指標:成功率、平均応答時間、ユーザー満足度
- 要件:95%信頼水準、バリアントあたり最低100サンプル

セキュリティ監査

安全
v1 • 2/24/2026

All 24 static findings are false positives. The skill is documentation providing guidance on AI agent optimization methodology. Detected 'external commands' are markdown tool references, not actual shell execution. Detected 'cryptographic algorithms' are plain text describing performance improvements. No actual security risks present.

1
スキャンされたファイル
352
解析された行数
0
検出結果
1
総監査数
セキュリティ問題は見つかりませんでした
監査者: claude

品質スコア

38
アーキテクチャ
100
保守性
87
コンテンツ
50
コミュニティ
100
セキュリティ
91
仕様準拠

作れるもの

エンタープライズAIチームのエージェント最適化

体系的なパフォーマンス分析とプロンプトエンジニアリングを使用して、カスタマーサービスエージェントの精度と応答品質を改善します。

開発者ワークフローの強化

構造化されたテストとA/B比較を適用して、特定のプログラミング言語またはフレームワーク向けのコード生成エージェントを最適化します。

研究に基づくエージェントの反復

包括的な評価指標と人間による評価プロトコルを活用して、エージェントの動作改善を研究します。

これらのプロンプトを試す

基本的なエージェントパフォーマンスレビュー
最近のインタラクションをレビューして、エージェントのパフォーマンスを分析してください。上位3つの失敗モードを特定し、それぞれについてプロンプトエンジニアリングの改善を提案してください。
プロンプト最適化リクエスト
エ��ジェントの推論能力を向上させるために、思考連鎖の強化と少数ショット例の最適化を適用してください。現在のプロンプトの焦点:[現在のプロンプトを説明]。目標改善領域:[領域を説明]。
A/Bテスト設計
現在のエージェントバージョンと改善バージョンを比較するためのA/Bテストフレームワークを設計してください。テストカテゴリ、必要なサンプルサイズ、統計的有意性の基準を含めてください。
段階的���ールアウト計画
改善されたエージェントバージョンをデプロイするための段階的ロールアウト計画を作成してください。アルファ、ベータ、カナリーリリース段階と、モニタリング基準およびロールバックトリガーを含めてください。

ベストプラクティス

  • 実際の影響を測定するために、改善を��う前に必ず定量的ベースライン指標を確立してください
  • 完全なデプロイ前に問題を早期に発見するために、モニタリング付きの段階的ロールアウトを使用してください
  • プロンプトの変更を本番環境にデプロイする前に、ロールバック手順を実装してください

回避

  • 以前成功したタスクでの回帰テストなしでのプロンプト変更のデプロイ
  • 統計的検証���スキップと不十分なテストサンプルサイズの使用
  • 改善領域の優先順位付け时的なユーザーフィードバックパターンの無視

よくある質問

エージェントの最適化を開始するにはどのようなデータが必要ですか?
ベースラインパフォーマンス指標、代表的な会話例、理想的にはユーザーフィードバックまたは修正パターンが必要です。このスキルは、少なくとも30日間のインタラクションデータで最適に機能します。
このスキルでゼロから新しいエージェントを作成できますか?
いいえ。このスキルは既存のエージェントを最適化します。新しいエージェントの作成については、エージェントの足場構築または初期プロンプト設計に焦点を当てたスキルを探してください。
エージェントの最適化にはどのくらい時間がかかりますか?
完全な最適化サイクルには通常2〜4週間かかります:分析に1���間、プロンプトの改善に1週間、テストと検証に1〜2週間です。
エージェントのパフォーマンスにはどのような指標を追跡すべきですか?
主な指標には、タスク完了率、応答精度、ツール使用効率、応答レイテンシ、トークン消費量、ユーザー満足度スコアが含まれます。
エージェントの改善が機能しているかどう爷どうすればわかりますか?
統計的有意性(95%信頼水準)を伴うA/Bテストを使用してください。元のバージョンと改善バージョン間で成功率、ユーザー修正、満足度スコアを比較してください。
このスキルはClaude Codeと互換性がありますか?
はい。最適化手法は任意のClaudeエージェントで機能します。プロンプトとフレームワークはツールに依存せず、エージェントの動作パターンの改善に焦点を当てています。

開発者の詳細

ファイル構成

📄 SKILL.md