スキル judge
⚖️

judge

安全

Parallele Implementierungen bewerten

こちらからも入手できます: 2389-research

Wenn mehrere Implementierungen in einem Cookoff oder Omakase-Off konkurrieren, bewertet die Judge-Skill jede anhand von 5 Kriterien, um den Gewinner zu ermitteln. Dies garantiert qualitative Entscheidungen, wenn parallele Agenten unterschiedliche Ergebnisse produzieren.

対応: Code(CC)
⚠️ 66 貧弱
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「judge」を使用しています。 Judge the three implementations in context using the 5-criteria framework

期待される結果:

  • ## Gate Check: impl-1: 4/4 tests pass, Design Adherence: Yes; impl-2: 3/4 tests pass, Design Adherence: Yes; impl-3: 4/4 tests pass, Design Adherence: No
  • ## Judge Scorecard: impl-1: 21/25; impl-2: 18/25; impl-3: 15/25
  • ## Winner: impl-1 - Best balance of readability and maintainability with strong fitness score

セキュリティ監査

安全
v3 • 1/10/2026

Pure prompt-based skill with no executable code. Contains only markdown instructions for AI scoring framework. No filesystem access, network calls, or command execution capabilities.

1
スキャンされたファイル
178
解析された行数
0
検出結果
3
総監査数
セキュリティ問題は見つかりませんでした
監査者: claude 監査履歴を表示 →

品質スコア

38
アーキテクチャ
100
保守性
81
コンテンツ
21
コミュニティ
100
セキュリティ
70
仕様準拠

作れるもの

Cookoff-Bewertung

Bewerte konkurrierende Implementierungen desselben Designs, um den besten Ansatz zu ermitteln

Omakase-Off-Vergleich

Evaluiere unterschiedliche architektonische Ansätze und wähle die optimale Lösung

Automatisierte Qualitätsgates

Wende konsistente Bewertungskriterien auf mehrere Implementierungen an

これらのプロンプトを試す

Grundlegende Bewertungsanfrage
Bewerte die Implementierungen im Kontext anhand des 5-Kriterien-Bewertungsframeworks. Fülle vollständige Bewertungsbögen für jede Implementierung aus.
Cookoff-Bewertung
Führe die Judge-Skill für impl-1, impl-2 und impl-3 aus dem Cookoff aus. Wende alle Bewertungskriterien an und verkünde den Gewinner.
Omakase-Vergleich
Vergleiche variant-a und variant-b mit der Judge-Skill. Beachte, dass dies unterschiedliche Ansätze sind, nicht unterschiedliche Implementierungen desselben Designs.
Detaillierte Analyse
Stelle vollständige Bewertungsbögen mit allen ausgefüllten Checklistenpunkten bereit. Einschließlich Machbarkeitsprüfungen und harter Gate-Ergebnisse. Erkläre Trade-offs zwischen allen Implementierungen.

ベストプラクティス

  • Stelle sicher, dass alle Implementierungen im Kontext sichtbar sind, bevor du Judge aufrufst
  • Führe eine Frische-Augen-Überprüfung der verbliebenen Kandidaten vor der Judge-Bewertung durch
  • Dokumentiere die Begründung der Auswahl für zukünftige Referenz

回避

  • Judge direkt aufrufen - sollte von Cookoff oder Omakase-Off aufgerufen werden
  • Machbarkeitsprüfungen überspringen - sie fangen kritische Probleme früh ab
  • Halbe-Punkt-Bewertungen verwenden - nur ganzzahlige Bewertungen von 1-5 sind gültig

よくある質問

Wie wird der Gewinner ermittelt?
Die höchstbewertete Implementierung gewinnt, es sei denn, ein hartes Gate wird ausgelöst. Das Fitness-Gate (Delta >= 2) lässt automatisch die Implementierung mit höherer Fitness vorrücken. Kritische Fehler (jede Bewertung von 1) eliminieren Implementierungen.
Kann ich Judge direkt aufrufen?
Nein. Judge wird automatisch von Cookoff oder Omakase-Off in Phase 4 aufgerufen. Direkter Aufruf kann unvollständige Ergebnisse produzieren.
Was passiert, wenn Implementierungen gleiche Bewertungen haben?
Die Skill spezifiziert keine Tie-Breaker-Methode. Überprüfe die Bewertungsbögen, um Unterschiede zu identifizieren, oder fordere eine menschliche Beurteilung basierend auf den detaillierten Kriterien an.
Führt Judge Tests aus?
Nein. Judge geht davon aus, dass Tests bereits ausgeführt wurden und Ergebnisse im Kontext verfügbar sind. Es bewertet Code und Design-Adhärenz, nicht die Testausführung.
Kann Judge mehr als 3 Implementierungen bewerten?
Das Format zeigt 3 Spalten, kann aber erweitert werden. Die Skill funktioniert für beliebig viele Implementierungen, wobei Spalten bei Bedarf hinzugefügt werden.
Was ist der Unterschied zwischen Cookoff und Omakase-Bewertung?
Cookoff vergleicht Implementierungen desselben Designs. Omakase vergleicht unterschiedliche architektonische Ansätze. Das Bewertungsframework ist dasselbe, aber die Interpretation unterscheidet sich.

開発者の詳細

ファイル構成

📄 SKILL.md