judge
Сравнение реализаций кода с помощью оценочной рубрики
Командам часто сложно выбирать между похожими реализациями кода, используя согласованные критерии. Этот навык предоставляет структурированную рубрику для оценки, проверок, компромиссов и выбора победителя.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Ресурсы для AI-агентов
Используйте эти ссылки, когда AI-агенту, crawler или script нужен чистый контекст вместо полной страницы.
Протестировать
Использование «judge». Сравните impl-1 и impl-2 для небольшого рефакторинга API.
Ожидаемый результат:
Таблица gate check, рабочий лист оценки из пяти частей для каждой реализации, итоговая оценочная таблица, результаты hard gate и обоснование победителя.
Использование «judge». Оцените variant-a и variant-b для двух разных продуктовых дизайнов.
Ожидаемый результат:
Сравнение на основе рубрики, которое объясняет различия в соответствии задаче, определяет флаги осуществимости и фиксирует компромиссы проигравшего варианта.
Аудит безопасности
Низкий рискStatic analysis found several high-risk patterns, but review shows they are false positives from Markdown formatting, rubric text, and placeholder labels. No evidence found for command execution, credential theft, weak cryptography, Windows SAM access, reconnaissance, network use, or prompt injection.
Static false positives ignored (4)
These static matches were dismissed by semantic review or matched schema-only tokens, so they are shown for transparency but do not drive the quality score.
Оценка качества
Что вы можете построить
Выбрать лучшую сгенерированную реализацию
Сравните несколько сгенерированных вариантов кода и выберите тот, который лучше всего соответствует заявленным требованиям.
Оценить конкурирующие архитектурные подходы
Оцените разные стратегии реализации по сопровождаемости, надежности и соответствию цели перед слиянием работы.
Документировать решения о выборе
Создайте краткую оценочную таблицу, объясняющую, почему победила одна реализация и какие компромиссы остаются.
Попробуйте эти промпты
Используйте judge rubric, чтобы сравнить impl-1 и impl-2. Включите gate checks, оценки по критериям, итоговые оценки, победителя и компромиссы.
Оцените impl-1, impl-2 и impl-3 относительно исходных требований. Примените hard gates и объясните победившую реализацию.
Используйте judge rubric для variant-a и variant-b. Рассматривайте различия в соответствии задаче как допустимые различия решений, затем определите лучший подход.
Повторно оцените кандидатные реализации, уделяя особое внимание скрытой сложности, будущей стоимости сопровождения и надежности при реалистичной нагрузке.
Лучшие практики
- Предоставьте исходные требования, результаты тестов и краткие описания реализаций перед вызовом навыка.
- Используйте одинаковый стандарт доказательств для каждой сравниваемой реализации.
- Фиксируйте компромиссы даже тогда, когда одна реализация явно побеждает.
Избегать
- Не используйте его до того, как будут доступны код реализации и результаты тестов.
- Не считайте равные итоговые оценки взаимозаменяемыми без проверки hard gates.
- Не пропускайте разделы рубрики только потому, что одна реализация кажется очевидно лучше.
Часто задаваемые вопросы
Что оценивает этот навык?
Может ли он запускать тесты?
Сколько реализаций он может сравнить?
Это только для Claude?
Поддерживает ли он разные подходы к дизайну?
Какой результат следует ожидать пользователям?
Сведения для разработчиков
Структура файлов
📄 SKILL.md