技能 verification-before-completion

📦

verification-before-completion

Name: verification-before-completion
Author: ZhanlinCui

低风险

Проверка перед объявлением завершения

也可从以下获取: Dimon94,obra,DYAI2025,Cycleaddict,sickn33,ANcpLua,Cygnusfear,davila7,CodingCossack

Этот навык предотвращает ложные заявления ИИ-агентов о завершении работы, требуя фактических доказательств проверки перед сообщением об успехе. Он гарантирует, что тесты проходят, сборка успешна, и работа действительно завершена.

支持: Claude Codex Code(CC)

⚠️ 66 差

下载技能 ZIP

在 Claude 中上传

前往设置 → 功能 → 技能 → 上传技能

开启并开始使用

测试它

正在使用“verification-before-completion”。 Тесты должны пройти сейчас

预期结果:

Запуск набора тестов...

Результаты: 42 тестов, 42 пройдено, 0 не пройдено
Код выхода: 0

Все тесты проходят.

正在使用“verification-before-completion”。 Сборка успешно завершена

预期结果:

Запуск команды сборки...

> npm run build
Код выхода: 0
Сборка успешно завершена.

Длина вывода: 2.3MB

正在使用“verification-before-completion”。 Ошибка исправлена

预期结果:

Запуск теста воспроизведения...

Исходный падающий ввод: {id: 123}
Ожидаемо: Выброшена ошибка
Фактически: Выброшена ошибка

Ошибка подтверждена как исправленная.

安全审计

低风险

v1 • 2/24/2026

This is a meta-skill providing verification guidelines. The static scanner flagged 13 external_commands patterns and 1 weak crypto pattern, but evaluation shows these are FALSE POSITIVES: the skill contains instructions for AI agents to run verification commands (tests, linters, builds) as text examples - not actual executable code. No cryptographic code exists. System/network reconnaissance flags refer to standard DevOps terms (VCS, git diff). This skill promotes honest verification practices and poses no security risk.

已扫描文件

140

分析行数

发现项

审计总数

高风险问题 (1)

SKILL.md:3

Weak Cryptographic Algorithm Flag

Static scanner flagged line 3 for weak crypto algorithm. Investigation shows this is a FALSE POSITIVE - the line contains only description text about verification workflows with no cryptographic code.

中风险问题 (1)

SKILL.md:71 SKILL.md:111

System Reconnaissance Flag

Static scanner flagged lines 71 and 111 for 'system reconnaissance'. These references are to standard DevOps concepts like 'Agent delegation' and 'VCS diff' - not actual system scanning.

低风险问题 (1)

SKILL.md:130

Network Reconnaissance Flag

Static scanner flagged line 130 for 'network reconnaissance'. This refers to 'communication' about completion status, not network scanning.

审计者: claude

质量评分

架构

100

可维护性

内容

社区

安全

规范符合性

你能构建什么

Проверка тестов перед коммитом

Перед коммитом кода требуется, чтобы ИИ запустил команды тестов и показал фактические количества прохождений/неудач из свежего выполнения.

Проверка сборки перед PR

Предотвращает преждевременное создание PR, требуя вывода команды сборки с кодом выхода 0 перед заявлением об успехе.

Валидация регрессионных тестов

Гарантирует, что регрессионные тесты следуют паттерну красный-зелёный: проходят после исправления, падают без исправления, проходят после восстановления.

试试这些提示

Базовый запрос проверки

Перед заявлением о завершении этой работы запустите команду проверки и покажите фактический вывод. Не заявляйте об успехе без доказательств.

Шаблон проверки тестов

Запустите полный набор тестов и сообщите: всего тестов, пройдено, не пройдено, и точные сообщения об ошибках для любых неудач. Покажите код выхода.

Шаблон проверки сборки

Запустите команду сборки и покажите код выхода. Сообщите о любых ошибках компиляции или предупреждениях из вывода.

Шаблон контрольного списка требований

Просмотрите исходные требования. Для каждого требования укажите: выполнено/не выполнено/пробел. Приведите конкретные доказательства из кода или вывода тестов.

最佳实践

Всегда запускайте свежие команды проверки - никогда не доверяйте кэшированным или предыдущим результатам
Читайте полный вывод, включая коды выхода, перед любыми заявлениями
Выражайте фактический статус с доказательствами, а не уверенностью или предположениями

避免

Заявление о завершении на основе отчётов об успехе агента без независимой проверки
Использование слов «должен», «вероятно», «кажется» перед проверкой
Полагание на частичные проверки, такие как прохождение линтера, когда нужна полная проверка сборки

常见问题

Этот навык запускает тесты за меня?

Нет. Этот навык инструктирует ИИ запускать команды проверки. Вы должны настроить фактические команды тестирования и сборки для вашего проекта.

Могу ли я использовать это с любым фреймворком тестирования?

Да. Навык не зависит от фреймворка. Он предоставляет руководства по проверке независимо от вашего инструментария тестирования.

Что если проверка занимает много времени?

Навык подчёркивает, что пропуск проверки для экономии времени создаёт ложную уверенность. Стоимость проверки меньше стоимости переделки из-за ложного завершения.

Работает ли это с Claude Code и Codex?

Да. Этот навык работает с Claude, Codex и Claude Code. Он направляет поведение ИИ независимо от конкретного инструмента.

Чем это отличается от простого запуска тестов?

Запуск тестов недостаточен. Этот навык требует: свежего выполнения, полного просмотра вывода, проверки кода выхода и заявлений на основе доказательств. Частичные или кэшированные результаты не подходят.

Может ли это предотвратить все ложные заявления о завершении?

Нет. Навык предоставляет руководства, но не может обеспечить соблюдение. Он полагается на следование ИИ инструкциям. Человеческий надзор остаётся важным.

开发者详情

作者

ZhanlinCui

许可证

MIT

仓库

https://github.com/ZhanlinCui/Ultimate-Agent-Skills-Collection/tree/main/verification-before-completion

引用

main

文件结构

📄 SKILL.md