技能 skill-judge
📦

skill-judge

安全

Avaliar Qualidade de Agente de Habilidade

Muitas habilidades desperdiçam tokens em conteúdo que o Claude já conhece. Esta habilidade fornece uma estrutura sistemática de 8 dimensões com pontuação de 120 pontos para avaliar a qualidade do design da habilidade, identificar desperdício de tokens e gerar sugestões de melhoria acionáveis.

支持: Claude Codex Code(CC)
📊 70 充足
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“skill-judge”。 Evaluate the skill at skills/my-new-skill/SKILL.md

预期结果:

  • Total Score: 92/120 (77%) - Grade: C
  • Pattern: Process (appropriate for multi-step workflow)
  • Knowledge Ratio: E:A:R = 45:30:25
  • Top Issue: D5 Progressive Disclosure scored 6/15 - references directory unused
  • Recommendation: Add explicit MANDATORY loading triggers to workflow steps

正在使用“skill-judge”。 Compare skills/skill-a and skills/skill-b

预期结果:

  • Skill A: 108/120 (90%) - Grade A
  • Skill B: 74/120 (62%) - Grade D
  • Key Difference: Skill A has 70% Expert content vs 35% for Skill B
  • Skill B fails on D1 (Knowledge Delta) - explains basics Claude knows

安全审计

安全
v1 • 1/26/2026

All static findings are false positives. This is a documentation-only skill containing markdown files (SKILL.md, README.md) with educational content about skill evaluation. The detected 'Ruby/shell backtick execution' patterns are markdown backticks used for code formatting. The 'weak cryptographic algorithm' patterns are text references in documentation examples. No executable code, scripts, network operations, or file system access exists in this skill.

2
已扫描文件
999
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
29
社区
100
安全
83
规范符合性

你能构建什么

Revisar Habilidades Antes de Publicar

Avaliar uma habilidade nova ou atualizada contra melhores práticas para garantir que ela adicione valor genuíno antes de publicar em um mercado de habilidades.

Auditar Coleções de Habilidades Existentes

Avaliar sistematicamente todas as habilidades em uma coleção para identificar quais precisam de melhoria e priorizar esforços de refatoração.

Aprender Padrões de Design de Habilidade

Entender o que torna uma habilidade eficaz revisando critérios de avaliação e padrões comuns de falha para aplicar em suas próprias habilidades.

试试这些提示

Avaliação Básica de Habilidade
Evaluate the skill at {path}/SKILL.md using the skill-judge framework. Score it across all 8 dimensions and provide a final grade with specific improvement suggestions.
Análise Comparativa de Habilidades
Compare skills/skill-a and skills/skill-b using the skill-judge framework. Identify which has better design and explain why based on the 8 evaluation dimensions.
Avaliação de Delta de Conhecimento
Focus on the knowledge delta in my skill at {path}/SKILL.md. Identify sections that are redundant (Claude already knows this) versus genuine expert-only knowledge that adds value.
Identificação de Padrões
What pattern does my skill follow (Mindset, Navigation, Philosophy, Process, or Tool)? Is this the right choice for the skills purpose? Evaluate and suggest improvements.

最佳实践

  • Sempre priorize o delta de conhecimento - cada parágrafo deve ganhar seus tokens ensinando ao Claude algo que ele não saberia de outra forma
  • Use o campo de descrição para responder três perguntas: O que a habilidade faz, Quando deve ser usada, e Quais palavras-chave a acionam
  • Siga padrões de design estabelecidos (Mindset, Navigation, Philosophy, Process, Tool) baseados no propósito e complexidade da habilidade
  • Implemente revelação progressiva com gatilhos de carregamento para que referências sejam carregadas apenas quando necessário

避免

  • O Tutorial - explicando conceitos que o Claude já sabe como o que é um PDF ou como escrever código básico
  • O Despejo - colocando tudo em um único arquivo de mais de 800 linhas sem revelação progressiva
  • A Habilidade Invisível - tendo ótimo conteúdo, mas uma descrição vaga que impede o Agente de saber quando ativá-la

常见问题

O que é o conceito de delta de conhecimento?
Delta de conhecimento mede o que uma habilidade adiciona além do que o Claude já sabe. Boas habilidades contêm conhecimento apenas de especialista - decisões, compensações e padrões anti-falha que levam anos de experiência para aprender. Habilidades explicando básico desperdiçam tokens.
Como a pontuação é calculada?
A estrutura usa 8 dimensões com 120 pontos totais: Delta de Conhecimento (20), Mentalidade + Procedimentos (20), Qualidade Anti-Padrão (15), Conformidade com Especificação (15), Revelação Progressiva (15), Calibração de Liberdade (15), Reconhecimento de Padrão (10), Usabilidade Prática (15).
Quais são os cinco padrões de design?
Mindset (50 linhas) para tarefas criativas, Navigation (30 linhas) para múltiplos cenários, Philosophy (150 linhas) para criação original, Process (200 linhas) para fluxos de trabalho complexos, Tool (300 linhas) para operações de formato preciso.
Por que o campo de descrição é tão importante?
A descrição é a única coisa que o Agente vê antes de decidir carregar uma habilidade. Ela deve responder O Que, Quando e incluir Palavras-chave. Uma habilidade com conteúdo perfeito, mas descrição ruim, nunca será ativada.
Como melhoro a pontuação de uma habilidade?
Foque nas dimensões de menor pontuação primeiro. Melhorias comuns: remover explicações redundantes, adicionar anti-padrões específicos com razões, criar gatilhos de carregamento para referências, e tornar a descrição mais específica com cenários de acionamento.
Esta habilidade avalia a si mesma?
Sim, skill-judge é projetado para passar em sua própria avaliação. Ele fornece critérios de avaliação de nível especialista que o Claude não geraria, segue o padrão Tool apropriadamente, e tem documentação abrangente.

开发者详情

文件结构

📄 README.md

📄 SKILL.md