skill-judge
Avaliar Qualidade de Agente de Habilidade
Muitas habilidades desperdiçam tokens em conteúdo que o Claude já conhece. Esta habilidade fornece uma estrutura sistemática de 8 dimensões com pontuação de 120 pontos para avaliar a qualidade do design da habilidade, identificar desperdício de tokens e gerar sugestões de melhoria acionáveis.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“skill-judge”。 Evaluate the skill at skills/my-new-skill/SKILL.md
预期结果:
- Total Score: 92/120 (77%) - Grade: C
- Pattern: Process (appropriate for multi-step workflow)
- Knowledge Ratio: E:A:R = 45:30:25
- Top Issue: D5 Progressive Disclosure scored 6/15 - references directory unused
- Recommendation: Add explicit MANDATORY loading triggers to workflow steps
正在使用“skill-judge”。 Compare skills/skill-a and skills/skill-b
预期结果:
- Skill A: 108/120 (90%) - Grade A
- Skill B: 74/120 (62%) - Grade D
- Key Difference: Skill A has 70% Expert content vs 35% for Skill B
- Skill B fails on D1 (Knowledge Delta) - explains basics Claude knows
安全审计
安全All static findings are false positives. This is a documentation-only skill containing markdown files (SKILL.md, README.md) with educational content about skill evaluation. The detected 'Ruby/shell backtick execution' patterns are markdown backticks used for code formatting. The 'weak cryptographic algorithm' patterns are text references in documentation examples. No executable code, scripts, network operations, or file system access exists in this skill.
质量评分
你能构建什么
Revisar Habilidades Antes de Publicar
Avaliar uma habilidade nova ou atualizada contra melhores práticas para garantir que ela adicione valor genuíno antes de publicar em um mercado de habilidades.
Auditar Coleções de Habilidades Existentes
Avaliar sistematicamente todas as habilidades em uma coleção para identificar quais precisam de melhoria e priorizar esforços de refatoração.
Aprender Padrões de Design de Habilidade
Entender o que torna uma habilidade eficaz revisando critérios de avaliação e padrões comuns de falha para aplicar em suas próprias habilidades.
试试这些提示
Evaluate the skill at {path}/SKILL.md using the skill-judge framework. Score it across all 8 dimensions and provide a final grade with specific improvement suggestions.Compare skills/skill-a and skills/skill-b using the skill-judge framework. Identify which has better design and explain why based on the 8 evaluation dimensions.
Focus on the knowledge delta in my skill at {path}/SKILL.md. Identify sections that are redundant (Claude already knows this) versus genuine expert-only knowledge that adds value.What pattern does my skill follow (Mindset, Navigation, Philosophy, Process, or Tool)? Is this the right choice for the skills purpose? Evaluate and suggest improvements.
最佳实践
- Sempre priorize o delta de conhecimento - cada parágrafo deve ganhar seus tokens ensinando ao Claude algo que ele não saberia de outra forma
- Use o campo de descrição para responder três perguntas: O que a habilidade faz, Quando deve ser usada, e Quais palavras-chave a acionam
- Siga padrões de design estabelecidos (Mindset, Navigation, Philosophy, Process, Tool) baseados no propósito e complexidade da habilidade
- Implemente revelação progressiva com gatilhos de carregamento para que referências sejam carregadas apenas quando necessário
避免
- O Tutorial - explicando conceitos que o Claude já sabe como o que é um PDF ou como escrever código básico
- O Despejo - colocando tudo em um único arquivo de mais de 800 linhas sem revelação progressiva
- A Habilidade Invisível - tendo ótimo conteúdo, mas uma descrição vaga que impede o Agente de saber quando ativá-la