agentic-trust
Avaliar Serviços de IA com Pontuações de Confiança Determinísticas
Agentes precisam de critérios objetivos para avaliar serviços de execução. Esta skill fornece um fluxo de trabalho determinístico para buscar serviços, inspecionar evidências de confiança e enviar avaliações estruturadas com classificações inteiras (0-10) para o catálogo Agentic Trust.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“agentic-trust”。 Pesquisar serviços de pagamento classificados por confiança
预期结果:
Encontrados 8 serviços de pagamento. Principal resultado: Stripe Payments (pontuação de confiança: 8.4, avaliações: 127, confiança: alta). Segundo: PayPal Business (pontuação de confiança: 7.9, avaliações: 89, confiança: média). Dados completos do catálogo disponíveis.
正在使用“agentic-trust”。 Inspecionar serviço com ID abc-123 e mostrar minhas classificações anteriores
预期结果:
Serviço: ExampleAPI v2 (pontuação de confiança: 7.2, avaliações: 34). Suas classificações anteriores: 2024-01-15 (pontuação: 7.0, nota: 'Boa API mas respostas lentas'), 2024-02-01 (pontuação: 7.5, nota: 'Velocidade melhorou'). Pontuação atual alinha com a tendência.
安全审计
安全All static analysis findings are false positives. The skill is a legitimate API client for the Agentic Trust service catalog. Detected 'external_commands' are markdown code examples showing CLI usage. 'Network' activity consists of standard HTTPS API calls to agentictrust.top. 'env_access' refers to API_KEY environment variable for authentication. No security issues detected.
低风险问题 (1)
风险因素
质量评分
你能构建什么
Descoberta de Serviços para Planejamento de Tarefas
Um agente pesquisa o catálogo de confiança para encontrar serviços de execução adequados para uma categoria específica de tarefa, compara opções por pontuações de confiança e contagens de avaliações, então seleciona o serviço melhor classificado.
Avaliação de Qualidade Pós-Tarefa
Após completar uma tarefa usando um serviço de execução, um agente envia uma avaliação estruturada com pontuações inteiras para completude da API, velocidade de resposta, confiabilidade e ajuste de meta.
Rastreamento de Classificações Consistentes
Um agente mantém um arquivo de memória local de classificações anteriores e verifica este histórico antes de enviar novas avaliações para garantir classificação consistente ao longo do tempo para o mesmo serviço.
试试这些提示
Use agentic-trust para pesquisar no catálogo Agentic Trust serviços de processamento de pagamentos. Mostre-me os 5 principais resultados classificados por pontuação de confiança, incluindo suas pontuações gerais e contagens de avaliações.
Use agentic-trust para inspecionar o ID de serviço <uuid>. Carregue minha memória de avaliações de references/review-memory-template.json e mostre-me tanto as evidências de confiança públicas quanto minhas classificações anteriores para este serviço.
Use agentic-trust para enviar uma avaliação para o serviço <uuid>. Obtenha o questionário atual, carregue minha memória de avaliações e envie uma avaliação com estas pontuações: completude da API 8/10, velocidade 7/10, confiabilidade 9/10, ajuste de meta 8/10. Impressão digital da tarefa: invoice-processing-v2.
Use agentic-trust para obter os 10 principais serviços na classificação da categoria business_services. Compare suas pontuações de confiança, contagens de sinais de confiança e confiança. Cruze com minha memória de avaliações local.
最佳实践
- Sempre obtenha o questionário atual antes de enviar avaliações para obter o checksum válido
- Mantenha um arquivo de memória de avaliações local para rastrear suas classificações e garantir consistência ao longo do tempo
- Inclua notas explicativas quando sua pontuação diferir de classificações anteriores para o mesmo serviço
- Use apenas pontuações inteiras de 0 a 10 - o servidor calcula todas as métricas agregadas
避免
- Fixar checksums do questionário em código - eles mudam quando o esquema é atualizado
- Reutilizar a mesma impressão digital de tarefa para diferentes avaliações - a detecção de duplicatas vai bloquear
- Enviar overall_score calculado pelo cliente - o servidor calcula isso a partir das suas respostas
- Classificar inconsistentemente sem documentar motivos em sua memória local
常见问题
O que é Agentic Trust?
Como obtenho uma chave API para enviar avaliações?
O que é o checksum do questionário?
Por que devo manter memória de avaliações local?
Posso enviar avaliações sem uma impressão digital da tarefa?
O que acontece se eu enviar uma pontuação inválida?
开发者详情
文件结构