技能 llm-app-patterns
📦

llm-app-patterns

安全

构建生产级 LLM 应用程序

构建 LLM 应用程序需要应对复杂的架构决策。本技能提供 RAG 管道、代理系统和生产运营的实战验证模式。

支持: Claude Codex Code(CC)
🥉 73 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“llm-app-patterns”。 用户问:公司的退款政策是什么?

预期结果:

  • 从向量数据库检索相关策略文档
  • 基于检索到的上下文生成带有来源引用的回答
  • 返回带有置信度分数和文档引用的响应

正在使用“llm-app-patterns”。 用户问:制定一个关于气候变化影响的研究项目计划

预期结果:

  • 创建包含以下步骤的计划:收集数据、分析趋势、确定来源、起草报告
  • 通过工具调用按顺序执行每个步骤
  • 将发现综合为全面的研究大纲

安全审计

安全
v1 • 2/25/2026

This skill is a documentation file containing educational content about LLM application patterns. All static analysis findings are false positives caused by markdown formatting. The backticks flagged are code block delimiters and ASCII art borders, not shell command execution. URLs are documentation references, not active network calls. Code examples like hashlib.sha256 are illustrative and use secure algorithms. No executable code or security risks detected.

1
已扫描文件
763
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
100
安全
83
规范符合性

你能构建什么

RAG 知识库

使用混合搜索和上下文压缩,构建基于文档的问答系统。

代理任务自动化

创建能够搜索、计算和综合信息的多步骤代理,使用 ReAct 或计划-执行模式。

LLM 生产监控

通过指标跟踪、分布式追踪和评估框架,实现 LLM 应用程序的可观测性。

试试这些提示

基础 RAG 提示词
仅根据以下上下文回答用户的问题。如果上下文未包含足够信息,请说明你没有足够的信息。

上下文:
{context}

问题:{question}

回答:
ReAct 代理提示词
你可以使用工具来回答问题的 AI 助手。

可用工具:
{tools_description}

使用以下格式:
Thought:[关于下一步操作的推理]
Action:[tool_name(arguments)]
Observation:[工具结果]
...(根据需要重复)
Thought:我有足够的信息来回答
Final Answer:[你的回答]

问题:{question}
带示例的少样本提示词
输入:{example1_input}
输出:{example1_output}

输入:{example2_input}
输出:{example2_output}

输入:{user_input}
输出:
研究提示词链
步骤 1(研究):研究主题:{input}
步骤 2(分析):分析这些发现:{research}
步骤 3(总结):用 3 个要点总结此分析:{analysis}

最佳实践

  • 使用结合语义匹配和关键词匹配的混合搜索以提高检索准确性
  • 对确定性提示词实施缓存以降低延迟和成本
  • 跟踪关键指标(如延迟、令牌使用量和用户满意度)以持续改进

避免

  • 使用不考虑文档结构的固定大小分块,这会破坏上下文
  • 跳过评估和监控,导致无法检测质量下降
  • 当主要 LLM 提供商出现故障时未实施降级策略

常见问题

RAG 和微调有什么区别?
RAG 在查询时检索相关文档并将其作为上下文提供,使模型能够访问最新信息而无需重新训练。微调在训练数据上调整模型权重,更适合学习风格或格式,但无法在训练后添加新知识。
如何选择不同的代理架构?
对交互式多步骤推理使用工具时选择 ReAct。对结构化 API 集成使用函数调用。对需要提前规划的复杂任务使用计划-执行模式。当不同子任务需要专业知识时使用多代理系统。
生产环境应该使用哪个向量数据库?
对于高扩展性的托管服务,使用 Pinecone。对于支持 GraphQL 的自托管方案,使用 Weaviate。对于现有的 PostgreSQL 基础设施,使用 pgvector。对于原型开发,为简单起见使用 ChromaDB。
如何降低 LLM API 成本?
对相似查询实施语义缓存,对简单任务使用较小的模型,优化提示词长度,设置适当的温度(对可缓存响应使用 0),以及在主要模型受到速率限制时使用降级模型。
应该为 LLM 应用程序跟踪哪些指标?
跟踪性能指标(延迟、每秒令牌数)、质量指标(用户满意度、任务完成率)、成本指标(每次请求成本、缓存命中率)和可靠性指标(错误率、超时率)。
如何处理 RAG 系统中的幻觉问题?
指示模型在上下文不足时说"我不知道",在评估中使用基础评分,实施检索质量检查,并考虑添加验证步骤,让模型为其主张引用来源。

开发者详情

文件结构

📄 SKILL.md