技能 llm-app-patterns
📦

llm-app-patterns

安全

Создание промышленных LLM-приложений

Разработка LLM-приложений требует навигации по сложным архитектурным решениям. Этот навык предоставляет проверенные паттерны для RAG-конвейеров, агентских систем и производственной эксплуатации.

支持: Claude Codex Code(CC)
📊 69 充足
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“llm-app-patterns”。 Пользователь спрашивает: Какова политика возврата средств компании?

预期结果:

  • Извлекает соответствующие документы политики из векторной базы данных
  • Генерирует ответ, основанный на извлечённом контексте с цитированием источников
  • Возвращает ответ с оценкой уверенности и ссылками на документы

正在使用“llm-app-patterns”。 Пользователь спрашивает: Спланируйте исследовательский проект о влиянии изменения климата

预期结果:

  • Создаёт план с шагами: сбор данных, анализ трендов, выявление источников, составление отчёта
  • Выполняет каждый шаг последовательно с вызовами инструментов
  • Синтезирует находки в комплексный исследовательский план

安全审计

安全
v1 • 2/25/2026

This skill is a documentation file containing educational content about LLM application patterns. All static analysis findings are false positives caused by markdown formatting. The backticks flagged are code block delimiters and ASCII art borders, not shell command execution. URLs are documentation references, not active network calls. Code examples like hashlib.sha256 are illustrative and use secure algorithms. No executable code or security risks detected.

1
已扫描文件
763
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
26
社区
100
安全
83
规范符合性

你能构建什么

База знаний RAG

Построение системы вопрос-ответ, основанной на вашей документации, с использованием гибридного поиска и контекстного сжатия.

Автоматизация задач агента

Создание многошаговых агентов, которые могут искать, вычислять и синтезировать информацию с использованием паттернов ReAct или Plan-and-Execute.

Мониторинг продакшена LLM

Реализация наблюдаемости для LLM-приложений с отслеживанием метрик, распределённой трассировкой и фреймворками оценки.

试试这些提示

Базовый RAG промт
Answer the user's question based ONLY on the following context. If the context doesn't contain enough information, say you don't have enough information.

Context:
{context}

Question: {question}

Answer:
Промт ReAct агента
You are an AI assistant that can use tools to answer questions.

Available tools:
{tools_description}

Use this format:
Thought: [your reasoning about what to do next]
Action: [tool_name(arguments)]
Observation: [tool result]
... (repeat as needed)
Thought: I have enough information to answer
Final Answer: [your response]

Question: {question}
Few-Shot промт с примерами
Input: {example1_input}
Output: {example1_output}

Input: {example2_input}
Output: {example2_output}

Input: {user_input}
Output:
Цепочка промтов для исследования
Step 1 (Research): Research the topic: {input}
Step 2 (Analyze): Analyze these findings: {research}
Step 3 (Summarize): Summarize this analysis in 3 bullet points: {analysis}

最佳实践

  • Используйте гибридный поиск, комбинируя семантический и ключевой поиск для лучшей точности извлечения
  • Реализуйте кэширование для детерминированных промтов для снижения задержки и затрат
  • Отслеживайте ключевые метрики: задержку, использование токенов и удовлетворённость пользователей для постоянного улучшения

避免

  • Использование чанкинга фиксированного размера без учёта структуры документа, что нарушает контекст
  • Пропуск оценки и мониторинга, что делает невозможным обнаружение деградации качества
  • Отсутствие реализации резервных стратегий, когда основные провайдеры LLM испытывают простои

常见问题

В чём разница между RAG и fine-tuning?
RAG извлекает соответствующие документы во время запроса и предоставляет их как контекст, позволяя модели получать доступ к актуальной информации без переобучения. Fine-tuning корректирует веса модели на обучающих данных, что лучше для изучения стиля или формата, но не может добавить новые знания после обучения.
Как выбрать между различными архитектурами агентов?
Используйте ReAct для интерактивного многошагового рассуждения с использованием инструментов. Используйте вызов функций для структурированных API-интеграций. Используйте Plan-and-Execute для сложных задач, требующих предварительного планирования. Используйте мультиагентные системы, когда нужна специализированная экспертиза для разных подзадач.
Какую векторную базу данных использовать для продакшена?
Для управляемого сервиса с высоким масштабом используйте Pinecone. Для self-hosted с GraphQL используйте Weaviate. Для существующей инфраструктуры PostgreSQL используйте pgvector. Для прототипирования используйте ChromaDB для простоты.
Как снизить затраты на LLM API?
Реализуйте семантическое кэширование для похожих запросов, используйте меньшие модели для простых задач, оптимизируйте длину промта, устанавливайте соответствующую температуру (0 для кэшируемых ответов) и используйте резервные модели, когда основной ограничен по частоте запросов.
Какие метрики отслеживать для LLM-приложений?
Отслеживайте метрики производительности (задержка, токенов в секунду), метрики качества (удовлетворённость пользователей,完成率 задач), метрики стоимости (стоимость за запрос, процент попаданий кэша) и метрики надёжности (частота ошибок, частота таймаутов).
Как обрабатывать галлюцинации в RAG-системах?
Инструктируйте модель говорить 'я не знаю', когда контекста недостаточно, используйте оценку обоснованности в оценке, реализуйте проверки качества извлечения и рассмотрите добавление шага верификации, где модель цитирует источники для утверждений.

开发者详情

文件结构

📄 SKILL.md