Fähigkeiten embedding-strategies

📦

embedding-strategies

Name: embedding-strategies
Author: sickn33

Sicher

Оптимизация векторных представлений для семантического поиска

Auch verfügbar von: wshobson

Этот навык помогает разработчикам выбирать и внедрять подходящие модели векторных представлений для векторного поиска, предоставляя шаблоны кода для OpenAI, Sentence Transformers и предметно-ориентированных конвейеров.

Unterstützt: Claude Codex Code(CC)

📊 71 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "embedding-strategies". Как выбрать между text-embedding-3-large и text-embedding-3-small?

Erwartetes Ergebnis:

text-embedding-3-large: 3072 измерения, 8191 токен — лучше всего подходит для задач с высокими требованиями к точности
text-embedding-3-small: 1536 измерений, 8191 токен — экономичный вариант
Выбирайте large для сложных семантических задач, small для приложений с большим объемом

Verwendung von "embedding-strategies". Какая стратегия разбивки на части лучше всего подходит для кода?

Erwartetes Ergebnis:

Используйте tree-sitter для анализа структуры кода
Разбивайте на части по функциям, классам и методам
Включайте окружающий контекст для лучшего извлечения
Учитывайте специфичные для языка разделители

Sicherheitsaudit

Sicher

v1 • 2/24/2026

This skill provides educational content about embedding strategies for RAG applications. All static findings are false positives: code blocks are markdown documentation examples, URLs are legitimate documentation links, and no cryptographic algorithms or system reconnaissance behavior is present. Safe for publication.

Gescannte Dateien

494

Analysierte Zeilen

befunde

Gesamtzahl Audits

Keine Sicherheitsprobleme gefunden

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

100

Spezifikationskonformität

Was du bauen kannst

Создание RAG-приложений

Настройка конвейеров векторных представлений для генерации с дополненным извлечением с оптимальной разбивкой на части и выбором модели

Сравнение моделей векторных представлений

Оценка различных моделей векторных представлений на основе размерности, стоимости и производительности для конкретных доменов

Оптимизация векторного поиска

Улучшение качества семантического поиска с помощью правильной предварительной обработки, разбивки на части и конфигурации векторных представлений

Probiere diese Prompts

Базовая настройка векторных представлений

Покажите, как начать работу с векторными представлениями OpenAI для RAG-приложения. Включите пакетную обработку и сокращение размерности.

Локальные модели векторных представлений

Как настроить локальные модели векторных представлений с помощью sentence-transformers? Включите модели BGE и E5 с правильной предварительной обработкой.

Стратегия разбивки на части

Какую стратегию разбивки на части следует использовать для технической документации? Включите подходы на основе токенов, предложений и семантический подход.

Оценка качества

Как оценить качество векторных представлений для извлечения? Покажите метрики precision, recall, MRR и NDCG.

Bewährte Verfahren

Подбирайте модель векторных представлений под конкретный вариант использования (код, текст, многоязычность)
Нормализуйте векторные представления при использовании косинусного сходства для извлечения
Кэшируйте векторные представления, чтобы избежать повторных вычислений для повторяющихся запросов

Vermeiden

Использование неправильной модели для вашего домена (например, общих векторных представлений для кода)
Игнорирование лимитов токенов, что приводит к усечению и потере информации
Смешивание моделей векторных представлений в продакшене, что создает несовместимые векторные пространства

Häufig gestellte Fragen

Какая модель векторных представлений лучше всего подходит для RAG?

text-embedding-3-small обеспечивает лучший баланс стоимости и качества для большинства RAG-приложений. Используйте text-embedding-3-large, когда требуется максимальная точность.

Как работать с длинными документами?

Разбивайте документы на части с помощью разбивки на основе токенов или семантической разбивки. Стремитесь к 256-512 токенам на часть с перекрытием для сохранения контекста.

Можно ли использовать векторные представления в автономном режиме?

Да, используйте модели sentence-transformers, такие как BGE или E5. Они работают локально, но требуют больше настроек и вычислительных ресурсов.

Как сократить размерность векторных представлений?

Модели векторных представлений text-embedding-3 от OpenAI поддерживают нативное сокращение размерности. Для других моделей используйте PCA или Matryoshka Representation Learning.

Какие метрики следует отслеживать?

Отслеживайте precision@k, recall@k, MRR и NDCG для качества извлечения. Также отслеживайте задержку и стоимость на векторное представление.

Как обрабатывать многоязычный контент?

Используйте многоязычные модели, такие как multilingual-e5-large или новые модели OpenAI, которые поддерживают более 100 языков нативно.

Entwicklerdetails

Autor

sickn33

Lizenz

MIT

Repository

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/embedding-strategies

Ref

main

Dateistruktur

📄 SKILL.md