embedding-strategies
Оптимизация векторных представлений для семантического поиска
Auch verfügbar von: wshobson
Этот навык помогает разработчикам выбирать и внедрять подходящие модели векторных представлений для векторного поиска, предоставляя шаблоны кода для OpenAI, Sentence Transformers и предметно-ориентированных конвейеров.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "embedding-strategies". Как выбрать между text-embedding-3-large и text-embedding-3-small?
Erwartetes Ergebnis:
- text-embedding-3-large: 3072 измерения, 8191 токен — лучше всего подходит для задач с высокими требованиями к точности
- text-embedding-3-small: 1536 измерений, 8191 токен — экономичный вариант
- Выбирайте large для сложных семантических задач, small для приложений с большим объемом
Verwendung von "embedding-strategies". Какая стратегия разбивки на части лучше всего подходит для кода?
Erwartetes Ergebnis:
- Используйте tree-sitter для анализа структуры кода
- Разбивайте на части по функциям, классам и методам
- Включайте окружающий контекст для лучшего извлечения
- Учитывайте специфичные для языка разделители
Sicherheitsaudit
SicherThis skill provides educational content about embedding strategies for RAG applications. All static findings are false positives: code blocks are markdown documentation examples, URLs are legitimate documentation links, and no cryptographic algorithms or system reconnaissance behavior is present. Safe for publication.
Qualitätsbewertung
Was du bauen kannst
Создание RAG-приложений
Настройка конвейеров векторных представлений для генерации с дополненным извлечением с оптимальной разбивкой на части и выбором модели
Сравнение моделей векторных представлений
Оценка различных моделей векторных представлений на основе размерности, стоимости и производительности для конкретных доменов
Оптимизация векторного поиска
Улучшение качества семантического поиска с помощью правильной предварительной обработки, разбивки на части и конфигурации векторных представлений
Probiere diese Prompts
Покажите, как начать работу с векторными представлениями OpenAI для RAG-приложения. Включите пакетную обработку и сокращение размерности.
Как настроить локальные модели векторных представлений с помощью sentence-transformers? Включите модели BGE и E5 с правильной предварительной обработкой.
Какую стратегию разбивки на части следует использовать для технической документации? Включите подходы на основе токенов, предложений и семантический подход.
Как оценить качество векторных представлений для извлечения? Покажите метрики precision, recall, MRR и NDCG.
Bewährte Verfahren
- Подбирайте модель векторных представлений под конкретный вариант использования (код, текст, многоязычность)
- Нормализуйте векторные представления при использовании косинусного сходства для извлечения
- Кэшируйте векторные представления, чтобы избежать повторных вычислений для повторяющихся запросов
Vermeiden
- Использование неправильной модели для вашего домена (например, общих векторных представлений для кода)
- Игнорирование лимитов токенов, что приводит к усечению и потере информации
- Смешивание моделей векторных представлений в продакшене, что создает несовместимые векторные пространства
Häufig gestellte Fragen
Какая модель векторных представлений лучше всего подходит для RAG?
Как работать с длинными документами?
Можно ли использовать векторные представления в автономном режиме?
Как сократить размерность векторных представлений?
Какие метрики следует отслеживать?
Как обрабатывать многоязычный контент?
Entwicklerdetails
Autor
sickn33Lizenz
MIT
Repository
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/embedding-strategiesRef
main
Dateistruktur
📄 SKILL.md