Навыки ai-image-generation
🎨

ai-image-generation

Низкий риск ⚙️ Внешние команды🌐 Доступ к сети

Генерация изображений с помощью 50+ AI-моделей

Также доступно от: halt-catch-fire,inference-sh,inference-shell,inference-sh-skills,inferen-sh,infsh-skills,runcomfy-com,inference-sh-9,inference-sh-8,inference-skills,skills-shell,agentspace-so,skillssh,toolshell,tool-belt,tul-sh

Создание изображений с помощью разных AI-моделей обычно требует переключения между множеством инструментов и API. Этот навык даёт Claude единый CLI-процесс для генерации, редактирования и масштабирования изображений с использованием более 50 моделей, включая FLUX, GPT-Image-2 и Gemini.

Поддерживает: Claude Codex Code(CC)
📊 71 Адекватно
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «ai-image-generation». Пользователь просит: Сгенерируй киберпанк-город ночью с неоновыми огнями

Ожидаемый результат:

  • Claude вызывает belt CLI с моделью Grok Imagine
  • Промпт 'cyberpunk city at night' отправляется с соотношением сторон 16:9
  • Возвращается URL сгенерированного изображения и отображается пользователю

Использование «ai-image-generation». Пользователь просит: Отредактируй это изображение продукта, чтобы был белый фон

Ожидаемый результат:

  • Claude использует режим редактирования GPT-Image-2
  • URL исходного изображения и промпт для редактирования передаются как входные данные
  • Отредактированное изображение с белым фоном возвращается для скачивания пользователем

Аудит безопасности

Низкий риск
v1 • 6/7/2026

The skill is a documentation-only file that instructs users how to invoke the belt CLI from inference.sh. All 55 static findings are false positives: the flagged backtick patterns are inline code examples in markdown, not actual shell execution; the hardcoded URLs point to the platform's own documentation, CDN, and GitHub; and the alleged weak-cryptography match is a false positive on the YAML description field. The allowed-tools scope is correctly restricted to Bash(belt *), following least-privilege practice.

1
Просканировано файлов
172
Проанализировано строк
4
находки
1
Всего аудитов
Проблемы низкого риска (2)
Inline CLI examples in documentation
The skill contains 44 inline code blocks showing belt CLI invocations. These are markdown documentation, not executed code. The allowed-tools scope is restricted to Bash(belt *), so no arbitrary shell execution is possible.
Hardcoded documentation URLs
URLs point to inference.sh platform, its CDN, and GitHub documentation. No external exfiltration endpoints detected. All are legitimate references to the skill's own service.
Проверено: claude

Оценка качества

38
Архитектура
100
Сопровождаемость
87
Контент
50
Сообщество
86
Безопасность
91
Соответствие спецификации

Что вы можете построить

Маркетинговые команды создают визуалы для социальных сетей

Создание мокапов продуктов, баннеров и рекламных визуалов в разных стилях моделей в рамках единого рабочего процесса.

Дизайнеры создают прототипы концепт-артов

Быстрое изучение визуальных идей с использованием разных моделей (FLUX, Seedream, Grok) для сравнения эстетики перед выбором направления.

Разработчики создают приложения на базе AI

Интеграция генерации и редактирования изображений в приложения с использованием belt CLI для пакетной обработки и автоматизации.

Попробуйте эти промпты

Базовая генерация изображения по тексту
Generate an image of a sunset over mountains using the FLUX Klein model for fast results.
Предметная фотосъёмка с контролем стиля
Create a professional product photo of sneakers with studio lighting using GPT-Image-2 in high quality mode.
Редактирование изображения с референсным изображением
Take the image at https://example.com/photo.jpg and change the background to a beach at sunset using GPT-Image-2 editing.
Пакетное масштабирование до печатного разрешения
Upscale all product images in the ./photos/ directory to 4K resolution using the Topaz upscaler model.

Лучшие практики

  • Всегда сначала выполняйте 'belt login', чтобы убедиться в активной аутентификации перед вызовом любых команд генерации изображений
  • Выбирайте модель в зависимости от задачи: используйте FLUX Klein для быстрых черновиков, GPT-Image-2 для высокого качества, а Seedream 4.5 для кинематографичного вывода в 4K
  • Предоставляйте детальные, конкретные промпты, описывающие освещение, композицию и стиль, для получения лучших результатов во всех моделях

Избегать

  • Не используйте расплывчатые однословные промпты вроде 'cat' или 'landscape' — всегда добавляйте детали стиля, освещения и композиции
  • Не используйте редактирование GPT-Image-2 без указания валидного URL изображения — команда редактирования требует входное изображение
  • Не объединяйте несколько вызовов моделей в одном промпте, если задачу может выполнить одна модель — это тратит кредиты и время

Часто задаваемые вопросы

Что такое belt CLI?
Belt — это интерфейс командной строки для inference.sh, платформы, предоставляющей доступ к более чем 250 AI-приложениям, включая модели для генерации изображений, видео и аудио. Установка выполняется командой 'npx skills add belt-sh/cli'.
Нужен ли мне аккаунт inference.sh?
Да. Необходимо выполнить 'belt login' для аутентификации с вашим аккаунтом inference.sh. Генерация изображений тарифицируется по кредитам вашего аккаунта в зависимости от используемой модели и разрешения.
Какую модель использовать для рендеринга текста на изображениях?
Reve и Seedream 3.0 специально разработаны для точного рендеринга текста на изображениях. Используйте Reve для редактирования текста на естественном языке или Seedream 3.0 для постеров и графики с читаемым текстом.
Могу ли я использовать этот навык для редактирования существующих изображений?
Да. Такие модели, как GPT-Image-2 и Reve, поддерживают редактирование изображений. Передайте URL исходного изображения и описание желаемого изменения в качестве входных данных для belt CLI.
Какая самая дешёвая модель для генерации в больших объёмах?
FLUX Klein 4B стоит приблизительно $0,0001 за изображение, что делает его самым экономичным вариантом для массовой генерации, когда не требуется сверхвысокая точность.
Требуются ли Claude Code или Codex для использования этого навыка?
Этот навык работает с Claude, Claude Code и Codex. Любой AI-ассистент, способный выполнять bash-команды, может использовать belt CLI для генерации изображений после загрузки навыка.

Сведения для разработчиков

Автор

qu-skills

Лицензия

MIT

Ссылка

main

Структура файлов

📄 SKILL.md