Навыки ai-image-generation

🎨

ai-image-generation

Name: ai-image-generation
Author: qu-skills

Низкий риск ⚙️ Внешние команды🌐 Доступ к сети

Генерация изображений с помощью 50+ AI-моделей

Также доступно от: halt-catch-fire,inference-sh,inference-shell,inference-sh-skills,inferen-sh,infsh-skills,runcomfy-com,inference-sh-9,inference-sh-8,inference-skills,skills-shell,agentspace-so,skillssh,toolshell,tool-belt,tul-sh

Создание изображений с помощью разных AI-моделей обычно требует переключения между множеством инструментов и API. Этот навык даёт Claude единый CLI-процесс для генерации, редактирования и масштабирования изображений с использованием более 50 моделей, включая FLUX, GPT-Image-2 и Gemini.

Поддерживает: Claude Codex Code(CC)

📊 71 Адекватно

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «ai-image-generation». Пользователь просит: Сгенерируй киберпанк-город ночью с неоновыми огнями

Ожидаемый результат:

Claude вызывает belt CLI с моделью Grok Imagine
Промпт 'cyberpunk city at night' отправляется с соотношением сторон 16:9
Возвращается URL сгенерированного изображения и отображается пользователю

Использование «ai-image-generation». Пользователь просит: Отредактируй это изображение продукта, чтобы был белый фон

Ожидаемый результат:

Claude использует режим редактирования GPT-Image-2
URL исходного изображения и промпт для редактирования передаются как входные данные
Отредактированное изображение с белым фоном возвращается для скачивания пользователем

Аудит безопасности

Низкий риск

v1 • 6/7/2026

The skill is a documentation-only file that instructs users how to invoke the belt CLI from inference.sh. All 55 static findings are false positives: the flagged backtick patterns are inline code examples in markdown, not actual shell execution; the hardcoded URLs point to the platform's own documentation, CDN, and GitHub; and the alleged weak-cryptography match is a false positive on the YAML description field. The allowed-tools scope is correctly restricted to Bash(belt *), following least-privilege practice.

Просканировано файлов

172

Проанализировано строк

находки

Всего аудитов

Проблемы низкого риска (2)

SKILL.md:19-162

Inline CLI examples in documentation

The skill contains 44 inline code blocks showing belt CLI invocations. These are markdown documentation, not executed code. The allowed-tools scope is restricted to Bash(belt *), so no arbitrary shell execution is possible.

SKILL.md:11-170

Hardcoded documentation URLs

URLs point to inference.sh platform, its CDN, and GitHub documentation. No external exfiltration endpoints detected. All are legitimate references to the skill's own service.

Факторы риска

⚙️ Внешние команды (13)

SKILL.md:19-24 SKILL.md:50-52 SKILL.md:58-63 SKILL.md:67-72 SKILL.md:76-80 SKILL.md:84-86 SKILL.md:90-94 SKILL.md:98-103 SKILL.md:107-111 SKILL.md:115-119 SKILL.md:123-125 SKILL.md:129-134 SKILL.md:138-162

🌐 Доступ к сети (9)

SKILL.md:11 SKILL.md:13 SKILL.md:17 SKILL.md:70 SKILL.md:124 SKILL.md:131 SKILL.md:168 SKILL.md:169 SKILL.md:170

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

Безопасность

Соответствие спецификации

Что вы можете построить

Маркетинговые команды создают визуалы для социальных сетей

Создание мокапов продуктов, баннеров и рекламных визуалов в разных стилях моделей в рамках единого рабочего процесса.

Дизайнеры создают прототипы концепт-артов

Быстрое изучение визуальных идей с использованием разных моделей (FLUX, Seedream, Grok) для сравнения эстетики перед выбором направления.

Разработчики создают приложения на базе AI

Интеграция генерации и редактирования изображений в приложения с использованием belt CLI для пакетной обработки и автоматизации.

Попробуйте эти промпты

Базовая генерация изображения по тексту

Generate an image of a sunset over mountains using the FLUX Klein model for fast results.

Предметная фотосъёмка с контролем стиля

Create a professional product photo of sneakers with studio lighting using GPT-Image-2 in high quality mode.

Редактирование изображения с референсным изображением

Take the image at https://example.com/photo.jpg and change the background to a beach at sunset using GPT-Image-2 editing.

Пакетное масштабирование до печатного разрешения

Upscale all product images in the ./photos/ directory to 4K resolution using the Topaz upscaler model.

Лучшие практики

Всегда сначала выполняйте 'belt login', чтобы убедиться в активной аутентификации перед вызовом любых команд генерации изображений
Выбирайте модель в зависимости от задачи: используйте FLUX Klein для быстрых черновиков, GPT-Image-2 для высокого качества, а Seedream 4.5 для кинематографичного вывода в 4K
Предоставляйте детальные, конкретные промпты, описывающие освещение, композицию и стиль, для получения лучших результатов во всех моделях

Избегать

Не используйте расплывчатые однословные промпты вроде 'cat' или 'landscape' — всегда добавляйте детали стиля, освещения и композиции
Не используйте редактирование GPT-Image-2 без указания валидного URL изображения — команда редактирования требует входное изображение
Не объединяйте несколько вызовов моделей в одном промпте, если задачу может выполнить одна модель — это тратит кредиты и время

Часто задаваемые вопросы

Что такое belt CLI?

Belt — это интерфейс командной строки для inference.sh, платформы, предоставляющей доступ к более чем 250 AI-приложениям, включая модели для генерации изображений, видео и аудио. Установка выполняется командой 'npx skills add belt-sh/cli'.

Нужен ли мне аккаунт inference.sh?

Да. Необходимо выполнить 'belt login' для аутентификации с вашим аккаунтом inference.sh. Генерация изображений тарифицируется по кредитам вашего аккаунта в зависимости от используемой модели и разрешения.

Какую модель использовать для рендеринга текста на изображениях?

Reve и Seedream 3.0 специально разработаны для точного рендеринга текста на изображениях. Используйте Reve для редактирования текста на естественном языке или Seedream 3.0 для постеров и графики с читаемым текстом.

Могу ли я использовать этот навык для редактирования существующих изображений?

Да. Такие модели, как GPT-Image-2 и Reve, поддерживают редактирование изображений. Передайте URL исходного изображения и описание желаемого изменения в качестве входных данных для belt CLI.

Какая самая дешёвая модель для генерации в больших объёмах?

FLUX Klein 4B стоит приблизительно $0,0001 за изображение, что делает его самым экономичным вариантом для массовой генерации, когда не требуется сверхвысокая точность.

Требуются ли Claude Code или Codex для использования этого навыка?

Этот навык работает с Claude, Claude Code и Codex. Любой AI-ассистент, способный выполнять bash-команды, может использовать belt CLI для генерации изображений после загрузки навыка.

Сведения для разработчиков

Автор

qu-skills

Лицензия

MIT

Репозиторий

https://github.com/qu-skills/skills/tree/main/tools/image/ai-image-generation/

Ссылка

main

Структура файлов

📄 SKILL.md