🎨

baoyu-image-gen

Name: baoyu-image-gen
Author: jimliu

Низкий риск ⚡ Содержит скрипты🌐 Доступ к сети📁 Доступ к файловой системе🔑 Переменные окружения

Создание изображений ИИ с помощью OpenAI и Google

Создавайте высококачественные изображения, сгенерированные ИИ, не выходя из среды разработки. Поддерживает несколько провайдеров, соотношения сторон и референсные изображения для точного визуального контроля.

Поддерживает: Claude Codex Code(CC)

⚠️ 68 Плохо

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «baoyu-image-gen». npx -y bun scripts/main.ts --prompt 'A cat sitting on a windowsill' --image cat.png

Ожидаемый результат:

/path/to/cat.png

Использование «baoyu-image-gen». npx -y bun scripts/main.ts --prompt 'A futuristic city' --image city.png --ar 16:9 --json

Ожидаемый результат:

/path/to/city.json

Аудит безопасности

Низкий риск

v1 • 1/28/2026

Static analysis detected 183 pattern matches, but all evaluated as false positives for this legitimate image generation skill. Dynamic imports load internal provider modules (google.ts, openai.ts). Environment access reads standard API keys (OPENAI_API_KEY, GOOGLE_API_KEY). Network calls are to legitimate AI endpoints (api.openai.com, generativelanguage.googleapis.com). Filesystem operations handle prompt files and save generated images. No malicious intent detected.

Просканировано файлов

860

Проанализировано строк

находки

Всего аудитов

Проблемы низкого риска (3)

scripts/main.ts:264-266

Dynamic Module Imports

Uses dynamic import() to load provider modules at runtime. This is a legitimate pattern for loading either ./providers/google or ./providers/openai based on user configuration. Paths are hardcoded and not user-controlled.

scripts/main.ts:244-245 scripts/providers/google.ts:27 scripts/providers/openai.ts:65

Environment Variable Access for API Keys

Reads API keys from environment variables (OPENAI_API_KEY, GOOGLE_API_KEY, GEMINI_API_KEY). This is the standard and recommended pattern for CLI tools that interact with external APIs.

scripts/providers/google.ts:56 scripts/providers/openai.ts:85

Network Requests to External APIs

Makes fetch requests to OpenAI and Google AI APIs for image generation. These are legitimate calls to documented endpoints (api.openai.com, generativelanguage.googleapis.com).

Факторы риска

⚡ Содержит скрипты (2)

scripts/main.ts:264 scripts/main.ts:266

🌐 Доступ к сети (3)

scripts/providers/google.ts:56 scripts/providers/openai.ts:85 scripts/providers/openai.ts:107

📁 Доступ к файловой системе (4)

scripts/main.ts:37 scripts/main.ts:253 scripts/providers/google.ts:3 scripts/providers/openai.ts:1

🔑 Переменные окружения (3)

scripts/main.ts:244-245 scripts/providers/google.ts:27 scripts/providers/openai.ts:65

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

Безопасность

Соответствие спецификации

Что вы можете построить

Создание контента

Генерируйте главные изображения для блогов, графику для социальных сетей и маркетинговые визуальные материалы с согласованными соотношениями сторон и настройками качества.

UI/UX Дизайн

Создавайте изображения для макетов, иллюстрационные ассеты и концепции дизайна для веб- и мобильных приложений.

Пакетная генерация ассетов

Генерируйте несколько изображений параллельно для презентаций, комиксов или серий инфографики с использованием параллельных сабагентов.

Попробуйте эти промпты

Базовая генерация изображений

Generate an image of a serene mountain landscape at sunset with snow-capped peaks reflected in a calm lake

Графика для социальных сетей

Create a 16:9 banner image for a tech conference with abstract geometric shapes in blue and purple gradients, including space for text overlay

Набор иллюстраций в пакетном режиме

Generate 4 images in parallel for a children's book: 1) a friendly robot, 2) a magical forest, 3) a flying car, 4) an underwater city. Use consistent art style across all images.

Генерация с референсом стиля

Generate an image of a futuristic cityscape using reference.png as the style guide. Match the color palette and artistic style of the reference.

Лучшие практики

Используйте --quality 2k для финальных ассетов и --quality normal для быстрых превью для управления затратами
Используйте параллельную генерацию с 4 параллельными сабагентами при создании нескольких изображений
Храните API-ключи в ~/.baoyu-skills/.env для безопасной и постоянной конфигурации

Избегать

Не коммитьте API-ключи в систему контроля версий — используйте файлы окружения
Избегайте последовательной генерации изображений при пакетной обработке — используйте параллельные сабагенты
Не используйте референсные изображения с провайдером OpenAI — они поддерживаются только с мультимодальными моделями Google

Часто задаваемые вопросы

Какой API-провайдер мне следует использовать?

Google (Gemini/Imagen) — провайдер по умолчанию и поддерживает референсные изображения и вывод в 4K. Используйте OpenAI, если предпочитаете DALL-E 3 или у вас уже есть кредиты OpenAI.

Как настроить мои API-ключи?

Создайте файл в ~/.baoyu-skills/.env с вашими ключами: OPENAI_API_KEY=sk-... или GOOGLE_API_KEY=... Навык автоматически загрузит их при каждом запуске.

Могу ли я использовать референсные изображения для контроля стиля?

Да, но только с мультимодальными моделями Google (gemini-3-pro-image-preview или gemini-3-flash-preview). Используйте флаг --ref с путями к файлам изображений.

Какой рекомендуемый способ генерации нескольких изображений?

Используйте фоновые сабагенты с run_in_background=true для параллельной генерации. Рекомендуемая параллельность — 4 сабагента, максимум — 8.

Как указать собственные размеры изображения?

Используйте --ar для соотношений сторон (16:9, 1:1, 4:3 и т.д.) или --size для точных размеров (1024x1024). Соотношение сторон рекомендуется для большинства случаев использования.

Что произойдёт, если генерация изображения не удастся?

Навык автоматически повторяет неудавшиеся генерации один раз перед сообщением об ошибке. Проверьте ваш API-ключ и сетевое подключение, если проблемы продолжаются.

Сведения для разработчиков

Автор

jimliu

Лицензия

MIT

Репозиторий

https://github.com/jimliu/baoyu-skills/tree/main/skills/baoyu-image-gen/

Ссылка

main

Структура файлов

📁 scripts/

📁 providers/

📄 google.ts

📄 openai.ts

📄 main.ts

📄 types.ts

📄 SKILL.md