技能 baoyu-image-gen
🎨

baoyu-image-gen

低风险 ⚡ 包含脚本🌐 网络访问📁 文件系统访问🔑 环境变量

Создание изображений ИИ с помощью OpenAI и Google

Создавайте высококачественные изображения, сгенерированные ИИ, не выходя из среды разработки. Поддерживает несколько провайдеров, соотношения сторон и референсные изображения для точного визуального контроля.

支持: Claude Codex Code(CC)
⚠️ 68
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“baoyu-image-gen”。 npx -y bun scripts/main.ts --prompt 'A cat sitting on a windowsill' --image cat.png

预期结果:

/path/to/cat.png

正在使用“baoyu-image-gen”。 npx -y bun scripts/main.ts --prompt 'A futuristic city' --image city.png --ar 16:9 --json

预期结果:

/path/to/city.json

安全审计

低风险
v1 • 1/28/2026

Static analysis detected 183 pattern matches, but all evaluated as false positives for this legitimate image generation skill. Dynamic imports load internal provider modules (google.ts, openai.ts). Environment access reads standard API keys (OPENAI_API_KEY, GOOGLE_API_KEY). Network calls are to legitimate AI endpoints (api.openai.com, generativelanguage.googleapis.com). Filesystem operations handle prompt files and save generated images. No malicious intent detected.

5
已扫描文件
860
分析行数
7
发现项
1
审计总数
低风险问题 (3)
Dynamic Module Imports
Uses dynamic import() to load provider modules at runtime. This is a legitimate pattern for loading either ./providers/google or ./providers/openai based on user configuration. Paths are hardcoded and not user-controlled.
Environment Variable Access for API Keys
Reads API keys from environment variables (OPENAI_API_KEY, GOOGLE_API_KEY, GEMINI_API_KEY). This is the standard and recommended pattern for CLI tools that interact with external APIs.
Network Requests to External APIs
Makes fetch requests to OpenAI and Google AI APIs for image generation. These are legitimate calls to documented endpoints (api.openai.com, generativelanguage.googleapis.com).
审计者: claude

质量评分

45
架构
100
可维护性
87
内容
22
社区
84
安全
83
规范符合性

你能构建什么

Создание контента

Генерируйте главные изображения для блогов, графику для социальных сетей и маркетинговые визуальные материалы с согласованными соотношениями сторон и настройками качества.

UI/UX Дизайн

Создавайте изображения для макетов, иллюстрационные ассеты и концепции дизайна для веб- и мобильных приложений.

Пакетная генерация ассетов

Генерируйте несколько изображений параллельно для презентаций, комиксов или серий инфографики с использованием параллельных сабагентов.

试试这些提示

Базовая генерация изображений
Generate an image of a serene mountain landscape at sunset with snow-capped peaks reflected in a calm lake
Графика для социальных сетей
Create a 16:9 banner image for a tech conference with abstract geometric shapes in blue and purple gradients, including space for text overlay
Набор иллюстраций в пакетном режиме
Generate 4 images in parallel for a children's book: 1) a friendly robot, 2) a magical forest, 3) a flying car, 4) an underwater city. Use consistent art style across all images.
Генерация с референсом стиля
Generate an image of a futuristic cityscape using reference.png as the style guide. Match the color palette and artistic style of the reference.

最佳实践

  • Используйте --quality 2k для финальных ассетов и --quality normal для быстрых превью для управления затратами
  • Используйте параллельную генерацию с 4 параллельными сабагентами при создании нескольких изображений
  • Храните API-ключи в ~/.baoyu-skills/.env для безопасной и постоянной конфигурации

避免

  • Не коммитьте API-ключи в систему контроля версий — используйте файлы окружения
  • Избегайте последовательной генерации изображений при пакетной обработке — используйте параллельные сабагенты
  • Не используйте референсные изображения с провайдером OpenAI — они поддерживаются только с мультимодальными моделями Google

常见问题

Какой API-провайдер мне следует использовать?
Google (Gemini/Imagen) — провайдер по умолчанию и поддерживает референсные изображения и вывод в 4K. Используйте OpenAI, если предпочитаете DALL-E 3 или у вас уже есть кредиты OpenAI.
Как настроить мои API-ключи?
Создайте файл в ~/.baoyu-skills/.env с вашими ключами: OPENAI_API_KEY=sk-... или GOOGLE_API_KEY=... Навык автоматически загрузит их при каждом запуске.
Могу ли я использовать референсные изображения для контроля стиля?
Да, но только с мультимодальными моделями Google (gemini-3-pro-image-preview или gemini-3-flash-preview). Используйте флаг --ref с путями к файлам изображений.
Какой рекомендуемый способ генерации нескольких изображений?
Используйте фоновые сабагенты с run_in_background=true для параллельной генерации. Рекомендуемая параллельность — 4 сабагента, максимум — 8.
Как указать собственные размеры изображения?
Используйте --ar для соотношений сторон (16:9, 1:1, 4:3 и т.д.) или --size для точных размеров (1024x1024). Соотношение сторон рекомендуется для большинства случаев использования.
Что произойдёт, если генерация изображения не удастся?
Навык автоматически повторяет неудавшиеся генерации один раз перед сообщением об ошибке. Проверьте ваш API-ключ и сетевое подключение, если проблемы продолжаются.

开发者详情

文件结构

📁 scripts/

📁 providers/

📄 google.ts

📄 openai.ts

📄 main.ts

📄 types.ts

📄 SKILL.md