通过 inference.sh CLI 使用 Google Gemini 3 Pro 和 Gemini 2.5 Flash 模型生成高质量图像。支持文字生成图像、多输入图像编辑、自定义宽高比以及最高 4K 分辨率输出。
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“nano-banana”。 Generate an image of a banana floating in space, photorealistic style
预期结果:
图像生成命令执行并返回生成的图像文件 URL,展示一个逼真的香蕉漂浮在星空背景上的画面,具有 proper lighting and shadows。
正在使用“nano-banana”。 Create 4 minimalist logo designs for a coffee shop
预期结果:
命令生成 4 个不同的图像 URL,每个都包含不同的极简主义标志设计,融合咖啡主题元素,如杯子、豆子或蒸汽,采用简洁的几何风格。
安全审计
安全All 40 static findings are false positives. The detected patterns are documentation examples in markdown format, not executable code. Bash commands in code examples demonstrate legitimate CLI usage for the inference.sh tool. URLs are reference documentation links. No prompt injection attempts or security risks detected.
风险因素
⚙️ 外部命令 (3)
🌐 网络访问 (2)
质量评分
你能构建什么
营销视觉创作
使用详细的文字提示为营销活动、社交媒体帖子和促销材料生成定制视觉内容。
概念艺术和分镜设计
快速为创意项目和预可视化创建概念艺术、角色设计和分镜画面。
图像修改工作流
通过添加元素、改变风格或增强内容来编辑现有图像,同时保持原始构图。
试试这些提示
Generate an image of a [subject] in [style] style, with [lighting] lighting
Create 4 variations of a [subject] with different [artistic style] interpretations
Edit this image: [image URL]. Change [specific element] to [new element], keep the rest of the image unchanged
Generate a 16:9 aspect ratio image of [scene description] at 4K resolution with photorealistic quality
最佳实践
- 在提示中具体详细,以获得更好的结果 - 包括风格、构图、光线和氛围描述
- 为您的预期用途选择合适的宽高比 - 16:9 适合风景,1:1 适合社交媒体,9:16 适合移动端
- 先使用 Gemini 2.5 Flash 进行更快的迭代,然后使用 Gemini 3 Pro 进行最终高分辨率输出
避免
- 不要使用模糊的提示,如「一张漂亮的图片」,而不指定风格、主题或构图细节
- 避免请求超出需要的图像数量 - 先从 1-2 张图像开始测试提示,然后再生成更多
- 不要忘记在尝试任何图像生成命令之前先运行 infsh login
常见问题
Gemini 3 Pro 和 Gemini 2.5 Flash 之间有什么区别?
使用此技能之前需要安装什么吗?
我可以使用此技能编辑现有图像吗?
支持哪些图像格式和分辨率?
我可以一次生成多少张图像?
什么是 Google Search grounding?
开发者详情
文件结构
📄 SKILL.md