技能 nano-banana

🍌

nano-banana

Name: nano-banana
Author: tul-sh

安全 ⚙️ 外部命令🌐 网络访问

使用 Google Gemini 模型生成 AI 图像

也可从以下获取: inference-sh-9,toolshell,inference-shell,inferen-sh

通过 inference.sh CLI 使用 Google Gemini 3 Pro 和 Gemini 2.5 Flash 模型生成高质量图像。支持文字生成图像、多输入图像编辑、自定义宽高比以及最高 4K 分辨率输出。

支持: Claude Codex Code(CC)

📊 69 充足

下载技能 ZIP

在 Claude 中上传

前往设置 → 功能 → 技能 → 上传技能

开启并开始使用

测试它

正在使用“nano-banana”。 Generate an image of a banana floating in space, photorealistic style

预期结果:

图像生成命令执行并返回生成的图像文件 URL，展示一个逼真的香蕉漂浮在星空背景上的画面，具有 proper lighting and shadows。

正在使用“nano-banana”。 Create 4 minimalist logo designs for a coffee shop

预期结果:

命令生成 4 个不同的图像 URL，每个都包含不同的极简主义标志设计，融合咖啡主题元素，如杯子、豆子或蒸汽，采用简洁的几何风格。

安全审计

安全

v1 • 3/5/2026

All 40 static findings are false positives. The detected patterns are documentation examples in markdown format, not executable code. Bash commands in code examples demonstrate legitimate CLI usage for the inference.sh tool. URLs are reference documentation links. No prompt injection attempts or security risks detected.

已扫描文件

145

分析行数

发现项

审计总数

风险因素

⚙️ 外部命令 (3)

SKILL.md:15-21 SKILL.md:33-63 SKILL.md:116-123

🌐 网络访问 (2)

SKILL.md:9-11 SKILL.md:142-144

审计者: claude

质量评分

架构

100

可维护性

内容

社区

100

安全

规范符合性

你能构建什么

营销视觉创作

使用详细的文字提示为营销活动、社交媒体帖子和促销材料生成定制视觉内容。

概念艺术和分镜设计

快速为创意项目和预可视化创建概念艺术、角色设计和分镜画面。

图像修改工作流

通过添加元素、改变风格或增强内容来编辑现有图像，同时保持原始构图。

试试这些提示

基础图像生成

Generate an image of a [subject] in [style] style, with [lighting] lighting

多图像生成

Create 4 variations of a [subject] with different [artistic style] interpretations

图像编辑

Edit this image: [image URL]. Change [specific element] to [new element], keep the rest of the image unchanged

高分辨率全景图

Generate a 16:9 aspect ratio image of [scene description] at 4K resolution with photorealistic quality

最佳实践

在提示中具体详细，以获得更好的结果 - 包括风格、构图、光线和氛围描述
为您的预期用途选择合适的宽高比 - 16:9 适合风景，1:1 适合社交媒体，9:16 适合移动端
先使用 Gemini 2.5 Flash 进行更快的迭代，然后使用 Gemini 3 Pro 进行最终高分辨率输出

避免

不要使用模糊的提示，如「一张漂亮的图片」，而不指定风格、主题或构图细节
避免请求超出需要的图像数量 - 先从 1-2 张图像开始测试提示，然后再生成更多
不要忘记在尝试任何图像生成命令之前先运行 infsh login

常见问题

Gemini 3 Pro 和 Gemini 2.5 Flash 之间有什么区别？

Gemini 3 Pro 能生成最高质量的图像，但运行速度较慢。Gemini 2.5 Flash 能快速生成出色质量的图像。在迭代时使用 Flash，在最终输出时使用 Pro。

使用此技能之前需要安装什么吗？

是的，您需要安装 inference.sh CLI。运行 npx skills add inference-sh/skills@agent-tools 获取安装说明，然后运行 infsh login 进行身份验证。

我可以使用此技能编辑现有图像吗？

是的，在 images 参数中提供图像 URL，并附上描述更改的提示。每次请求最多可包含 14 张输入图像。

支持哪些图像格式和分辨率？

Gemini 3 Pro 支持 1K、2K 和 4K 分辨率。两种模型都支持多种宽高比，包括 1:1、16:9、9:16、4:3、3:4 和 auto。

我可以一次生成多少张图像？

使用 num_images 参数在单次请求中生成多张图像。这对于创建同一提示的变体非常有用。

什么是 Google Search grounding？

启用 Google Search grounding（设置 enable_google_search: true）以让模型访问实时信息，从而获得更准确的当前事件或事实可视化。

开发者详情

作者

tul-sh

许可证

MIT

仓库

https://github.com/tul-sh/skills/tree/main/tools/image/nano-banana/

引用

main

文件结构

📄 SKILL.md