技能 nano-banana
🎨

nano-banana

低风险 ⚙️ 外部命令🌐 网络访问

使用 Google Gemini 模型生成图像

使用 Google Gemini 原生图像模型从文本描述创建专业图像。通过简单的 CLI 界面访问高质量图像生成,支持编辑和自定义。

支持: Claude Codex Code(CC)
📊 71 充足
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“nano-banana”。 A futuristic cityscape at sunset with flying cars

预期结果:

高分辨率图像展示了一个拥有高楼建筑的广阔城市,天空中呈现温暖的日落色彩,车辆在建筑物之间飞行

正在使用“nano-banana”。 Minimalist logo design for a coffee shop (4 variations)

预期结果:

四个独特的徽标设计,以简洁的极简风格呈现咖啡相关图像,并保持一致的品牌元素

正在使用“nano-banana”。 Edit this landscape photo: add a rainbow in the sky

预期结果:

原始景观图像,天空中有一条自然放置的彩虹弧线,与光照条件相匹配

安全审计

低风险
v1 • 2/26/2026

This skill is documentation (SKILL.md) for using the inference.sh CLI to generate images with Google Gemini models. Static analysis detected 30 external command patterns and 9 URLs, but these are all Markdown documentation examples, not executable code. The skill uses allowed-tools restriction to only execute infsh commands. External API calls to inference.sh are required for core functionality. Low risk due to external command execution and network access, but patterns are legitimate and restricted.

1
已扫描文件
144
分析行数
3
发现项
1
审计总数
低风险问题 (1)
Pipe to shell installation pattern
Installation command uses curl piped to shell (curl | sh) which downloads and executes a script from the network. This is a standard pattern but requires trust in the source domain.

风险因素

⚙️ 外部命令 (1)
🌐 网络访问 (1)
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
88
安全
83
规范符合性

你能构建什么

营销内容创作

为社交媒体帖子、博客标题和广告生成自定义视觉内容,无需依赖库存照片。

设计原型制作

在构思阶段快速可视化设计概念、徽标和插图,然后再投入详细工作。

创意探索

为个人或专业项目尝试不同的艺术风格、构图和视觉概念。

试试这些提示

基本文本到图像
Generate an image of a tropical beach at sunset with palm trees and calm ocean waves, photorealistic style
多个变体
Create 4 different logo concepts for a tech startup named 'Nova' - minimalist style, blue and white color scheme
图像编辑
Add a golden retriever puppy sitting on the grass in the foreground of this image, maintain the same lighting and style
高级自定义
Generate a cyberpunk cityscape at night in 16:9 aspect ratio, 4K resolution, with neon signs, flying vehicles, and dramatic atmospheric lighting, digital art style

最佳实践

  • 使用具体、描述性的提示,包括风格、光照、构图和关键细节,以获得更好的结果
  • 首先使用 Gemini 2.5 Flash Image 进行快速迭代,然后使用 Gemini 3 Pro Image 生成最终的高质量输出
  • 编辑图像时,清楚地描述要更改的内容,同时指定要从原始图像中保留的元素

避免

  • 避免使用过于复杂的提示,其中包含太多冲突的元素 - 专注于一个清晰的主题和风格
  • 不要期望在生成的图像中呈现精确的文本 - AI 图像模型在精确排版方面存在困难
  • 在商业项目的提示中避免使用版权角色名称或商标元素

常见问题

Gemini 3 Pro Image 和 Gemini 2.5 Flash Image 之间有什么区别?
Gemini 3 Pro Image 产生更高质量的结果,细节更好,但生成时间更长。Gemini 2.5 Flash Image 速度更快,仍然能产生优秀的结果,非常适合迭代和快速原型制作。
使用此技能是否需要安装任何软件?
是的���您需要安装 inference.sh CLI 工具并使用您的账户进行身份验证。从快速入门部分运行安装命令以开始使用。
我可以使用此技能编辑自己的图像吗?
是的,您可以在 images 参数中提供图像 URL 以及描述您想要进行的更改的提示。您最多可以包含 14 个输入图像。
输出支持哪些图像格式?
该技能支持常见的输出格式。使用 output_format 参数指定您首选的格式。有关可用的格式选项,请参阅 inference.sh 文档。
如何启用 Google Search 搜索?
在您的请求中将 enable_google_search 设置为 true。这允许模型在生成图像时从 Google Search 访问实时信息,对于当前事件或事实准确性很有用。
使用此技能有哪些相关成本?
图像生成通过 inference.sh 平台使用 Google Gemini 模型。定价取决于使用的模型和图像分辨率。查看 inference.sh 定价页面了解当前费率和您的账户限制。

开发者详情

文件结构

📄 SKILL.md