透過 inference.sh CLI 使用 Google Gemini 3 Pro 和 Gemini 2.5 Flash 模型產生高品質圖片。支援文字生成圖片、多張圖片編輯、自訂長寬比以及最高 4K 解析度輸出。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「nano-banana」。 Generate an image of a banana floating in space, photorealistic style
預期結果:
圖片生成命令執行並返回一個指向產生圖片檔案的網址,顯示一張超寫實風格的香蕉漂浮在星空背景中的圖片,具有正確的光線和陰影。
正在使用「nano-banana」。 Create 4 minimalist logo designs for a coffee shop
預期結果:
命令產生 4 個不同的圖片網址,每個都包含不同的極簡主義標誌詮釋,融入咖啡相關元素如杯子、豆子或蒸汽,採用簡潔的幾何風格。
安全審計
安全All 40 static findings are false positives. The detected patterns are documentation examples in markdown format, not executable code. Bash commands in code examples demonstrate legitimate CLI usage for the inference.sh tool. URLs are reference documentation links. No prompt injection attempts or security risks detected.
風險因素
⚙️ 外部命令 (3)
🌐 網路存取 (2)
品質評分
你能建構什麼
行銷視覺創作
使用詳細的文字提示為行銷活動、社群媒體貼文和促銷素材產生自訂視覺效果。
概念藝術與分鏡
快速為創意專案和預視覺化建立概念藝術、角色設計和分鏡畫面。
圖片修改工作流程
透過新增元素、改變風格或強化內容來編輯現有圖片,同時保留原始構圖。
試試這些提示
Generate an image of a [subject] in [style] style, with [lighting] lighting
Create 4 variations of a [subject] with different [artistic style] interpretations
Edit this image: [image URL]. Change [specific element] to [new element], keep the rest of the image unchanged
Generate a 16:9 aspect ratio image of [scene description] at 4K resolution with photorealistic quality
最佳實務
- 在提示中保持具體和詳細以獲得更好的結果 - 包含風格、構圖、光線和情緒描述
- 為您的預期用途選擇適當的長寬比 - 16:9 適用於風景,1:1 適用於社群媒體,9:16 適用於行動裝置
- 先使用 Gemini 2.5 Flash 進行更快的迭代,然後使用 Gemini 3 Pro 產生最終的高解析度輸出
避免
- 不要使用模糊的提示如「一張漂亮的圖片」,而不指定風格、主體或構圖細節
- 避免請求超過需要的圖片數量 - 先從 1-2 張圖片測試提示,再產生更大的批次
- 不要忘記在嘗試任何圖片生成命令之前先執行 infsh login
常見問題
Gemini 3 Pro 和 Gemini 2.5 Flash 有什麼區別?
使用此技能前需要安裝任何東西嗎?
我可以透過此技能編輯現有圖片嗎?
支援哪些圖片格式和解析度?
一次可以產生多少張圖片?
什麼是 Google Search grounding?
開發者詳情
檔案結構
📄 SKILL.md