
精选
AI 媒体制作工具包
使用 90+ 模型生成 AI 图像、视频和音频 — 从文本到最终资产的完整媒体制作流程。
3 技能 22 安装次数
mediaaiimage-generationvideo-generationaudiocontent-creation
今天更新
安装
运行此命令,安装该技能包中的全部技能:
npx skillstore add @ai-media-production-toolkit CLI 会自动检测 Codex 和 Claude Code 文件夹;如果两者都可用,就会同时安装。
概览
使用指南
由 AI 增强详细指南
## 概述 完整的 AI 媒体制作流程 — 使用 50+ 模型(FLUX、Gemini、Grok)生成图像,使用 40+ 模型(Veo、Wan、OmniHuman)从文本/图像/音频创建视频,并通过 fal.ai 音频模型处理文本转语音和语音转文本。 ## 快速开始 1. 安装:`npx skillstore add @ai-media-production-toolkit` 2. 生成图像:使用 **ai-image-generation** 技能与 inference.sh CLI,通过 FLUX、Gemini 3 Pro Image、Grok Imagine 或其他模型根据文本提示创建图像 3. 创建视频:使用 **ai-video-generation** 技能,使用 Veo 3.1、Grok Video、Wan 2.5 等模型根据文本、图像或音频生成视频 4. 转换音频:使用 **fal-audio** 技能通过 fal.ai 进行文本转语音或语音转文本 ## 主要命令 - **ai-image-generation**:文本转图像、图像转图像、局部重绘、LoRA、超分辨率 — 支持 FLUX Dev LoRA、Seedream 4.5、Reve、ImagineArt 及 50+ 模型 - **ai-video-generation**:文本转视频、图像转视频、音频驱动生成 — 支持 Veo 3.1、Grok Video、Wan 2.5、OmniHuman 及 40+ 模型 - **fal-audio**:使用 fal.ai 音频模型进行文本转语音和语音转文本 ## 技巧 - 技能串联:使用 ai-image-generation 生成图像,然后使用 ai-video-generation 将其动画化为视频 - 使用 fal-audio TTS 添加画外音,并与生成的视频结合 - 非常适合社交媒体内容、产品模型、营销视觉效果和 AI 艺术工作流程
技能
3📦
ai-image-generation
高风险 38使用 inference.sh 生成 AI 图像
团队需要快速访问多个图像生成模型,而无需学习每个提供商的界面。此技能为 Claude、Codex 和 Claude Code 提供简洁的 inference.sh CLI 提示,用于图像创建和编辑。
🎨 设计与创意 由 inference-sh ⚙️🌐
📦
ai-video-generation
中风险 72使用 CLI 模型生成 AI 视频
跨多个提供商制作短 AI 视频片段需要特定于模型的命令和输入。此技能为 Claude、Codex 和 Claude Code 提供专注提示,用于运行 inference.sh 视频应用。
🎨 设计与创意 由 inference-sh ⚙️🌐
📦
fal-audio
低风险 78使用 fal.ai 创建和转录音频
音频团队在文本、生成语音和转录稿之间切换时,需要清晰的指导。此技能通过实用的提示和边界,帮助 Claude、Codex 和 Claude Code 规划 fal.ai 音频工作流。
📈 效率 由 sickn33 🌐


