精选

AI 媒体制作工具包

使用 90+ 模型生成 AI 图像、视频和音频 — 从文本到最终资产的完整媒体制作流程。

3 技能 22 安装次数

mediaaiimage-generationvideo-generationaudiocontent-creation

今天更新

安装

运行此命令，安装该技能包中的全部技能：

npx skillstore add @ai-media-production-toolkit

CLI 会自动检测 Codex 和 Claude Code 文件夹；如果两者都可用，就会同时安装。

概览

使用指南

由 AI 增强

详细指南

## 概述

完整的 AI 媒体制作流程 — 使用 50+ 模型（FLUX、Gemini、Grok）生成图像，使用 40+ 模型（Veo、Wan、OmniHuman）从文本/图像/音频创建视频，并通过 fal.ai 音频模型处理文本转语音和语音转文本。

## 快速开始

1. 安装：`npx skillstore add @ai-media-production-toolkit`
2. 生成图像：使用 **ai-image-generation** 技能与 inference.sh CLI，通过 FLUX、Gemini 3 Pro Image、Grok Imagine 或其他模型根据文本提示创建图像
3. 创建视频：使用 **ai-video-generation** 技能，使用 Veo 3.1、Grok Video、Wan 2.5 等模型根据文本、图像或音频生成视频
4. 转换音频：使用 **fal-audio** 技能通过 fal.ai 进行文本转语音或语音转文本

## 主要命令

- **ai-image-generation**：文本转图像、图像转图像、局部重绘、LoRA、超分辨率 — 支持 FLUX Dev LoRA、Seedream 4.5、Reve、ImagineArt 及 50+ 模型
- **ai-video-generation**：文本转视频、图像转视频、音频驱动生成 — 支持 Veo 3.1、Grok Video、Wan 2.5、OmniHuman 及 40+ 模型
- **fal-audio**：使用 fal.ai 音频模型进行文本转语音和语音转文本

## 技巧

- 技能串联：使用 ai-image-generation 生成图像，然后使用 ai-video-generation 将其动画化为视频
- 使用 fal-audio TTS 添加画外音，并与生成的视频结合
- 非常适合社交媒体内容、产品模型、营销视觉效果和 AI 艺术工作流程