スキル ai-avatar-video
🎬

ai-avatar-video

安全 🌐 ネットワークアクセス

AIアバターとトークヘッド動画の制作

こちらからも入手できます: inference-skills,doany-ai,qu-skills,inference-sh-skills,infsh-skills,agentspace-so,inference-sh,runcomfy-com

プロフェッショナルなアバター動画を制作するには、複数のツールとサービスが必要です。このスキルは、inference.shへの統合CLIインターフェースによりAIアバター動画制作を簡素化し、組み込みTTS、複数のアバターモデル、口パク機能を提供します。

対応: Claude Codex Code(CC)
🥉 74 ブロンズ
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「ai-avatar-video」を使用しています。 example.com/portrait.jpgのポートレートを使用して、音声スクリプト「製品デモへようこそ。3つの機能をご案内します。」でトークヘッド動画を生成。

期待される結果:

自然な口パクで1080p 解像度のプロフェッショナルなトークヘッド動画が生成されます。AIプレゼンターが選択した音声プロフィールでスクリプトを配信し、プレゼンテーションやマーケティング資料への埋め込みに適しています。

「ai-avatar-video」を使用しています。 生産性アプリについてのカジュアルな推薦付きでUGCスタイルコンテンツを作成

期待される結果:

カジュアルなプレゼンターtoneの本物のような推薦動画が作成されます。ビデオには自然なジェスチャー、適切な照明、会話的な配信があり、親近感和冴えのある本物の印象を与えます。

「ai-avatar-video」を使用しています。 元の英語音声とポートレート画像を使用して製品動画をスペイン語に吹き替え

期待される結果:

元のビデオは翻訳されたテキストから生成されたスペイン語音声で口パクが再同期されます。AIアバターは一貫した外見を保ちながら、ローカライズされたコンテンツを配信します。

セキュリティ監査

安全
v1 • 5/29/2026

This is a documentation-only skill (SKILL.md) describing how to use the inference.sh belt CLI for AI avatar video generation. All static findings are false positives: the weak crypto flag was triggered by YAML frontmatter, and the backtick executions are markdown code fence delimiters in documentation examples, not actual code execution. The hardcoded URLs are legitimate inference.sh service endpoints and documentation links.

1
スキャンされたファイル
268
解析された行数
1
検出結果
1
総監査数

リスク要因

監査者: claude

品質スコア

38
アーキテクチャ
100
保守性
87
コンテンツ
55
コミュニティ
100
セキュリティ
83
仕様準拠

作れるもの

マーケティングとUGCコンテンツ

組み込みTTSを使用してAIプレゼンターで魅力的なUGCスタイル広告と製品デモを作成。複数のプレゼンターバリエーションをA/Bテスト用に生成。

トレーニングと教育動画

バーチャルプレゼンターで一貫したトレーニングコンテンツを制作。別途音声録音なしでクイック動画生成に組み込みTTSを使用。

動画のローカライズ

文字起こし、翻訳、TTSとアバター口パク生成を組み合わせることで、ビデオコンテンツを複数言語に翻訳。

これらのプロンプトを試す

基本アバター動画
ポートレート画像を使用して音声スクリプト「[スクリプトを入力]」でP-Video-AvatarとZephyr音声で1080p 解像度のトークヘッド動画を生成。
音声駆動型アバター
[portrait-url]のポートレートから[audio-url]の音声ファイルを使用してOmniHuman 1.5モデルでアバター動画を作成。
UGCスタイルプレゼンター
本物のような推薦toneのカジュアルUGCスタイルアバター動画を生成。ポートレートプロンプト:「[説明文]のカジュアルセルフィースタイルの写真」、音声スクリプト:「[自然な推薦テキスト]」を使用。
バッチローカライズ
このスクリプト「[スクリプト]」の[N]個のプレゼンターバリエーションを、.multilingualコンテンツテスト用にP-Video-Avatarの異なる音声オプションを使用して作成。

ベストプラクティス

  • 最佳のアバター結果を得るには、高画質で正面からのポートレート写真と適切な照明を使用
  • 他のモデルを探索する前に最快の結果と最安コストのためにまずP-Video-Avatarから始める
  • バッチ生成前に、音色と外見を微調整するために音声プロンプトと動画プロンプトを別々にテスト

回避

  • 入力画像として低画質や heavily加工されたポートレートを使用しない
  • 適切な顔切り抜きなしの背景が多い画像は使用しない
  • バッチコンテンツを生成する前に単一ビデオでのテストを skip しない

よくある質問

トークヘッド動画作成に最適なモデルはどれですか?
P-Video-Avatarはほとんどのユースケースにおすすめします。組み込みTTS、30 voice opções、1080pサポートを提供しながら、代替案より18倍高速で6倍安価です。マルチキャラクターシーンにはOmniHuman、高度にリアルな口パクにはPixVerseを使用してください。
別途音声を録音する必要がありますか?
P-Video-Avatar、Fabric、OmniHumanは組み込みTTSオプションを提供します。TTSのないモデルの場合は、Inworld TTS-2、ElevenLabs、Kokoroを使用して別途音声を生成し、その後アバター動画を作成できます。
最適な画像形式は何ですか?
明確で正面からのポートレート写真と適切な照明を使用してください。AIは professional ヘッドショットで最も効果的です。 heavily加工された画像、対象キャラクターを指定しないグループ写真、低画質画像は避けてください。
複数の言語で動画を作成できますか?
はい。P-Video-Avatarは組み込みTTSで10言語をサポートしています。その他の言語では、KokoroやInworld TTS-2などのTTSサービスを使用して翻訳された音声を生成し、口パクモデルでアバターと同期させることができます。
複数のプレゼンターバリエーションを生成するにはどうすればいいですか?
異なる音声オプション(Zephyr、Puck、Aoede)とポートレートプロンプトでバッチワークフローを使用してください。同じスクリプトを維持しながら音声バリエーションをループさせて、異なる対象者セグメント向けの 本物ようなバリエーションを作成します。
標準的な処理時間はどれくらいですか?
P-Video-Avatarは約1.83秒/秒の速度で処理します。OmniHumanは28秒/秒で低速です。処理時間はモデル選択、解像度、ビデオの長さに依存します。

開発者の詳細

ファイル構成

📄 SKILL.md