podcast-generation
テキストからAIポッドキャスト音声を生成
このスキルは、Azure OpenAIのGPT Realtime Miniモデルを使用してポッドキャストスタイルの音声ナレーションを作成できます。WebSocket接続、音声ストリーミング、フォーマット変換を処理し、自然な speechを生成します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「podcast-generation」を使用しています。 テックニュースショーのポッドキャストイントロを生成
期待される結果:
ブラウザでの再生 готовый Base64エンコードWAVファイル、生成されたナレーションテキストを示すトランスクリプト付き
「podcast-generation」を使用しています。 AIの進歩についての記事を音声に変換
期待される結果:
WebSocket経由で配信されるストリーミング音声チャンクを完全なWAVファイルに統合し、同期付きトランスクリプト
セキュリティ監査
低リスクStatic analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.
中リスクの問題 (4)
低リスクの問題 (1)
品質スコア
作れるもの
コンテンツクリエイター向けオーディオブログ
ブログ記事や記事をポッドキャストスタイルの音声に変換し、アクセシビリティとリーチの拡大を実現。
E-Learning音声ナレーション
教育コンテンツやオンラインコース用の音声ナレーションを生成。
アクセシビリティ音声ツール
テキストベースのUIコンテンツをスクリーンリーダー互換性の音声に変換。
これらのプロンプトを試す
Azure OpenAI Realtime APIを使用してこのテキストをポッドキャストスタイルの音声に変換: {text_input}{voice_name}ボイスでこのコンテンツの音声ナレーションを生成: {text_content}{article_content}のポッドキャスト音声とトランスクリプトを作成。音声出力とテキストトランスクリプトの両方を含める。複数のテキストセグメントを音声ファイルに変換。セグメント1: {text1}、セグメント2: {text2}、セグメント3: {text3}。それぞれ個別の音声ファイルを生成。ベストプラクティス
- 認証のためにスキルを使用する前にAzure環境変数を設定
- コンテンツタイプに基づいて適切なボイス選択を使用(正式なコンテンツにはonyx、表現的なコンテンツにはfable)
- リトライロジックでWebSocket接続エラーを適切に処理
回避
- APIキーをクライアントサイドコードに公開しない - サーバーサイドのみに保持
- 暗号化せずに機密情報や個人情報をテキストプロンプトで送信しない
- 無制限のAPIクォータを前提にしない - レート制限とキャッシュを実装