المهارات podcast-generation
📦

podcast-generation

مخاطر منخفضة

Erzeuge KI-Podcast-Audio aus Text

Diese Fähigkeit ermöglicht es Entwicklern, podcast-artige Audio-Erzählungen mit Azure OpenAIs GPT Realtime Mini-Modell zu erstellen. Sie behandelt WebSocket-Verbindungen, Audio-Streaming und Formatkonvertierung, um natürlich klingende Sprache zu produzieren.

يدعم: Claude Codex Code(CC)
📊 69 كافٍ
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "podcast-generation". Generiere eine Podcast-Einführung für eine Tech-Nachrichtenshow

النتيجة المتوقعة:

Base64-kodierte WAV-Audiodatei, bereit für Wiedergabe im Browser, mit Transkript, das den generierten Erzähltext anzeigt

استخدام "podcast-generation". Konvertiere diesen Artikel über KI-Fortschritte in Audio

النتيجة المتوقعة:

Streaming-Audio-Chunks über WebSocket geliefert, kombiniert zu einer kompletten WAV-Datei mit synchronisiertem Transkript

التدقيق الأمني

مخاطر منخفضة
v1 • 2/24/2026

Static analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.

1
الملفات التي تم فحصها
127
الأسطر التي تم تحليلها
5
النتائج
1
إجمالي عمليات التدقيق
مشكلات متوسطة المخاطر (4)
Environment Variable Access for API Authentication
Skill accesses AZURE_OPENAI_AUDIO_API_KEY from environment. This is legitimate behavior for Azure OpenAI integration - API keys are required for authentication. No user input is concatenated with these values.
Network Access to Azure OpenAI Endpoint
Skill connects to Azure OpenAI WebSocket endpoint for realtime audio generation. This is expected behavior for a TTS service.
Base64 Encoding for Audio Data
Skill uses base64 encoding/decoding for audio PCM chunks. This is standard practice for transferring binary audio data over text-based protocols.
Code Fences Detected as Shell Commands
Static analyzer misidentified markdown backtick code fences as Ruby/shell backtick execution. The backticks are markdown delimiters for code blocks, not actual shell commands.
مشكلات منخفضة المخاطر (1)
Misidentified Weak Cryptographic Algorithm
Static analyzer incorrectly flagged YAML frontmatter and plain text references as weak cryptographic algorithms. No cryptographic code exists in this skill.
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
85
المحتوى
50
المجتمع
68
الأمان
100
الامتثال للمواصفات

ماذا يمكنك بناءه

Content Creator Audio Blog

Verwandle Blog-Posts oder Artikel in podcast-artiges Audio für Barrierefreiheit und größere Reichweite.

E-Learning Audio-Erzählung

Generiere gesprochene Audio-Erzählungen für Bildungsinhalte und Online-Kurse.

Barrierefreiheits-Audio-Tool

Konvertiere textbasierte UI-Inhalte in Sprache für Screen-Reader-Kompatibilität.

جرّب هذه الموجهات

Grundlegende Text-zu-Sprache
Wandle diesen Text in podcast-artiges Audio mit der Azure OpenAI Realtime API um: {text_input}
Benutzerdefinierte Voice-Auswahl
Generiere Audio-Erzählung mit der {voice_name} Stimme für diesen Inhalt: {text_content}
Audio mit Transkript
Erstelle Podcast-Audio und Transkript für: {article_content}. Füge sowohl Audio-Ausgabe als auch Text-Transkript hinzu.
Batch-Inhaltsverarbeitung
Verarbeite mehrere Text-Segmente in Audio-Dateien. Segment 1: {text1}, Segment 2: {text2}, Segment 3: {text3}. Generiere individuelle Audio-Dateien für jedes.

أفضل الممارسات

  • Konfiguriere Azure-Umgebungsvariablen vor der Verwendung der Fähigkeit zur Authentifizierung
  • Verwende angemessene Voice-Auswahl basierend auf Inhaltstyp (onyx für formell, fable für ausdrucksstark)
  • Behandle WebSocket-Verbindungsfehler mit Wiederholungslogik

تجنب

  • API-Schlüssel nicht im Client-seitigen Code exponieren - nur serverseitig behalten
  • Vermeide das Senden sensibler oder persönlicher Informationen in Text-Prompts ohne Verschlüsselung
  • Gehe nicht von unbegrenztem API-Kontingent aus - implementiere Rate-Limiting und Caching

الأسئلة المتكررة

Welche Azure-Dienste erfordert diese Fähigkeit?
Diese Fähigkeit erfordert Azure OpenAI mit GPT Realtime Mini-Bereitstellung und gültige API-Anmeldedaten.
Kann ich diese Fähigkeit offline verwenden?
Nein, diese Fähigkeit erfordert eine aktive Internetverbindung, um mit Azure OpenAI-Diensten zu kommunizieren.
Welches Audio-Format gibt die Fähigkeit aus?
Die Fähigkeit gibt WAV-Format-Audio (24 kHz, 16-Bit, Mono) als Base64 kodiert für einfache Übertragung aus.
Wie viele Stimmen sind verfügbar?
Sechs Stimmen werden unterstützt: alloy, echo, fable, onyx, nova und shimmer.
Ist diese Fähigkeit für den Produktionseinsatz geeignet?
Ja, mit angemessener Fehlerbehandlung und API-Schlüssel-Verwaltung kann dies in Produktionsanwendungen verwendet werden.
Speichert diese Fähigkeit Audiodaten?
Nein, die Fähigkeit verarbeitet Audio im Speicher und gibt es an den Aufrufer zurück ohne persistente Speicherung.

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

مرجع

main

بنية الملفات

📄 SKILL.md