Fähigkeiten podcast-generation

📦

podcast-generation

Name: podcast-generation
Author: sickn33

Niedriges Risiko

Erzeuge KI-Podcast-Audio aus Text

Diese Fähigkeit ermöglicht es Entwicklern, podcast-artige Audio-Erzählungen mit Azure OpenAIs GPT Realtime Mini-Modell zu erstellen. Sie behandelt WebSocket-Verbindungen, Audio-Streaming und Formatkonvertierung, um natürlich klingende Sprache zu produzieren.

Unterstützt: Claude Codex Code(CC)

⚠️ 66 Schlecht

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "podcast-generation". Generiere eine Podcast-Einführung für eine Tech-Nachrichtenshow

Erwartetes Ergebnis:

Base64-kodierte WAV-Audiodatei, bereit für Wiedergabe im Browser, mit Transkript, das den generierten Erzähltext anzeigt

Verwendung von "podcast-generation". Konvertiere diesen Artikel über KI-Fortschritte in Audio

Erwartetes Ergebnis:

Streaming-Audio-Chunks über WebSocket geliefert, kombiniert zu einer kompletten WAV-Datei mit synchronisiertem Transkript

Sicherheitsaudit

Niedriges Risiko

v1 • 2/24/2026

Static analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.

Gescannte Dateien

127

Analysierte Zeilen

befunde

Gesamtzahl Audits

Probleme mit mittlerem Risiko (4)

SKILL.md:23

Environment Variable Access for API Authentication

Skill accesses AZURE_OPENAI_AUDIO_API_KEY from environment. This is legitimate behavior for Azure OpenAI integration - API keys are required for authentication. No user input is concatenated with these values.

SKILL.md:24

Network Access to Azure OpenAI Endpoint

Skill connects to Azure OpenAI WebSocket endpoint for realtime audio generation. This is expected behavior for a TTS service.

SKILL.md:68 SKILL.md:84

Base64 Encoding for Audio Data

Skill uses base64 encoding/decoding for audio PCM chunks. This is standard practice for transferring binary audio data over text-based protocols.

SKILL.md:22-111

Code Fences Detected as Shell Commands

Static analyzer misidentified markdown backtick code fences as Ruby/shell backtick execution. The backticks are markdown delimiters for code blocks, not actual shell commands.

Probleme mit niedrigem Risiko (1)

SKILL.md:3 SKILL.md:121 SKILL.md:126

Misidentified Weak Cryptographic Algorithm

Static analyzer incorrectly flagged YAML frontmatter and plain text references as weak cryptographic algorithms. No cryptographic code exists in this skill.

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

Sicherheit

100

Spezifikationskonformität

Was du bauen kannst

Content Creator Audio Blog

Verwandle Blog-Posts oder Artikel in podcast-artiges Audio für Barrierefreiheit und größere Reichweite.

E-Learning Audio-Erzählung

Generiere gesprochene Audio-Erzählungen für Bildungsinhalte und Online-Kurse.

Barrierefreiheits-Audio-Tool

Konvertiere textbasierte UI-Inhalte in Sprache für Screen-Reader-Kompatibilität.

Probiere diese Prompts

Grundlegende Text-zu-Sprache

Wandle diesen Text in podcast-artiges Audio mit der Azure OpenAI Realtime API um: {text_input}

Benutzerdefinierte Voice-Auswahl

Generiere Audio-Erzählung mit der {voice_name} Stimme für diesen Inhalt: {text_content}

Audio mit Transkript

Erstelle Podcast-Audio und Transkript für: {article_content}. Füge sowohl Audio-Ausgabe als auch Text-Transkript hinzu.

Batch-Inhaltsverarbeitung

Verarbeite mehrere Text-Segmente in Audio-Dateien. Segment 1: {text1}, Segment 2: {text2}, Segment 3: {text3}. Generiere individuelle Audio-Dateien für jedes.

Bewährte Verfahren

Konfiguriere Azure-Umgebungsvariablen vor der Verwendung der Fähigkeit zur Authentifizierung
Verwende angemessene Voice-Auswahl basierend auf Inhaltstyp (onyx für formell, fable für ausdrucksstark)
Behandle WebSocket-Verbindungsfehler mit Wiederholungslogik

Vermeiden

API-Schlüssel nicht im Client-seitigen Code exponieren - nur serverseitig behalten
Vermeide das Senden sensibler oder persönlicher Informationen in Text-Prompts ohne Verschlüsselung
Gehe nicht von unbegrenztem API-Kontingent aus - implementiere Rate-Limiting und Caching

Häufig gestellte Fragen

Welche Azure-Dienste erfordert diese Fähigkeit?

Diese Fähigkeit erfordert Azure OpenAI mit GPT Realtime Mini-Bereitstellung und gültige API-Anmeldedaten.

Kann ich diese Fähigkeit offline verwenden?

Nein, diese Fähigkeit erfordert eine aktive Internetverbindung, um mit Azure OpenAI-Diensten zu kommunizieren.

Welches Audio-Format gibt die Fähigkeit aus?

Die Fähigkeit gibt WAV-Format-Audio (24 kHz, 16-Bit, Mono) als Base64 kodiert für einfache Übertragung aus.

Wie viele Stimmen sind verfügbar?

Sechs Stimmen werden unterstützt: alloy, echo, fable, onyx, nova und shimmer.

Ist diese Fähigkeit für den Produktionseinsatz geeignet?

Ja, mit angemessener Fehlerbehandlung und API-Schlüssel-Verwaltung kann dies in Produktionsanwendungen verwendet werden.

Speichert diese Fähigkeit Audiodaten?

Nein, die Fähigkeit verarbeitet Audio im Speicher und gibt es an den Aufrufer zurück ohne persistente Speicherung.

Entwicklerdetails

Autor

sickn33

Lizenz

MIT

Repository

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/podcast-generation

Ref

main

Dateistruktur

📄 SKILL.md