Habilidades podcast-generation

📦

podcast-generation

Name: podcast-generation
Author: sickn33

Baixo Risco

Gerar Áudio de Podcast AI a Partir de Texto

Esta skill permite que desenvolvedores criem narrativas de áudio estilo podcast usando o modelo GPT Realtime Mini do Azure OpenAI. Ela gerencia conexões WebSocket, streaming de áudio e conversão de formato para produzir fala com som natural.

Suporta: Claude Codex Code(CC)

⚠️ 66 Ruim

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "podcast-generation". Gere uma introdução de podcast para um programa de notícias de tecnologia

Resultado esperado:

Arquivo de áudio WAV codificado em base64 pronto para reprodução no browser, com transcrição mostrando o texto de narração gerado

A utilizar "podcast-generation". Converta este artigo sobre avanços de IA em áudio

Resultado esperado:

Chunks de áudio transmitidos via WebSocket, combinados em um arquivo WAV completo com transcrição sincronizada

Auditoria de Segurança

Baixo Risco

v1 • 2/24/2026

Static analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.

Arquivos analisados

127

Linhas analisadas

achados

Total de auditorias

Problemas de Risco Médio (4)

SKILL.md:23

Environment Variable Access for API Authentication

Skill accesses AZURE_OPENAI_AUDIO_API_KEY from environment. This is legitimate behavior for Azure OpenAI integration - API keys are required for authentication. No user input is concatenated with these values.

SKILL.md:24

Network Access to Azure OpenAI Endpoint

Skill connects to Azure OpenAI WebSocket endpoint for realtime audio generation. This is expected behavior for a TTS service.

SKILL.md:68 SKILL.md:84

Base64 Encoding for Audio Data

Skill uses base64 encoding/decoding for audio PCM chunks. This is standard practice for transferring binary audio data over text-based protocols.

SKILL.md:22-111

Code Fences Detected as Shell Commands

Static analyzer misidentified markdown backtick code fences as Ruby/shell backtick execution. The backticks are markdown delimiters for code blocks, not actual shell commands.

Problemas de Baixo Risco (1)

SKILL.md:3 SKILL.md:121 SKILL.md:126

Misidentified Weak Cryptographic Algorithm

Static analyzer incorrectly flagged YAML frontmatter and plain text references as weak cryptographic algorithms. No cryptographic code exists in this skill.

Auditado por: claude

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

Segurança

100

Conformidade com especificações

O Que Você Pode Construir

Blog de Áudio para Criadores de Conteúdo

Transforme posts de blog ou artigos em áudio estilo podcast para acessibilidade e maior alcance.

Narração de Áudio para E-Learning

Gere narrações de áudio falado para conteúdo educacional e cursos online.

Ferramenta de Acessibilidade de Áudio

Converta conteúdo de interface baseado em texto em fala para compatibilidade com leitores de tela.

Tente Estes Prompts

Texto para Fala Básico

Converta este texto para áudio estilo podcast usando a Azure OpenAI Realtime API: {text_input}

Seleção Personalizada de Voz

Gere narração de áudio com a voz {voice_name} para este conteúdo: {text_content}

Áudio com Transcrição

Crie áudio de podcast e transcrição para: {article_content}. Inclua tanto a saída de áudio quanto a transcrição de texto.

Processamento em Lote de Conteúdo

Processe múltiplos segmentos de texto em arquivos de áudio. Segmento 1: {text1}, Segmento 2: {text2}, Segmento 3: {text3}. Gere arquivos de áudio individuais para cada um.

Melhores Práticas

Configure variáveis de ambiente do Azure antes de usar a skill para autenticação
Use seleção de voz apropriada baseada no tipo de conteúdo (onyx para formal, fable para expressivo)
Lide com erros de conexão WebSocket de forma graciosa com lógica de retry

Evitar

Não exponha chaves de API em código client-side - mantenha-as apenas no servidor
Evite enviar informações sensíveis ou pessoais em prompts de texto sem criptografia
Não assuma cota de API infinita - implemente rate limiting e cache

Perguntas Frequentes

Que serviços do Azure esta skill requer?

Esta skill requer Azure OpenAI com deployment do GPT Realtime Mini e credenciais válidas da API.

Posso usar esta skill offline?

Não, esta skill requer uma conexão ativa à internet para se comunicar com os serviços do Azure OpenAI.

Que formato de áudio a skill produz?

A skill produz áudio em formato WAV (24kHz, 16-bit, mono) codificado em base64 para fácil transferência.

Quantas vozes estão disponíveis?

Seis vozes são suportadas: alloy, echo, fable, onyx, nova e shimmer.

Esta skill é adequada para uso em produção?

Sim, com tratamento de erro apropriado e gerenciamento de chaves de API, isto pode ser usado em aplicações de produção.

Esta skill armazena algum dado de áudio?

Não, a skill processa áudio na memória e o retorna ao chamador sem armazenamento persistente.

Detalhes do Desenvolvedor

Autor

sickn33

Licença

MIT

Repositório

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/podcast-generation

Referência

main

Estrutura de arquivos

📄 SKILL.md