podcast-generation
Gerar Áudio de Podcast AI a Partir de Texto
Esta skill permite que desenvolvedores criem narrativas de áudio estilo podcast usando o modelo GPT Realtime Mini do Azure OpenAI. Ela gerencia conexões WebSocket, streaming de áudio e conversão de formato para produzir fala com som natural.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "podcast-generation". Gere uma introdução de podcast para um programa de notícias de tecnologia
Resultado esperado:
Arquivo de áudio WAV codificado em base64 pronto para reprodução no browser, com transcrição mostrando o texto de narração gerado
A utilizar "podcast-generation". Converta este artigo sobre avanços de IA em áudio
Resultado esperado:
Chunks de áudio transmitidos via WebSocket, combinados em um arquivo WAV completo com transcrição sincronizada
Auditoria de Segurança
Baixo RiscoStatic analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.
Problemas de Risco Médio (4)
Problemas de Baixo Risco (1)
Pontuação de qualidade
O Que Você Pode Construir
Blog de Áudio para Criadores de Conteúdo
Transforme posts de blog ou artigos em áudio estilo podcast para acessibilidade e maior alcance.
Narração de Áudio para E-Learning
Gere narrações de áudio falado para conteúdo educacional e cursos online.
Ferramenta de Acessibilidade de Áudio
Converta conteúdo de interface baseado em texto em fala para compatibilidade com leitores de tela.
Tente Estes Prompts
Converta este texto para áudio estilo podcast usando a Azure OpenAI Realtime API: {text_input}Gere narração de áudio com a voz {voice_name} para este conteúdo: {text_content}Crie áudio de podcast e transcrição para: {article_content}. Inclua tanto a saída de áudio quanto a transcrição de texto.Processe múltiplos segmentos de texto em arquivos de áudio. Segmento 1: {text1}, Segmento 2: {text2}, Segmento 3: {text3}. Gere arquivos de áudio individuais para cada um.Melhores Práticas
- Configure variáveis de ambiente do Azure antes de usar a skill para autenticação
- Use seleção de voz apropriada baseada no tipo de conteúdo (onyx para formal, fable para expressivo)
- Lide com erros de conexão WebSocket de forma graciosa com lógica de retry
Evitar
- Não exponha chaves de API em código client-side - mantenha-as apenas no servidor
- Evite enviar informações sensíveis ou pessoais em prompts de texto sem criptografia
- Não assuma cota de API infinita - implemente rate limiting e cache
Perguntas Frequentes
Que serviços do Azure esta skill requer?
Posso usar esta skill offline?
Que formato de áudio a skill produz?
Quantas vozes estão disponíveis?
Esta skill é adequada para uso em produção?
Esta skill armazena algum dado de áudio?
Detalhes do Desenvolvedor
Autor
sickn33Licença
MIT
Repositório
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/podcast-generationReferência
main
Estrutura de arquivos
📄 SKILL.md