podcast-generation
Генерация аудио подкаста с помощью ИИ из текста
Этот навык позволяет разработчикам создавать аудионарративы в стиле подкаста, используя модель GPT Realtime Mini от Azure OpenAI. Он обрабатывает WebSocket-соединения, потоковую передачу аудио и преобразование форматов для создания естественного звучания речи.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «podcast-generation». Сгенерируйте вступление к подкасту для шоу о технологических новостях
Ожидаемый результат:
Аудиофайл в формате WAV, закодированный в base64, готовый для воспроизведения в браузере, с транскрипцией, показывающей сгенерированный текст нарации
Использование «podcast-generation». Преобразуйте эту статью о достижениях ИИ в аудио
Ожидаемый результат:
Потоковые аудиофрагменты, доставляемые через WebSocket, объединённые в полный WAV-файл с синхронизированной транскрипцией
Аудит безопасности
Низкий рискStatic analysis flagged 23 potential issues, but evaluation confirms all are false positives. The skill uses environment variables for Azure API authentication (legitimate), makes network calls to Azure OpenAI WebSocket endpoint (expected for TTS functionality), and uses base64 encoding for audio data transfer (standard practice). No malicious intent or data exfiltration patterns found. This is a legitimate podcast generation skill using Azure OpenAI Realtime API.
Проблемы среднего риска (4)
Проблемы низкого риска (1)
Оценка качества
Что вы можете построить
Аудиоблог для создателей контента
Преобразование сообщений блога или статей в аудио в стиле подкаста для доступности и расширения аудитории.
Аудионарация для электронного обучения
Генерация звуковых нараций для образовательного контента и онлайн-курсов.
Инструмент аудиодоступности
Преобразование текстового контента пользовательского интерфейса в речь для совместимости со средствами чтения с экрана.
Попробуйте эти промпты
Преобразуйте этот текст в аудио в стиле подкаста, используя Azure OpenAI Realtime API: {text_input}Сгенерируйте аудионарацию голосом {voice_name} для этого контента: {text_content}Создайте подкаст-аудио и транскрипцию для: {article_content}. Включите как аудиовыход, так и текстовую транскрипцию.Обработайте несколько текстовых сегментов в аудиофайлы. Сегмент 1: {text1}, Сегмент 2: {text2}, Сегмент 3: {text3}. Сгенерируйте отдельные аудиофайлы для каждого.Лучшие практики
- Настройте переменные среды Azure перед использованием навыка для аутентификации
- Используйте соответствующий выбор голоса в зависимости от типа контента (onyx для формального, fable для выразительного)
- Обрабатывайте ошибки WebSocket-соединения корректно с логикой повторных попыток
Избегать
- Не раскрывайте ключи API в клиентском коде - храните их только на сервере
- Избегайте отправки конфиденциальной или личной информации в текстовых подсказках без шифрования
- Не предполагайте бесконечную квоту API - реализуйте ограничение частоты запросов и кэширование
Часто задаваемые вопросы
Какие службы Azure требуются для этого навыка?
Могу ли я использовать этот навык офлайн?
В каком аудиоформате выводит навык?
Сколько доступно голосов?
Подходит ли этот навык для производственного использования?
Хранит ли этот навык какие-либо аудиоданные?
Сведения для разработчиков
Автор
sickn33Лицензия
MIT
Репозиторий
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/podcast-generationСсылка
main
Структура файлов
📄 SKILL.md