Навыки azure-ai-voicelive-py

🎙️

azure-ai-voicelive-py

Name: azure-ai-voicelive-py
Author: sickn33

Безопасно

Создание приложений Voice AI в реальном времени с Azure

Создавайте интерактивные приложения Voice AI с двунаправленной потоковой передачей аудио в реальном времени с помощью Azure AI Voice Live SDK. Этот навык предоставляет полную справочную документацию для создания готовых к производству голосовых ассистентов.

Поддерживает: Claude Codex Code(CC)

📊 71 Адекватно

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «azure-ai-voicelive-py». How do I authenticate with Azure Voice Live using DefaultAzureCredential?

Ожидаемый результат:

Use DefaultAzureCredential for production authentication: ```python
from azure.ai.voicelive.aio import connect
from azure.identity.aio import DefaultAzureCredential

async with connect(
endpoint=os.environ['AZURE_COGNITIVE_SERVICES_ENDPOINT'],
credential=DefaultAzureCredential(),
model='gpt-4o-realtime-preview',
credential_scopes=['https://cognitiveservices.azure.com/.default']
) as conn:
# Use connection
```

Использование «azure-ai-voicelive-py». What voice options are available in Azure Voice Live?

Ожидаемый результат:

Azure Voice Live supports these built-in voices: alloy (neutral), echo (warm), shimmer (professional), sage (authoritative), coral (friendly), ash (deep), ballad (expressive), verse (storytelling). Azure also provides AzureStandardVoice, AzureCustomVoice, and AzurePersonalVoice models.

Использование «azure-ai-voicelive-py». How do I handle interruptions in voice conversations?

Ожидаемый результат:

Handle interruptions by listening for speech_started events and canceling the current response: ```python
async for event in conn:
if event.type == 'input_audio_buffer.speech_started':
await conn.response.cancel()
await conn.output_audio_buffer.clear()
```

Аудит безопасности

Безопасно

v1 • 2/24/2026

Documentation skill providing reference material for Azure AI Voice Live SDK. Static findings are false positives - scanner detected markdown code fences as shell commands, placeholder URLs as network calls, and example code patterns as security issues. No executable code or malicious behavior present.

Просканировано файлов

315

Проанализировано строк

находки

Всего аудитов

Проблем безопасности не найдено

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

100

Соответствие спецификации

Что вы можете построить

Разработка голосового ассистента

Создавайте интерактивных голосовых ассистентов, которые реагируют на речь пользователя в реальном времени с помощью служб Azure AI

Боты службы поддержки клиентов

Создавайте разговорных агентов AI для автоматизированной поддержки клиентов с естественным голосовым взаимодействием

Инструменты доступности

Разрабатывайте голосо управляемые интерфейсы для приложений доступности

Попробуйте эти промпты

Базовое подключение голоса

Покажите, как настроить базовое подключение Azure AI Voice Live с использованием DefaultAzureCredential на Python

Настройка потоковой передачи аудио

Создайте пример на Python, который передает аудио с микрофона в Azure Voice Live и воспроизводит ответы

Конфигурация сессии

Как настроить параметры сессии, такие как выбор голоса, модальности и определение очередности для голосового ассистента?

Шаблон обработки событий

Напишите полный шаблон обработки событий для Azure Voice Live, который обрабатывает аудиотранскрипты, вызовы функций и прерывания

Лучшие практики

Используйте DefaultAzureCredential вместо ключей API для производственных сред
Настройте соответствующие параметры определения очередности в зависимости от варианта использования (server_vad или semantic_vad)
Обрабатывайте ошибки подключения и реализуйте логику повторного подключения для надежных приложений
Используйте соответствующие аудиоформаты, соответствующие возможностям вашего оборудования (PCM16 с частотой 24 кГц по умолчанию)

Избегать

Избегайте жесткого кодирования ключей API в исходном коде - используйте переменные среды или Azure Key Vault
Не пропускайте обработку ошибок для разрывов подключения и ошибок API
Избегайте блокирующих операций в цикле событий - правильно используйте async/await
Не предполагайте непрерывную потоковую передачу аудио - реализуйте правильное буферизация и управление потоком

Часто задаваемые вопросы

Что такое Azure AI Voice Live SDK?

Azure AI Voice Live SDK — это библиотека Python для создания двунаправленных приложений Voice AI в реальном времени. Она обеспечивает потоковую передачу аудио в службы Azure AI и из них для речевого взаимодействия.

Нужна ли подписка Azure?

Да, вам нужна подписка Azure Cognitive Services со включенной службой речи. Вам понадобятся URL-адрес конечной точки и соответствующие учетные данные для аутентификации.

Какие аудиоформаты поддерживаются?

Azure Voice Live поддерживает форматы PCM16 (по умолчанию 24 кГц), PCM16-8000hz, PCM16-16000hz, g711_ulaw и g711_alaw.

Как работает определение очередности?

Определение очередности использует определение речевой активности (VAD) для определения того, когда пользователь перестает говорить. Вы можете использовать server_vad (по умолчанию), azure_semantic_vad (более умное) или отключить его для ручного управления очередностью.

Могу ли я использовать пользовательские голоса?

Да, Azure поддерживает пользовательские голоса через модели AzureCustomVoice и AzurePersonalVoice в дополнение к встроенным голосам, таким как alloy, echo и shimmer.

Подходит ли это для производственного использования?

Да, Azure AI Voice Live предназначен для производственных приложений. Используйте DefaultAzureCredential для безопасной аутентификации и реализуйте правильную обработку ошибок для надежной работы.

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Репозиторий

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-voicelive-py

Ссылка

main

Структура файлов

📄 SKILL.md