Habilidades azure-ai-voicelive-py
🎙️

azure-ai-voicelive-py

Seguro

Создание приложений Voice AI в реальном времени с Azure

Создавайте интерактивные приложения Voice AI с двунаправленной потоковой передачей аудио в реальном времени с помощью Azure AI Voice Live SDK. Этот навык предоставляет полную справочную документацию для создания готовых к производству голосовых ассистентов.

Soporta: Claude Codex Code(CC)
📊 71 Adecuado
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "azure-ai-voicelive-py". How do I authenticate with Azure Voice Live using DefaultAzureCredential?

Resultado esperado:

Use DefaultAzureCredential for production authentication: ```python
from azure.ai.voicelive.aio import connect
from azure.identity.aio import DefaultAzureCredential

async with connect(
endpoint=os.environ['AZURE_COGNITIVE_SERVICES_ENDPOINT'],
credential=DefaultAzureCredential(),
model='gpt-4o-realtime-preview',
credential_scopes=['https://cognitiveservices.azure.com/.default']
) as conn:
# Use connection
```

Usando "azure-ai-voicelive-py". What voice options are available in Azure Voice Live?

Resultado esperado:

Azure Voice Live supports these built-in voices: alloy (neutral), echo (warm), shimmer (professional), sage (authoritative), coral (friendly), ash (deep), ballad (expressive), verse (storytelling). Azure also provides AzureStandardVoice, AzureCustomVoice, and AzurePersonalVoice models.

Usando "azure-ai-voicelive-py". How do I handle interruptions in voice conversations?

Resultado esperado:

Handle interruptions by listening for speech_started events and canceling the current response: ```python
async for event in conn:
if event.type == 'input_audio_buffer.speech_started':
await conn.response.cancel()
await conn.output_audio_buffer.clear()
```

Auditoría de seguridad

Seguro
v1 • 2/24/2026

Documentation skill providing reference material for Azure AI Voice Live SDK. Static findings are false positives - scanner detected markdown code fences as shell commands, placeholder URLs as network calls, and example code patterns as security issues. No executable code or malicious behavior present.

1
Archivos escaneados
315
Líneas analizadas
0
hallazgos
1
Auditorías totales
No se encontraron problemas de seguridad
Auditado por: claude

Puntuación de calidad

38
Arquitectura
100
Mantenibilidad
87
Contenido
22
Comunidad
100
Seguridad
100
Cumplimiento de la especificación

Lo que puedes crear

Разработка голосового ассистента

Создавайте интерактивных голосовых ассистентов, которые реагируют на речь пользователя в реальном времени с помощью служб Azure AI

Боты службы поддержки клиентов

Создавайте разговорных агентов AI для автоматизированной поддержки клиентов с естественным голосовым взаимодействием

Инструменты доступности

Разрабатывайте голосо управляемые интерфейсы для приложений доступности

Prueba estos prompts

Базовое подключение голоса
Покажите, как настроить базовое подключение Azure AI Voice Live с использованием DefaultAzureCredential на Python
Настройка потоковой передачи аудио
Создайте пример на Python, который передает аудио с микрофона в Azure Voice Live и воспроизводит ответы
Конфигурация сессии
Как настроить параметры сессии, такие как выбор голоса, модальности и определение очередности для голосового ассистента?
Шаблон обработки событий
Напишите полный шаблон обработки событий для Azure Voice Live, который обрабатывает аудиотранскрипты, вызовы функций и прерывания

Mejores prácticas

  • Используйте DefaultAzureCredential вместо ключей API для производственных сред
  • Настройте соответствующие параметры определения очередности в зависимости от варианта использования (server_vad или semantic_vad)
  • Обрабатывайте ошибки подключения и реализуйте логику повторного подключения для надежных приложений
  • Используйте соответствующие аудиоформаты, соответствующие возможностям вашего оборудования (PCM16 с частотой 24 кГц по умолчанию)

Evitar

  • Избегайте жесткого кодирования ключей API в исходном коде - используйте переменные среды или Azure Key Vault
  • Не пропускайте обработку ошибок для разрывов подключения и ошибок API
  • Избегайте блокирующих операций в цикле событий - правильно используйте async/await
  • Не предполагайте непрерывную потоковую передачу аудио - реализуйте правильное буферизация и управление потоком

Preguntas frecuentes

Что такое Azure AI Voice Live SDK?
Azure AI Voice Live SDK — это библиотека Python для создания двунаправленных приложений Voice AI в реальном времени. Она обеспечивает потоковую передачу аудио в службы Azure AI и из них для речевого взаимодействия.
Нужна ли подписка Azure?
Да, вам нужна подписка Azure Cognitive Services со включенной службой речи. Вам понадобятся URL-адрес конечной точки и соответствующие учетные данные для аутентификации.
Какие аудиоформаты поддерживаются?
Azure Voice Live поддерживает форматы PCM16 (по умолчанию 24 кГц), PCM16-8000hz, PCM16-16000hz, g711_ulaw и g711_alaw.
Как работает определение очередности?
Определение очередности использует определение речевой активности (VAD) для определения того, когда пользователь перестает говорить. Вы можете использовать server_vad (по умолчанию), azure_semantic_vad (более умное) или отключить его для ручного управления очередностью.
Могу ли я использовать пользовательские голоса?
Да, Azure поддерживает пользовательские голоса через модели AzureCustomVoice и AzurePersonalVoice в дополнение к встроенным голосам, таким как alloy, echo и shimmer.
Подходит ли это для производственного использования?
Да, Azure AI Voice Live предназначен для производственных приложений. Используйте DefaultAzureCredential для безопасной аутентификации и реализуйте правильную обработку ошибок для надежной работы.

Detalles del desarrollador

Estructura de archivos

📄 SKILL.md