Compétences azure-ai-voicelive-py
🎙️

azure-ai-voicelive-py

Sûr

Azure 를 활용한 실시간 음성 AI 앱 구축

Azure AI Voice Live SDK 를 사용하여 실시간 양방향 오디오 스트리밍이 가능한 대화형 음성 AI 애플리케이션을 만드세요. 이 스킬은 프로덕션 레벨 음성 어시스턴트 구축을 위한 완전한 참조 문서를 제공합니다.

Prend en charge: Claude Codex Code(CC)
🥉 75 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "azure-ai-voicelive-py". DefaultAzureCredential 을 사용하여 Azure Voice Live 로 인증하려면 어떻게 하나요?

Résultat attendu:

프로덕션 인증에는 DefaultAzureCredential 을 사용하세요: ```python
from azure.ai.voicelive.aio import connect
from azure.identity.aio import DefaultAzureCredential

async with connect(
endpoint=os.environ['AZURE_COGNITIVE_SERVICES_ENDPOINT'],
credential=DefaultAzureCredential(),
model='gpt-4o-realtime-preview',
credential_scopes=['https://cognitiveservices.azure.com/.default']
) as conn:
# 연결 사용
```

Utilisation de "azure-ai-voicelive-py". Azure Voice Live 에서 사용할 수 있는 음성 옵션은 무엇인가요?

Résultat attendu:

Azure Voice Live 는 다음 내장 음성을 지원합니다: alloy (중립적), echo (따뜻한), shimmer (전문적인), sage (권위있는), coral (친근한), ash (깊은), ballad (표현적인), verse (스토리텔링). Azure 는 또한 AzureStandardVoice, AzureCustomVoice, AzurePersonalVoice 모델을 제공합니다.

Utilisation de "azure-ai-voicelive-py". 음성 대화에서 중단을 어떻게 처리하나요?

Résultat attendu:

speech_started 이벤트를 수신하고 현재 응답을 취소하여 중단을 처리하세요: ```python
async for event in conn:
if event.type == 'input_audio_buffer.speech_started':
await conn.response.cancel()
await conn.output_audio_buffer.clear()
```

Audit de sécurité

Sûr
v1 • 2/24/2026

Documentation skill providing reference material for Azure AI Voice Live SDK. Static findings are false positives - scanner detected markdown code fences as shell commands, placeholder URLs as network calls, and example code patterns as security issues. No executable code or malicious behavior present.

1
Fichiers analysés
315
Lignes analysées
0
résultats
1
Total des audits
Aucun problème de sécurité trouvé
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
100
Sécurité
100
Conformité aux spécifications

Ce que vous pouvez construire

음성 어시스턴트 개발

Azure AI 서비스를 사용하여 사용자 음성에 실시간으로 응답하는 대화형 음성 어시스턴트 구축

고객 서비스 봇

자연스러운 음성 상호작용이 가능한 자동화된 고객 지원을 위한 대화형 AI 에이전트 생성

접근성 도구

접근성 애플리케이션을 위한 음성 제어 인터페이스 개발

Essayez ces prompts

기본 음성 연결
Python 을 사용하여 DefaultAzureCredential 로 기본 Azure AI Voice Live 연결을 설정하는 방법을 보여주세요
오디오 스트리밍 설정
마이크에서 Azure Voice Live 로 오디오를 스트리밍하고 응답을 재생하는 Python 예제를 만들어주세요
세션 구성
음성 어시스턴트를 위해 음성 선택, 모달리티, 교대 감지와 같은 세션 매개변수를 어떻게 구성하나요?
이벤트 처리 패턴
오디오 텍스트, 함수 호출을 처리하고 중단을 다루는 Azure Voice Live 에 대한 완전한 이벤트 처리 패턴을 작성해주세요

Bonnes pratiques

  • 프로덕션 환경에서는 API 키 대신 DefaultAzureCredential 사용
  • 사용 사례에 따라 적절한 교대 감지 설정 구성 (server_vad 또는 semantic_vad)
  • 안정적인 애플리케이션을 위해 연결 오류를 처리하고 재연결 로직 구현
  • 하드웨어 기능과 일치하는 적절한 오디오 형식 사용 (기본값 24kHz 에서 PCM16)

Éviter

  • 소스 코드에 API 키를 하드코딩하지 않기 - 환경 변수 또는 Azure Key Vault 사용
  • 연결 끊김 및 API 오류에 대한 오류 처리를 생략하지 않기
  • 이벤트 루프에서 블로킹 작업 피하기 - async/await 를 적절히 사용
  • 지속적인 오디오 스트리밍을 가정하지 않기 - 적절한 버퍼링 및 흐름 제어 구현

Foire aux questions

Azure AI Voice Live SDK 란 무엇인가요?
Azure AI Voice Live SDK 는 실시간 양방향 음성 AI 애플리케이션을 구축하기 위한 Python 라이브러리입니다. 음성 상호작용을 위해 Azure AI 서비스와의 오디오 스트리밍을 가능하게 합니다.
Azure 구독이 필요한가요?
예, Speech 서비스가 활성화된 Azure Cognitive Services 구독이 필요합니다. 엔드포인트 URL 과 적절한 인증 자격 증명이 필요합니다.
어떤 오디오 형식이 지원되나요?
Azure Voice Live 는 PCM16(기본값 24kHz), PCM16-8000hz, PCM16-16000hz, g711_ulaw, g711_alaw 형식을 지원합니다.
교대 감지는 어떻게 작동하나요?
교대 감지는 음성 활동 감지 (VAD) 를 사용하여 사용자가 말하기를 멈춘 시점을 감지합니다. server_vad(기본값), azure_semantic_vad(더 스마트함) 를 사용하거나 수동 교대 제어를 위해 비활성화할 수 있습니다.
맞춤 음성을 사용할 수 있나요?
예, Azure 는 alloy, echo, shimmer 와 같은 내장 음성 외에도 AzureCustomVoice 및 AzurePersonalVoice 모델을 통해 맞춤 음성을 지원합니다.
프로덕션 사용에 적합한가요?
예, Azure AI Voice Live 는 보안 인증을 위해 DefaultAzureCredential 을 사용하고 안정적인 작동을 위해 적절한 오류 처리를 구현하도록 설계되었습니다.

Détails du développeur

Structure de fichiers

📄 SKILL.md