스킬 azure-ai-voicelive-py

🎙️

azure-ai-voicelive-py

Name: azure-ai-voicelive-py
Author: sickn33

안전

Azure 를 활용한 실시간 음성 AI 앱 구축

Azure AI Voice Live SDK 를 사용하여 실시간 양방향 오디오 스트리밍이 가능한 대화형 음성 AI 애플리케이션을 만드세요. 이 스킬은 프로덕션 레벨 음성 어시스턴트 구축을 위한 완전한 참조 문서를 제공합니다.

지원: Claude Codex Code(CC)

📊 71 적절함

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"azure-ai-voicelive-py" 사용 중입니다. DefaultAzureCredential 을 사용하여 Azure Voice Live 로 인증하려면 어떻게 하나요?

예상 결과:

프로덕션 인증에는 DefaultAzureCredential 을 사용하세요: ```python
from azure.ai.voicelive.aio import connect
from azure.identity.aio import DefaultAzureCredential

async with connect(
endpoint=os.environ['AZURE_COGNITIVE_SERVICES_ENDPOINT'],
credential=DefaultAzureCredential(),
model='gpt-4o-realtime-preview',
credential_scopes=['https://cognitiveservices.azure.com/.default']
) as conn:
# 연결 사용
```

"azure-ai-voicelive-py" 사용 중입니다. Azure Voice Live 에서 사용할 수 있는 음성 옵션은 무엇인가요?

예상 결과:

Azure Voice Live 는 다음 내장 음성을 지원합니다: alloy (중립적), echo (따뜻한), shimmer (전문적인), sage (권위있는), coral (친근한), ash (깊은), ballad (표현적인), verse (스토리텔링). Azure 는 또한 AzureStandardVoice, AzureCustomVoice, AzurePersonalVoice 모델을 제공합니다.

"azure-ai-voicelive-py" 사용 중입니다. 음성 대화에서 중단을 어떻게 처리하나요?

예상 결과:

speech_started 이벤트를 수신하고 현재 응답을 취소하여 중단을 처리하세요: ```python
async for event in conn:
if event.type == 'input_audio_buffer.speech_started':
await conn.response.cancel()
await conn.output_audio_buffer.clear()
```

보안 감사

안전

v1 • 2/24/2026

Documentation skill providing reference material for Azure AI Voice Live SDK. Static findings are false positives - scanner detected markdown code fences as shell commands, placeholder URLs as network calls, and example code patterns as security issues. No executable code or malicious behavior present.

스캔된 파일

315

분석된 줄 수

발견 사항

총 감사 수

보안 문제를 찾지 못했습니다

감사자: claude

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

100

사양 준수

만들 수 있는 것

음성 어시스턴트 개발

Azure AI 서비스를 사용하여 사용자 음성에 실시간으로 응답하는 대화형 음성 어시스턴트 구축

고객 서비스 봇

자연스러운 음성 상호작용이 가능한 자동화된 고객 지원을 위한 대화형 AI 에이전트 생성

접근성 도구

접근성 애플리케이션을 위한 음성 제어 인터페이스 개발

이 프롬프트를 사용해 보세요

기본 음성 연결

Python 을 사용하여 DefaultAzureCredential 로 기본 Azure AI Voice Live 연결을 설정하는 방법을 보여주세요

오디오 스트리밍 설정

마이크에서 Azure Voice Live 로 오디오를 스트리밍하고 응답을 재생하는 Python 예제를 만들어주세요

세션 구성

음성 어시스턴트를 위해 음성 선택, 모달리티, 교대 감지와 같은 세션 매개변수를 어떻게 구성하나요?

이벤트 처리 패턴

오디오 텍스트, 함수 호출을 처리하고 중단을 다루는 Azure Voice Live 에 대한 완전한 이벤트 처리 패턴을 작성해주세요

모범 사례

프로덕션 환경에서는 API 키 대신 DefaultAzureCredential 사용
사용 사례에 따라 적절한 교대 감지 설정 구성 (server_vad 또는 semantic_vad)
안정적인 애플리케이션을 위해 연결 오류를 처리하고 재연결 로직 구현
하드웨어 기능과 일치하는 적절한 오디오 형식 사용 (기본값 24kHz 에서 PCM16)

피하기

소스 코드에 API 키를 하드코딩하지 않기 - 환경 변수 또는 Azure Key Vault 사용
연결 끊김 및 API 오류에 대한 오류 처리를 생략하지 않기
이벤트 루프에서 블로킹 작업 피하기 - async/await 를 적절히 사용
지속적인 오디오 스트리밍을 가정하지 않기 - 적절한 버퍼링 및 흐름 제어 구현

자주 묻는 질문

Azure AI Voice Live SDK 란 무엇인가요?

Azure AI Voice Live SDK 는 실시간 양방향 음성 AI 애플리케이션을 구축하기 위한 Python 라이브러리입니다. 음성 상호작용을 위해 Azure AI 서비스와의 오디오 스트리밍을 가능하게 합니다.

Azure 구독이 필요한가요?

예, Speech 서비스가 활성화된 Azure Cognitive Services 구독이 필요합니다. 엔드포인트 URL 과 적절한 인증 자격 증명이 필요합니다.

어떤 오디오 형식이 지원되나요?

Azure Voice Live 는 PCM16(기본값 24kHz), PCM16-8000hz, PCM16-16000hz, g711_ulaw, g711_alaw 형식을 지원합니다.

교대 감지는 어떻게 작동하나요?

교대 감지는 음성 활동 감지 (VAD) 를 사용하여 사용자가 말하기를 멈춘 시점을 감지합니다. server_vad(기본값), azure_semantic_vad(더 스마트함) 를 사용하거나 수동 교대 제어를 위해 비활성화할 수 있습니다.

맞춤 음성을 사용할 수 있나요?

예, Azure 는 alloy, echo, shimmer 와 같은 내장 음성 외에도 AzureCustomVoice 및 AzurePersonalVoice 모델을 통해 맞춤 음성을 지원합니다.

프로덕션 사용에 적합한가요?

예, Azure AI Voice Live 는 보안 인증을 위해 DefaultAzureCredential 을 사용하고 안정적인 작동을 위해 적절한 오류 처리를 구현하도록 설계되었습니다.

개발자 세부 정보

작성자

sickn33

라이선스

MIT

리포지토리

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-voicelive-py

참조

main

파일 구조

📄 SKILL.md