스킬 Azure AI VoiceLive SDK for Java

📦

Azure AI VoiceLive SDK for Java

Name: Azure AI VoiceLive SDK for Java
Author: sickn33

안전

Azure AI 로 실시간 음성 앱 구축하기

개발자는 Java 애플리케이션에 실시간 양방향 음성 대화를 통합할 방법이 필요합니다. 이 스킬은 WebSocket 스트리밍을 사용하여 Azure AI VoiceLive SDK 로 음성 AI 를 구현하는 완벽한 코드 예제와 모범 사례를 제공합니다.

지원: Claude Codex Code(CC)

⚠️ 68 나쁨

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"Azure AI VoiceLive SDK for Java" 사용 중입니다. DefaultAzureCredential 로 VoiceLive 클라이언트 생성

예상 결과:

VoiceLiveAsyncClient client = new VoiceLiveClientBuilder()
.endpoint(System.getenv("AZURE_VOICELIVE_ENDPOINT"))
.credential(new DefaultAzureCredentialBuilder().build())
.buildAsyncClient();

"Azure AI VoiceLive SDK for Java" 사용 중입니다. 자연스러운 대화를 위한 턴 감지 구성

예상 결과:

ServerVadTurnDetection turnDetection = new ServerVadTurnDetection()
.setThreshold(0.5)
.setPrefixPaddingMs(300)
.setSilenceDurationMs(500)
.setInterruptResponse(true)
.setAutoTruncate(true);

보안 감사

안전

v1 • 2/24/2026

Prompt-only documentation skill containing code examples for Azure AI VoiceLive SDK. Static analysis found 0 files scanned with 0 potential security issues. Risk score: 0/100. No suspicious patterns detected. Skill provides legitimate documentation for Microsoft Azure service with no executable code.

스캔된 파일

분석된 줄 수

발견 사항

총 감사 수

보안 문제를 찾지 못했습니다

감사자: claude

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

사양 준수

만들 수 있는 것

고객 서비스 음성 봇

자연어 음성을 사용하여 실시간으로 문의를 처리하는 고객 지원을 위한 인터랙티브 음성 어시스턴트 구축

접근성 도구 개발

텍스트 기반 인터페이스보다 음성 상호작용을 선호하는 사용자를 위한 음성 지원 애플리케이션 생성

IoT 음성 제어 인터페이스

저지연 양방향 통신으로 IoT 기기에 대한 음성 제어 구현

이 프롬프트를 사용해 보세요

기본 음성 클라이언트 설정

Azure AI VoiceLive SDK 를 사용하여 API 키 인증으로 Java 에서 기본 VoiceLiveAsyncClient 를 설정하는 방법을 보여주세요.

음성 세션 구성

자연스러운 대화 흐름을 위해 턴 감지, 음성 선택 및 오디오 형식 설정으로 VoiceLiveSessionOptions 를 구성하려면 어떻게 해야 하나요?

음성 이벤트 처리

음성 시작/중지 감지, 오디오 델타 스트리밍 및 VoiceLive 세션의 오류 처리를 포함한 음성 이벤트를 처리하는 Java 코드를 작성하세요.

함수 호출 구현

VoiceLive 와 함수 호출을 통합하여 AI 어시스턴트가 대화 중 날씨 조회와 같은 실제 작업을 실행할 수 있도록 하는 방법을 보여주세요.

모범 사례

Azure 관리형 ID 를 활용하기 위해 프로덕션 배포 시 API 키 대신 DefaultAzureCredential 사용
자연스러운 대화 흐름을 위해 사용 사례에 맞는 적절한 임계값 및 무음 지속 시간으로 ServerVadTurnDetection 구성
프로덕션 음성 애플리케이션을 위해 항상 적절한 오류 처리 및 재연결 로직 구현

피하기

API 키를 소스 코드에 하드코딩하지 마세요 - 대신 환경 변수 또는 Azure Key Vault 사용
반응형 스트림에서 블로킹 호출을 피하세요 - 전체적으로 논블로킹 패턴 사용
오디오 형식 검증을 건너뛰지 마세요 - 입력이 24kHz 16 비트 PCM 요구 사항과 일치하는지 확인

자주 묻는 질문

Azure AI VoiceLive 에 필요한 오디오 형식은 무엇인가요?

Azure AI VoiceLive 는 24kHz 샘플 레이트, 16 비트 PCM, 모노 채널, 부호화된 PCM 리틀 엔디안 형식이 필요합니다.

Azure AI VoiceLive 에 어떻게 인증하나요?

API 키와 함께 AzureKeyCredential 을 사용하거나 프로덕션에서 관리형 ID 지원을 위해 DefaultAzureCredential 을 사용할 수 있습니다.

Azure AI VoiceLive 에서 어떤 음성을 사용할 수 있나요?

SDK 는 OpenAI 음성 (ALLOY, ASH, BALLAD, CORAL, ECHO, SAGE, SHIMMER, VERSE) 과 Azure 음성 (Standard, Custom, Personal 음성 포함) 을 지원합니다.

VoiceLive 와 함께 함수 호출을 사용할 수 있나요?

예, VoiceLiveFunctionDefinition 을 사용하여 함수를 정의하고 VoiceLiveSessionOptions 에서 setTools() 를 통해 전달할 수 있습니다.

VoiceLive 에서 턴 감지는 어떻게 작동하나요?

ServerVadTurnDetection 은 음성 활동 감지를 사용하여 사용자가 말하기 시작하고 중지하는 시점을 자동으로 감지하며, 구성 가능한 임계값과 무음 지속 시간을 사용합니다.

TEXT 와 AUDIO 모달리티의 차이점은 무엇인가요?

TEXT 모달리티는 텍스트를 송수신하고, AUDIO 모달리티는 오디오를 송수신합니다. Arrays.asList(InteractionModality.TEXT, InteractionModality.AUDIO) 를 사용하여 둘을 결합할 수 있습니다.

개발자 세부 정보

작성자

sickn33

라이선스

MIT

리포지토리

https://github.com/sickn33/antigravity-awesome_skills/tree/main/skills/azure-ai-voicelive-java

참조

main

파일 구조

📄 SKILL.md