스킬 tts-skill
🔊

tts-skill

낮은 위험 ⚙️ 외부 명령어📁 파일 시스템 액세스🌐 네트워크 접근🔑 환경 변수

Convertir du texte en parole naturelle avec plusieurs moteurs TTS

La conversion de texte en parole manuelle nécessite une configuration complexe et des clés API. Cette compétence fournit une interface unifiée à plusieurs moteurs TTS, y compris le clonage de voix local et les services cloud.

지원: Claude Codex Code(CC)
📊 71 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"tts-skill" 사용 중입니다. Convert this announcement to speech

예상 결과:

Starting engine: qwen3-tts ...
Using voice: 赵信
Text: Welcome to our new product launch...
Generating audio...
SUCCESS: Generated: output/20260129_143000_Welcome.wav

Performance Stats:
Total time: 12.34 seconds
Characters: 45
Avg per char: 0.274 seconds

"tts-skill" 사용 중입니다. List all available voices

예상 결과:

Available voices:

Local voices (Qwen3-TTS):
- 赵信 (../assets/赵信.wav)
- 寒冰射手 (../assets/寒冰射手.wav)
- Lei (../assets/Lei.wav)
- 布里茨 (../assets/布里茨.wav)

Online voices (VoiceCraft):
- xiaoxiao -> 晓晓 (温柔女声)
- yunxi -> 云希 (清朗男声)
- xiaoyi -> 晓伊 (甜美女声)

OpenAI voices:
- alloy -> 中性平衡
- nova -> 温暖女性
- echo -> 深沉磁性

보안 감사

낮은 위험
v1 • 1/29/2026

Legitimate multi-engine TTS skill with standard software practices. Static scanner flagged patterns common in legitimate applications: subprocess calls for engine invocation, network requests to cloud TTS services, and environment variable access for API credentials. All findings evaluated as false positives - no malicious intent detected.

24
스캔된 파일
3,078
분석된 줄 수
4
발견 사항
1
총 감사 수
감사자: claude

품질 점수

50
아키텍처
100
유지보수성
87
콘텐츠
30
커뮤니티
90
보안
83
사양 준수

만들 수 있는 것

Créateurs de contenu générant des voix off

Convertir des scripts écrits en parole naturelle pour des vidéos, podcasts ou présentations en utilisant le clonage de voix avec des échantillons audio de référence.

Accessibilité et assistance à la lecture

Transformer des articles, documents ou livres en format audio pour une consommation mains libres par les personnes atteintes de troubles visuels ou celles qui préfèrent écouter.

Développeurs intégrant le TTS dans leurs flux de travail

Ajouter des capacités de texte vers parole dans les pipelines d'automatisation, les chatbots ou les applications en utilisant une interface CLI unifiée.

이 프롬프트를 사용해 보세요

Conversion de texte en parole de base
Utilisez tts-skill pour convertir ce texte en parole : "{your text here}"
Clonage de voix avec référence personnalisée
Utilisez tts-skill avec le moteur qwen3-tts et la voix "寒冰射手" pour convertir ce texte : "{your text}"
TTS cloud avec une voix spécifique
Utilisez tts-skill avec edge-tts et la voix "xiaoxiao" pour convertir : "{your text}"
Conversion basée sur des fichiers avec sortie personnalisée
Utilisez tts-skill pour convertir le texte du fichier "input/text.txt" en utilisant qwen3-tts avec la voix "赵信" et enregistrez dans "output/custom.wav"

모범 사례

  • Préparez les fichiers audio de référence dans le répertoire assets pour le clonage de voix avec des fichiers .txt correspondants
  • Configurez les clés API dans les fichiers de configuration du moteur avant d'utiliser les services TTS cloud
  • Utilisez la commande --list-voices pour explorer les voix disponibles avant de générer de l'audio
  • Testez avec du texte court d'abord pour vérifier la voix et la qualité avant de traiter du contenu plus long

피하기

  • N'utilisez pas le clonage de voix sans fichier audio de référence approprié et des fichiers de transcript dans le répertoire assets
  • N'essayez pas d'utiliser les moteurs TTS cloud sans clés API valides configurées
  • Ne sautez pas la configuration de l'environnement pour Qwen3-TTS - il nécessite une version spécifique de Python et des dépendances

자주 묻는 질문

Quels moteurs TTS sont pris en charge ?
La compétence prend en charge trois moteurs : Qwen3-TTS (clonage de voix local), VoiceCraft Edge TTS (en ligne) et OpenAI TTS (API cloud). Chacun offre différentes options de voix et niveaux de qualité.
Comment fonctionne le clonage de voix ?
Placez les fichiers audio de référence (.mp3, .wav) dans le répertoire assets avec des fichiers .txt correspondants contenant le transcript. Utilisez le nom de la voix comme argument --voice.
Dois-je utiliser des clés API ?
Qwen3-TTS et Edge TTS fonctionnent sans clés API. OpenAI TTS nécessite une clé API OpenAI configurée dans le fichier openai-tts.config.
Quels formats audio sont pris en charge ?
Les formats de sortie varient selon le moteur : Qwen3-TTS produit des fichiers WAV, OpenAI TTS produit des MP3 et Edge TTS prend en charge plusieurs formats configurés dans les paramètres.
Puis-je utiliser cette compétence à des fins commerciales ?
Consultez les conditions d'utilisation de chaque moteur. Qwen3-TTS et la compétence elle-même sont sous licence MIT. L'utilisation d'OpenAI TTS est soumise aux conditions d'utilisation d'OpenAI.
Comment installer l'environnement Qwen3-TTS ?
Exécutez la compétence avec l'indicateur --install ou appelez install_qwen3_environment(). Cela utilise micromamba pour créer un environnement Python 3.12 et installer les packages nécessaires.

개발자 세부 정보

작성자

tabortao

라이선스

MIT

참조

master