🔊

tts-skill

Name: tts-skill
Author: tabortao

Risque faible ⚙️ Commandes externes📁 Accès au système de fichiers🌐 Accès réseau🔑 Variables d’environnement

Convertir du texte en parole naturelle avec plusieurs moteurs TTS

La conversion de texte en parole manuelle nécessite une configuration complexe et des clés API. Cette compétence fournit une interface unifiée à plusieurs moteurs TTS, y compris le clonage de voix local et les services cloud.

Prend en charge: Claude Codex Code(CC)

📊 70 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "tts-skill". Convert this announcement to speech

Résultat attendu:

Starting engine: qwen3-tts ...
Using voice: 赵信
Text: Welcome to our new product launch...
Generating audio...
SUCCESS: Generated: output/20260129_143000_Welcome.wav

Performance Stats:
Total time: 12.34 seconds
Characters: 45
Avg per char: 0.274 seconds

Utilisation de "tts-skill". List all available voices

Résultat attendu:

Available voices:

Local voices (Qwen3-TTS):
- 赵信 (../assets/赵信.wav)
- 寒冰射手 (../assets/寒冰射手.wav)
- Lei (../assets/Lei.wav)
- 布里茨 (../assets/布里茨.wav)

Online voices (VoiceCraft):
- xiaoxiao -> 晓晓 (温柔女声)
- yunxi -> 云希 (清朗男声)
- xiaoyi -> 晓伊 (甜美女声)

OpenAI voices:
- alloy -> 中性平衡
- nova -> 温暖女性
- echo -> 深沉磁性

Audit de sécurité

Risque faible

v1 • 1/29/2026

Legitimate multi-engine TTS skill with standard software practices. Static scanner flagged patterns common in legitimate applications: subprocess calls for engine invocation, network requests to cloud TTS services, and environment variable access for API credentials. All findings evaluated as false positives - no malicious intent detected.

Fichiers analysés

3,078

Lignes analysées

résultats

Total des audits

Facteurs de risque

⚙️ Commandes externes (4)

tts-skill.py:167 tts-skill.py:189 engines/qwen3-tts-cli.py:120 engines/qwen3-tts-cli.py:356

📁 Accès au système de fichiers (2)

engines/qwen3-tts-cli.py:346 engines/openai-tts-cli.py:165

🌐 Accès réseau (2)

engines/openai-tts-cli.py:145 engines/edge-tts-cli.py:147

🔑 Variables d’environnement (2)

engines/openai-tts-cli.py:71 tts-skill.py:169

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Créateurs de contenu générant des voix off

Convertir des scripts écrits en parole naturelle pour des vidéos, podcasts ou présentations en utilisant le clonage de voix avec des échantillons audio de référence.

Accessibilité et assistance à la lecture

Transformer des articles, documents ou livres en format audio pour une consommation mains libres par les personnes atteintes de troubles visuels ou celles qui préfèrent écouter.

Développeurs intégrant le TTS dans leurs flux de travail

Ajouter des capacités de texte vers parole dans les pipelines d'automatisation, les chatbots ou les applications en utilisant une interface CLI unifiée.

Essayez ces prompts

Conversion de texte en parole de base

Utilisez tts-skill pour convertir ce texte en parole : "{your text here}"

Clonage de voix avec référence personnalisée

Utilisez tts-skill avec le moteur qwen3-tts et la voix "寒冰射手" pour convertir ce texte : "{your text}"

TTS cloud avec une voix spécifique

Utilisez tts-skill avec edge-tts et la voix "xiaoxiao" pour convertir : "{your text}"

Conversion basée sur des fichiers avec sortie personnalisée

Utilisez tts-skill pour convertir le texte du fichier "input/text.txt" en utilisant qwen3-tts avec la voix "赵信" et enregistrez dans "output/custom.wav"

Bonnes pratiques

Préparez les fichiers audio de référence dans le répertoire assets pour le clonage de voix avec des fichiers .txt correspondants
Configurez les clés API dans les fichiers de configuration du moteur avant d'utiliser les services TTS cloud
Utilisez la commande --list-voices pour explorer les voix disponibles avant de générer de l'audio
Testez avec du texte court d'abord pour vérifier la voix et la qualité avant de traiter du contenu plus long

Éviter

N'utilisez pas le clonage de voix sans fichier audio de référence approprié et des fichiers de transcript dans le répertoire assets
N'essayez pas d'utiliser les moteurs TTS cloud sans clés API valides configurées
Ne sautez pas la configuration de l'environnement pour Qwen3-TTS - il nécessite une version spécifique de Python et des dépendances

Foire aux questions

Quels moteurs TTS sont pris en charge ?

La compétence prend en charge trois moteurs : Qwen3-TTS (clonage de voix local), VoiceCraft Edge TTS (en ligne) et OpenAI TTS (API cloud). Chacun offre différentes options de voix et niveaux de qualité.

Comment fonctionne le clonage de voix ?

Placez les fichiers audio de référence (.mp3, .wav) dans le répertoire assets avec des fichiers .txt correspondants contenant le transcript. Utilisez le nom de la voix comme argument --voice.

Dois-je utiliser des clés API ?

Qwen3-TTS et Edge TTS fonctionnent sans clés API. OpenAI TTS nécessite une clé API OpenAI configurée dans le fichier openai-tts.config.

Quels formats audio sont pris en charge ?

Les formats de sortie varient selon le moteur : Qwen3-TTS produit des fichiers WAV, OpenAI TTS produit des MP3 et Edge TTS prend en charge plusieurs formats configurés dans les paramètres.

Puis-je utiliser cette compétence à des fins commerciales ?

Consultez les conditions d'utilisation de chaque moteur. Qwen3-TTS et la compétence elle-même sont sous licence MIT. L'utilisation d'OpenAI TTS est soumise aux conditions d'utilisation d'OpenAI.

Comment installer l'environnement Qwen3-TTS ?

Exécutez la compétence avec l'indicateur --install ou appelez install_qwen3_environment(). Cela utilise micromamba pour créer un environnement Python 3.12 et installer les packages nécessaires.