🔊

tts-skill

مخاطر منخفضة ⚙️ الأوامر الخارجية📁 الوصول إلى نظام الملفات🌐 الوصول إلى الشبكة🔑 متغيرات البيئة

Convierte texto a voz natural con múltiples motores TTS

Convertir texto a voz manualmente requiere configuración compleja y claves API. Esta habilidad proporciona una interfaz unificada para múltiples motores TTS incluyendo clonación de voz local y servicios en la nube.

يدعم: Claude Codex Code(CC)
📊 70 كافٍ
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "tts-skill". Convert this announcement to speech

النتيجة المتوقعة:

Starting engine: qwen3-tts ...
Using voice: 赵信
Text: Welcome to our new product launch...
Generating audio...
SUCCESS: Generated: output/20260129_143000_Welcome.wav

Performance Stats:
Total time: 12.34 seconds
Characters: 45
Avg per char: 0.274 seconds

استخدام "tts-skill". List all available voices

النتيجة المتوقعة:

Available voices:

Local voices (Qwen3-TTS):
- 赵信 (../assets/赵信.wav)
- 寒冰射手 (../assets/寒冰射手.wav)
- Lei (../assets/Lei.wav)
- 布里茨 (../assets/布里茨.wav)

Online voices (VoiceCraft):
- xiaoxiao -> 晓晓 (温柔女声)
- yunxi -> 云希 (清朗男声)
- xiaoyi -> 晓伊 (甜美女声)

OpenAI voices:
- alloy -> 中性平衡
- nova -> 温暖女性
- echo -> 深沉磁性

التدقيق الأمني

مخاطر منخفضة
v1 • 1/29/2026

Legitimate multi-engine TTS skill with standard software practices. Static scanner flagged patterns common in legitimate applications: subprocess calls for engine invocation, network requests to cloud TTS services, and environment variable access for API credentials. All findings evaluated as false positives - no malicious intent detected.

24
الملفات التي تم فحصها
3,078
الأسطر التي تم تحليلها
4
النتائج
1
إجمالي عمليات التدقيق

عوامل الخطر

تم تدقيقه بواسطة: claude

درجة الجودة

50
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
24
المجتمع
90
الأمان
83
الامتثال للمواصفات

ماذا يمكنك بناءه

Creadores de contenido generando voiceovers

Convierte guiones escritos a voz natural para videos, podcasts o presentaciones usando clonación de voz con muestras de audio de referencia.

Accesibilidad y asistencia de lectura

Transforma artículos, documentos o libros en formato de audio para consumo sin manos por usuarios con discapacidades visuales o aquellos que prefieren escuchar.

Desintegradores integrando TTS en flujos de trabajo

Añade capacidades de texto a voz a automatizaciones, chatbots o aplicaciones usando una interfaz CLI unificada.

جرّب هذه الموجهات

Conversión básica de texto a voz
Use tts-skill para convertir este texto a voz: "{your text here}"
Clonación de voz con referencia personalizada
Use tts-skill con motor qwen3-tts y voz "寒冰射手" para convertir este texto: "{your text}"
TTS en la nube con voz específica
Use tts-skill con edge-tts y voz "xiaoxiao" para convertir: "{your text}"
Conversión basada en archivo con salida personalizada
Use tts-skill para convertir el texto del archivo "input/text.txt" usando qwen3-tts con voz "赵信" y guardar en "output/custom.wav"

أفضل الممارسات

  • Prepara archivos de audio de referencia en el directorio assets para clonación de voz con archivos .txt de transcripción coincidentes
  • Configura las claves API en los archivos de configuración del motor antes de usar servicios TTS en la nube
  • Usa el comando --list-voices para explorar las voces disponibles antes de generar audio
  • Prueba primero con texto corto para verificar la voz y calidad antes de procesar contenido más largo

تجنب

  • No uses clonación de voz sin archivos de audio de referencia y transcripción apropiados en el directorio assets
  • No intentes usar motores TTS en la nube sin claves API válidas configuradas
  • No omitas la configuración del entorno para Qwen3-TTS - requiere versión específica de Python y dependencias

الأسئلة المتكررة

¿Qué motores TTS están soportados?
El motor soporta tres motores: Qwen3-TTS (clonación de voz local), VoiceCraft Edge TTS (en línea) y OpenAI TTS (API en la nube). Cada uno ofrece diferentes opciones de voz y niveles de calidad.
¿Cómo funciona la clonación de voz?
Coloca archivos de audio de referencia (.mp3, .wav) en el directorio assets con archivos .txt coincidentes que contengan la transcripción. Usa el nombre de la voz como argumento --voice.
¿Necesito claves API?
Qwen3-TTS y Edge TTS funcionan sin claves API. OpenAI TTS requiere una clave API de OpenAI configurada en el archivo openai-tts.config.
¿Qué formatos de audio están soportados?
Los formatos de salida varían según el motor: Qwen3-TTS produce archivos WAV, OpenAI TTS produce MP3, y Edge TTS soporta múltiples formatos configurados en ajustes.
¿Puedo usar esta habilidad para propósitos comerciales?
Revisa los términos de licencia de cada motor. Qwen3-TTS y la habilidad misma están licenciados bajo MIT. El uso de OpenAI TTS está sujeto a los términos de servicio de OpenAI.
¿Cómo instalo el entorno Qwen3-TTS?
Ejecuta la habilidad con bandera --install o llama a install_qwen3_environment(). Esto usa micromamba para crear un entorno Python 3.12 e instalar los paquetes requeridos.

تفاصيل المطور

المؤلف

tabortao

الترخيص

MIT

مرجع

master