技能 tts-skill
🔊

tts-skill

低風險 ⚙️ 外部命令📁 檔案系統存取🌐 網路存取🔑 環境變數

تحويل النص إلى كلام طبيعي باستخدام محركات متعددة للتحدث

تحويل النص إلى كلام يدوياً يتطلب إعداداً معقداً ومفاتيح API. يوفر هذا المهارة واجهة موحدة لمحركات متعددة للتحدث، بما في ذلك استنساخ الصوت محلياً وخدمات السحابة.

支援: Claude Codex Code(CC)
📊 71 充足
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「tts-skill」。 Convert this announcement to speech

預期結果:

Starting engine: qwen3-tts ...
Using voice: 赵信
Text: Welcome to our new product launch...
Generating audio...
SUCCESS: Generated: output/20260129_143000_Welcome.wav

Performance Stats:
Total time: 12.34 seconds
Characters: 45
Avg per char: 0.274 seconds

正在使用「tts-skill」。 List all available voices

預期結果:

Available voices:

Local voices (Qwen3-TTS):
- 赵信 (../assets/赵信.wav)
- 寒冰射手 (../assets/寒冰射手.wav)
- Lei (../assets/Lei.wav)
- 布里茨 (../assets/布里茨.wav)

Online voices (VoiceCraft):
- xiaoxiao -> 晓晓 (温柔女声)
- yunxi -> 云希 (清朗男声)
- xiaoyi -> 晓伊 (甜美女声)

OpenAI voices:
- alloy -> 中性平衡
- nova -> 温暖女性
- echo -> 深沉磁性

安全審計

低風險
v1 • 1/29/2026

Legitimate multi-engine TTS skill with standard software practices. Static scanner flagged patterns common in legitimate applications: subprocess calls for engine invocation, network requests to cloud TTS services, and environment variable access for API credentials. All findings evaluated as false positives - no malicious intent detected.

24
已掃描檔案
3,078
分析行數
4
發現項
1
審計總數
審計者: claude

品質評分

50
架構
100
可維護性
87
內容
30
社群
90
安全
83
規範符合性

你能建構什麼

منشئو المحتوى الذين يقومون بتوليد صوتيات التفصيل

تحويل النصوص المكتوبة إلى كلام طبيعي للفيديوهات، podcasts، أو العروض التقديمية باستخدام استنساخ الصوت مع عينات صوت مرجعية.

إمكانية الوصول والتحكم الصوتي

تحويل المقالات، الوثائق، أو الكتب إلى تنسيق صوتي للقراءة بدون استخدام اليدين من قبل المستخدمين الذين يعانون من ضعف البصر أو الذين يفضلون الاستماع.

المطورون الذين يدمجون TTS في سير العمل

إضافة قدرات تحويل النص إلى كلام إلى خطوط الأتمتة، روبوتات الدردشة، أو التطبيقات باستخدام واجهة سطر أوامر موحدة.

試試這些提示

تحويل النص الأساسي إلى كلام
استخدم tts-skill لتحويل هذا النص إلى كلام: "{your text here}"
استنساخ الصوت مع مرجع مخصص
استخدم tts-skill مع محرك qwen3-tts والصوت "寒冰射手" لتحويل هذا النص: "{your text}"
TTS السحابي مع صوت محدد
استخدم tts-skill مع edge-tts والصوت "xiaoxiao" لتحويل: "{your text}"
التحويل القائم على الملف مع مخرج مخصص
استخدم tts-skill لتحويل النص من الملف "input/text.txt" باستخدام qwen3-tts مع الصوت "赵信" وحفظه في "output/custom.wav"

最佳實務

  • جهز ملفات الصوت المرجعية في مجلد الأصول لاستنساخ الصوت مع ملفات .txt مطابقة
  • قم بتكوين مفاتيح API في ملفات إعداد المحرك قبل استخدام خدمات TTS السحابية
  • استخدم أمر --list-voices لاستكشاف الأصوات المتاحة قبل توليد الصوت
  • اختبر مع نص قصير أولاً للتأكد من الصوت والجودة قبل معالجة محتوى أطول

避免

  • لا تستخدم استنساخ الصوت بدون ملف صوت مرجعي مناسب وملفات نصية مطابقة في مجلد الأصول
  • لا تحاول استخدام محركات TTS السحابية بدون مفاتيح API صالحة
  • لا تتخطى إعداد البيئة لـ Qwen3-TTS - فهي تتطلب إصدار Python محدد ومكتبات

常見問題

ما هي محركات TTS المدعومة؟
يدعم المهارة ثلاثة محركات: Qwen3-TTS (استنساخ الصوت المحلي)، VoiceCraft Edge TTS (عبر الإنترنت)، و OpenAI TTS (API السحابي). يوفر كل منها خيارات صوتية وثوابت جودة مختلفة.
كيف يعمل استنساخ الصوت؟
ضع ملفات الصوت المرجعية (.mp3, .wav) في مجلد الأصول مع ملفات .txt تحتوي على النص المسجل. استخدم اسم الصوت كمعامل --voice.
هل أحتاج إلى مفاتيح API؟
يعمل Qwen3-TTS و Edge TTS بدون مفاتيح API. يتطلب OpenAI TTS مفتاح API OpenAI موضع في ملف openai-tts.config.
ما هي صيغ الصوت المدعومة؟
تنوع صيغ المخرجات حسب المحرك: ينتج Qwen3-TTS ملفات WAV، ينتج OpenAI TTS MP3، ويدعم Edge TTS عدة صيغ تم تكوينها في الإعدادات.
هل يمكنني استخدام هذه المهارة للأغراض التجارية؟
تحقق من شروط الترخيص لكل محرك. Qwen3-TTS والمهارة نفسها مرخصة بموجب MIT. يستخدم OpenAI TTS وفقًا لشروط الخدمة الخاصة بـ OpenAI.
كيف أثبت بيئة Qwen3-TTS؟
قم بتشغيل المهارة مع علامة --install أو استدعِ install_qwen3_environment(). هذا يستخدم micromamba لإنشاء بيئة Python 3.12 وتثبيت الحزم المطلوبة.