技能 elevenlabs-tts
🔊

elevenlabs-tts

安全 ⚙️ 外部命令🌐 网络访问

使用 ElevenLabs TTS 生成專業語音旁白

使用 22+ 種優質 AI 聲音在 32 種語言中創造自然流暢的語音。非常適合語音旁白、有聲書、播客和無障礙應用,無需昂貴的錄音設備。

支持: Claude Codex Code(CC)
📊 70 充足
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“elevenlabs-tts”。 Generate speech: "Welcome to our product demo" with voice aria

预期结果:

音訊檔案(MP3,44.1kHz),包含自然流暢的溫暖美國女性聲音,可直接播放或下載

正在使用“elevenlabs-tts”。 Create Spanish narration: "Bienvenidos a nuestra empresa" using eleven_multilingual_v2

预期结果:

高品質西班牙語音訊,具有正統發音和自然語調,適合專業用途

安全审计

安全
v1 • 3/19/2026

Static analyzer incorrectly flagged markdown documentation as security risks. All 52 external_commands findings are markdown code blocks (backticks), not shell execution. All 4 network findings are documentation URLs, not runtime network calls. The 2 high-risk crypto findings are false positives on description text. The skill uses allowed-tools: Bash(infsh *) which is a properly restricted CLI wrapper for the official inference.sh platform. No executable code or security vulnerabilities present.

1
已扫描文件
198
分析行数
2
发现项
1
审计总数

风险因素

审计者: claude

质量评分

38
架构
100
可维护性
87
内容
22
社区
100
安全
91
规范符合性

你能构建什么

內容創作者的語音旁白

為 YouTube 影片、產品演示和社交媒體內容生成專業語音旁白,無需聘請配音演員。

有聲書朗讀

將書面內容轉換為有聲書,使用一致且自然的朗讀風格貫穿多個章節。

多語言電子學習

從單一腳本創建多種語言的課程旁白,實現全球無障礙訪問。

试试这些提示

基本語音生成
Generate speech from this text: "[Your text here]" using a warm female American voice.
專業簡報
Create a professional voiceover for my presentation script using a British male voice with authoritative tone. Text: "[Presentation content]"
多語言內容
Generate speech in Spanish using the multilingual model for this text: "[Spanish text]". Use highest quality settings.
語音 + 影片工作流程
First generate a voiceover with an American female voice for: "[Script]". Then create a talking head video using the generated audio with this portrait image: [image URL].

最佳实践

  • 根據您的使用案例選擇合適的模型:multilingual_v2 追求品質,flash_v2_5 追求速度
  • 調整 stability 和 style 參數以匹配您的內容語氣——較低的 stability 適用於更具表現力的內容
  • 在生成長內容之前先用短樣本預覽,以驗證聲音和設定

避免

  • 請勿用於生成欺騙性內容、深偽影片或在未經同意的情況下模仿真實人物
  • 避免極長的單一請求——分段處理可獲得更好的品質和錯誤處理
  • 在關鍵無障礙應用中不要僅依賴 AI 語音,需有人工審核

常见问题

什麼是 inference.sh CLI?如何安裝?
inference.sh CLI 是訪問 AI 服務的官方命令列介面。請按照 inference.sh 文件中的說明進行安裝。在使用此技能之前,請執行 'infsh login' 進行身份驗證。
我應該選擇哪個 ElevenLabs 模型?
需要最高品質和多語言支援時使用 eleven_multilingual_v2,在速度和品質之間取得平衡時使用 eleven_turbo_v2_5,需要超低延遲即時應用時使用 eleven_flash_v2_5。
如何控制聲音特性?
使用 stability 參數(0-1)控制一致性與表現力之間的平衡,similarity_boost 來匹配原始聲音特徵,style 來誇張化聲音風格。較低的 stability 會產生更具表現力的輸出。
支援哪些音訊格式?
輸出格式包括各種位元率(預設 128kbps,高品質 192kbps)的 MP3,以及從 16kHz 到 44.1kHz 取樣率的原始 PCM。請根據您的品質和檔案大小需求進行選擇。
我可以在多種語言中使用此技能嗎?
可以,eleven_multilingual_v2 模型支援 32 種語言,包括英語、西班牙語、法語、德語、義大利語、葡萄牙語、中文、日語、韓語、阿拉伯語、印地語和俄語,具有母語水準的發音。
如何將語音旁白與影片生成結合?
首先使用此技能生成語音旁白音訊,然後使用回應中的音訊 URL 作為輸入,傳送給像 bytedance/omnihuman-1-5 這樣的影片生成技能來製作 talking head 影片。

开发者详情

文件结构

📄 SKILL.md