speech-to-text
使用 Whisper AI 進行音訊轉文字
使用最先進的 Whisper 模型將錄音轉換為準確的文字逐字稿。非常適合轉錄會議、播客、語音備忘錄,以及自動生成影片字幕。
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "speech-to-text". Transcribe the meeting recording at https://files.example.com/team-meeting.mp3
النتيجة المتوقعة:
會議完整逐字稿文字,包含說話者識別與偵測的語言
استخدام "speech-to-text". Transcribe https://audio.example.com/interview.mp3 with timestamps
النتيجة المتوقعة:
JSON 逐字稿,包含完整���字、帶時間戳記的片段與偵測的語言代碼
استخدام "speech-to-text". Translate the French audio at https://files.example.com/french-speech.mp3 to English
النتيجة المتوقعة:
法語音訊內容的英文翻譯
التدقيق الأمني
آمنAll 37 static analysis findings are false positives from markdown code examples in documentation. The skill contains only documentation (SKILL.md) with bash command examples demonstrating inference.sh CLI usage. No executable code, no prompt injection attempts, and no malicious intent detected. The allowed-tools directive properly restricts Bash tool to infsh commands only.
عوامل الخطر
⚙️ الأوامر الخارجية (20)
درجة الجودة
ماذا يمكنك بناءه
會議轉錄
將錄製的會議音訊轉換為可搜尋的文字,以便記錄與分享
播客製作
為播客集數產生節目筆記與逐字稿,以提升無障礙性
影片字幕製作
透過轉錄帶時間戳記的音軌來建立準確的影片字幕
جرّب هذه الموجهات
Transcribe the audio file at https://example.com/meeting.mp3 to text
Transcribe https://example.com/podcast.mp3 and include timestamps for each segment
Translate the Spanish audio at https://example.com/spanish.mp3 to English text
Extract audio from https://example.com/video.mp4, transcribe it with timestamps, and prepare it for adding captions
أفضل الممارسات
- 使用高品質錄音以獲得最佳轉錄準確度
- 製作字幕或需要參考特定時間點時包含時間戳記
- 追求速度時選擇 Fast Whisper 模型,追求最高準確度時選擇 Whisper V3 Large
- 提供 MP3、WAV 或 M4A 等常見格式的音訊檔案以獲得最佳相容性
تجنب
- 請勿嘗試轉錄即時音訊串流——此工具需要檔案 URL
- 避免在未考慮後續處理的情況下使用極低品質或雜音過大的錄音
- 請勿在嘗試轉錄前忘記安裝 inference.sh CLI
- 避免在未經適當授權的情況下要求轉錄有版權的內容