스킬 speech-to-text
🎙️

speech-to-text

안전 ⚙️ 외부 명령어🌐 네트워크 접근

Transcribe audio con Whisper AI

Convierte grabaciones de audio en transcripciones de texto precisas utilizando los modelos Whisper de última generación. Perfecto para transcribir reuniones, podcasts, notas de voz y generar subtítulos de videos automáticamente.

지원: Claude Codex Code(CC)
📊 69 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"speech-to-text" 사용 중입니다. Transcribe la grabación de la reunión en https://files.example.com/team-meeting.mp3

예상 결과:

Texto completo de la transcripción de la reunión con identificación de hablantes e idioma detectado

"speech-to-text" 사용 중입니다. Transcribe https://audio.example.com/interview.mp3 con marcas de tiempo

예상 결과:

Transcripción JSON que contiene texto completo, segmentos con marcas de tiempo y código de idioma detectado

"speech-to-text" 사용 중입니다. Traduce el audio en francés de https://files.example.com/french-speech.mp3 al inglés

예상 결과:

Traducción al inglés del contenido de audio en francés

보안 감사

안전
v1 • 3/1/2026

All 37 static analysis findings are false positives from markdown code examples in documentation. The skill contains only documentation (SKILL.md) with bash command examples demonstrating inference.sh CLI usage. No executable code, no prompt injection attempts, and no malicious intent detected. The allowed-tools directive properly restricts Bash tool to infsh commands only.

1
스캔된 파일
130
분석된 줄 수
2
발견 사항
1
총 감사 수
감사자: claude

품질 점수

38
아키텍처
100
유지보수성
85
콘텐츠
21
커뮤니티
100
보안
91
사양 준수

만들 수 있는 것

Transcripción de reuniones

Convierte el audio de reuniones grabadas en texto searchable para documentación y compartir

Producción de podcasts

Genera notas del programa y transcripciones para episodios de podcasts para mejorar la accesibilidad

Subtitulado de videos

Crea subtítulos precisos para videos transcribiendo pistas de audio con marcas de tiempo

이 프롬프트를 사용해 보세요

Transcripción básica
Transcribe el archivo de audio en https://example.com/meeting.mp3 a texto
Con marcas de tiempo
Transcribe https://example.com/podcast.mp3 e incluye marcas de tiempo para cada segmento
Traducir al inglés
Traduce el audio en español de https://example.com/spanish.mp3 a texto en inglés
Flujo de trabajo de subtítulos de video
Extrae el audio de https://example.com/video.mp4, transcríbelo con marcas de tiempo y prepáralo para agregar subtítulos

모범 사례

  • Usa grabaciones de audio de alta calidad para obtener la mejor precisión de transcripción
  • Incluye marcas de tiempo al crear subtítulos o cuando necesites referenciar momentos específicos
  • Elige el modelo Fast Whisper para velocidad, Whisper V3 Large para la mayor precisión
  • Proporciona archivos de audio en formatos comunes como MP3, WAV o M4A para mejor compatibilidad

피하기

  • No intentes transcribir flujos de audio en tiempo real: esta herramienta requiere URLs de archivos
  • Evita usar grabaciones de muy baja calidad o ruidosas sin considerar post-procesamiento
  • No olvides instalar la CLI de inference.sh antes de intentar la transcripción
  • Evita solicitar la transcripción de contenido con derechos de autor sin los permisos adecuados

자주 묻는 질문

¿Qué formatos de audio son compatibles?
La herramienta acepta archivos de audio accesibles mediante URL pública en formatos comunes incluyendo MP3, WAV, M4A y otros compatibles con los modelos Whisper.
¿Qué tan precisa es la transcripción?
Whisper V3 Large proporciona precisión de última generación. Fast Whisper Large V3 ofrece una precisión similar con procesamiento más rápido. Ambos admiten más de 99 idiomas.
¿Necesito instalar algo?
Sí, necesitas instalar la herramienta de línea de comandos inference.sh usando el comando: curl -fsSL https://cli.inference.sh | sh && infsh login
¿Puedo transcribir audio en tiempo real?
No, esta herramienta funciona con archivos de audio pregrabados. La transcripción en tiempo real requiere una solución diferente diseñada para audio en streaming.
¿Cuál es la diferencia entre los dos modelos?
Fast Whisper Large V3 prioriza la velocidad manteniendo la precisión. Whisper V3 Large proporciona la mayor precisión posible pero puede tardar más en procesar.
¿Puedo traducir audio extranjero al inglés?
Sí, usa el parámetro de tarea translate para transcribir y traducir audio en idiomas extranjeros directamente a texto en inglés en un solo paso.

개발자 세부 정보

파일 구조

📄 SKILL.md