Habilidades audio-transcriber
📝

audio-transcriber

Seguro ⚙️ Comandos externos📁 Acceso al sistema de archivos🌐 Acceso a red

Transcribir Audio a Markdown

Convierte grabaciones de audio en texto buscable y genera notas de reuniones profesionales con resúmenes impulsados por IA usando la integración de Claude o GitHub Copilot.

Soporta: Claude Codex Code(CC)
🥇 83 Oro
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "audio-transcriber". meeting-recording.mp3

Resultado esperado:

# Transcripción de Audio

**Archivo:** meeting-recording.mp3
**Idioma:** en
**Fecha:** 2024-01-15

---

## Transcripción Completa

**[00:00 → 00:15]** Bienvenidos a nuestra reunión de planificación trimestral.

**[00:15 → 00:45]** Hoy discutiremos la hoja de ruta para Q2 y asignaremos tareas...

---

## Acta Generada

**Resumen:** Esta reunión de planificación trimestral cubrió elementos de la hoja de ruta de Q2 incluyendo cronograma de lanzamiento del producto, asignación de recursos e hitos clave.

**Decisiones:**
- Fecha de lanzamiento de Q2 aprobada para el 15 de abril
- Equipo Alpha asignado al desarrollo de funciones
- Reuniones de sincronización semanales programadas para los martes

Usando "audio-transcriber". lecture-audio.wav

Resultado esperado:

# Transcripción de Audio

**Archivo:** lecture-audio.wav
**Idioma:** pt
**Fecha:** 2024-01-20

---

## Puntos Clave

1. **Conceptos Fundamentales** - Explicación de conceptos centrales
2. **Aplicaciones Prácticas** - Aplicaciones del mundo real
3. **Próximos Pasos** - Actividades de seguimiento recomendadas

Auditoría de seguridad

Seguro
v1 • 2/24/2026

Static analysis flagged 266 potential issues, but evaluation reveals these are primarily false positives. The flagged patterns in documentation files (README.md, SKILL.md, CHANGELOG.md) represent code examples, not executable code. The actual Python script (transcribe.py) uses hardcoded CLI tool invocations for legitimate transcription purposes. No command injection vectors or malicious intent detected. This is a standard audio transcription utility.

7
Archivos escaneados
2,321
Líneas analizadas
6
hallazgos
1
Auditorías totales
Problemas de riesgo medio (1)
External Command Execution in Documentation Examples
Static scanner flagged shell command examples in documentation files (README.md, SKILL.md, CHANGELOG.md). These are legitimate code examples for users to follow, not actual execution vectors.
Problemas de riesgo bajo (2)
Subprocess Calls with Hardcoded Arguments
The transcribe.py script uses subprocess.run to invoke CLI tools (claude, gh copilot). All arguments are hardcoded strings, not user-controlled input.
File System Operations for Output
Script writes transcription outputs to files. File paths are derived from input filename with timestamp appended.

Factores de riesgo

⚙️ Comandos externos (2)
📁 Acceso al sistema de archivos (2)
🌐 Acceso a red
No se registraron ubicaciones específicas
Auditado por: claude

Puntuación de calidad

77
Arquitectura
100
Mantenibilidad
87
Contenido
50
Comunidad
96
Seguridad
87
Cumplimiento de la especificación

Lo que puedes crear

Transcripción de Reuniones

Transcribir automáticamente grabaciones de reuniones y generar actas profesionales con elementos de acción y decisiones documentadas.

Notas de Podcast y Entrevistas

Convertir episodios de podcast o grabaciones de entrevistas en texto buscable con resúmenes generados por IA para creadores de contenido.

Transcripción de Conferencias y Cursos

Transformar contenido educativo en audio en notas estructuradas con puntos clave extraídos para fines de estudio.

Prueba estos prompts

Transcripción Básica de Audio
Transcribe este archivo de audio a texto. Genera la transcripción completa en formato Markdown.
Generación de Actas de Reunión
Analiza esta transcripción de reunión y crea actas estructuradas incluyendo: asistentes, temas de agenda discutidos, decisiones clave tomadas y elementos de acción con responsables.
Resumen Ejecutivo
Lee esta transcripción y crea un resumen ejecutivo conciso destacando los puntos principales, conclusiones clave y cualquier anuncio importante. Usa viñetas para facilitar la lectura.
Documentación de Preguntas y Respuestas
Extrae todas las preguntas y respuestas de esta entrevista o sesión de Q&A. Formatea como un documento estructurado con preguntas claramente separadas de las respuestas.

Mejores prácticas

  • Usa grabaciones de audio de alta calidad para mejor precisión de transcripción - minimiza el ruido de fondo
  • Comienza con el modelo Whisper base para procesamiento más rápido, actualiza a small o medium para mayor precisión
  • Proporciona prompts personalizados para guiar la salida del LLM hacia tu formato deseado (notas de reunión, resúmenes, Q&A)

Evitar

  • No esperes transcripción perfecta de audio de mala calidad con ruido de fondo significativo
  • Evita procesar archivos muy largos sin dividirlos - puede causar problemas de memoria
  • No saltes el paso de descarga del modelo si quieres capacidad offline

Preguntas frecuentes

¿Qué formatos de audio están soportados?
La habilidad soporta formatos de audio comunes incluyendo MP3, WAV, M4A, FLAC y OGG. Cualquier formato legible por ffmpeg puede ser procesado.
¿Necesito instalar Whisper manualmente?
No, el script install-requirements.sh instalará automáticamente faster-whisper u openai-whisper. El modelo base se descargará en el primer uso.
¿Cuál es más rápido - faster-whisper o whisper?
Faster-Whisper es significativamente más rápido y eficiente en memoria ya que usa CTranslate2. El script prioriza faster-whisper y usa whisper como fallback si es necesario.
¿Puedo usar esto offline?
Sí, después de descargar el modelo Whisper, la transcripción funciona completamente offline. El resumen con IA requiere que Claude CLI o GitHub Copilot CLI estén instalados.
¿Qué tan precisa es la transcripción?
La precisión depende de la calidad del audio y del modelo usado. El modelo base proporciona buena precisión para audio claro. Para mejores resultados, usa modelos small o medium.
¿Qué pasa si no está instalado ni Claude ni Copilot?
El script detectará CLIs faltantes y guardará solo el texto de transcripción sin resúmenes generados por IA. Puedes agregar resúmenes más tarde con Claude o Copilot.