技能 markitdown
📄

markitdown

低風險 📁 檔案系統存取🌐 網路存取🔑 環境變數

将文档转换为Markdown

也可從以下取得: davila7

将文档转换为Markdown可以提高token效率,便于AI模型处理。MarkItDown支持15+种格式,包括PDF、DOCX、PPTX、XLSX、图片、音频和网页。

支援: Claude Codex Code(CC)
🥈 77 白銀
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「markitdown」。 Convert research_paper.pdf to Markdown

預期結果:

  • # Research Paper Title
  • ## Abstract
  • Paper content extracted...
  • ## References
  • Bibliography extracted...

正在使用「markitdown」。 Convert spreadsheet.xlsx to Markdown

預期結果:

  • # Data Summary
  • | Column A | Column B |
  • | -------- | -------- |
  • | Value 1 | Value 2 |

正在使用「markitdown」。 Convert presentation.pptx with AI descriptions

預期結果:

  • # Slide 1: Introduction
  • ![AI-generated description: Bar chart showing...]
  • Slide text content...

安全審計

低風險
v4 • 1/17/2026

Static findings are false positives. The scanner incorrectly flagged markdown code blocks (using backticks) as shell execution, and legitimate document conversion patterns as suspicious. The skill is a Microsoft tool for converting documents to Markdown with expected file I/O and API access.

8
已掃描檔案
4,355
分析行數
3
發現項
4
審計總數
審計者: claude 查看審計歷史 →

品質評分

77
架構
100
可維護性
87
內容
22
社群
90
安全
83
規範符合性

你能建構什麼

将论文转换为Markdown

将PDF研究论文转换为干净的Markdown,用于AI分析和文献综述工作流程。

处理办公文档

将Word文档、PowerPoint幻灯片和Excel表格转换为Markdown,用于内容重用。

批量转换档案

批量处理多种文档格式,用于管道集成和文档自动化。

試試這些提示

基础PDF转换
Use MarkItDown to convert research_paper.pdf to Markdown and save the output to paper.md
批量处理
Convert all PDF files in the papers/ directory to Markdown files in the markdown_output/ directory using MarkItDown
AI增强的幻灯片
Use MarkItDown with OpenRouter to convert presentation.pptx. Configure Claude Sonnet to describe the slide images in detail.
YouTube转录
Convert the YouTube video at https://www.youtube.com/watch?v=VIDEO_ID to Markdown transcript using MarkItDown

最佳實務

  • 使用pip install markitdown[all]安装MarkItDown及所有功能
  • 使用AI增强模式和Claude Sonnet为演示文稿中的图片提供详细描述
  • 使用有意义的文件名和目录结构组织转换后的文件

避免

  • 不要在未审查安全影响的情况下用于转换机密文档
  • 不要在共享脚本或版本控制中暴露API密钥
  • 不要假设所有格式都能从复杂的PDF中完美转换

常見問題

支持哪些文件格式?
支持PDF、DOCX、PPTX、XLSX、图片(OCR)、音频(转录)、HTML、CSV、JSON、XML、ZIP、EPUB以及YouTube URL。
需要API密钥吗?
基本转换无需API密钥。AI图片描述需要OpenRouter API密钥。
OCR如何工作?
MarkItDown使用tesseract进行图片OCR。可通过pip install markitdown[all]或单独安装。
可以转换受密码保护的文件吗?
不能。MarkItDown无法转换受密码保护或加密的文档。
这适用于法律文档吗?
转换会保留内容,但可能无法保持完全相同的格式。在关键使用场景下请检查输出准确性。
批量转换如何工作?
使用batch_convert.py脚本处理多个文件,并使用并行工作进程以提高效率。