精選

PDF 處理工具包

完整的 PDF 流程 — 擷取文字與表格、填寫表單、合併與分割文件、對掃描頁面進行 OCR，並呈現頁面層級預覽。

3 技能 3 安裝次數

pdfdocument-processingocrformsextractionproductivity

4 天前更新

安裝

執行此指令以安裝此技能包中的所有技能：

npx skillstore add @pdf-processing-toolkit

CLI 會自動偵測 Codex 與 Claude Code 資料夾；如果兩者都可用，會同時安裝。

總覽

使用指南

詳細指南

## 概覽

完整的 PDF 流程 — 擷取文字與表格、填寫表單、合併與分割文件、對掃描頁面進行 OCR，並呈現頁面層級預覽。結合三項互補技能，適用於一般、生產級與深度擷取 PDF 工作流程。

## 快速開始

1. 安裝：`npx skillstore add @pdf-processing-toolkit`
2. 從 PDF 擷取文字：使用 **pdf-analyze** 從任何文件擷取文字、表格或中繼資料
3. 處理生產工作流程：使用 **pdf-processing-pro** 進行 OCR、表單填寫、批次處理與驗證
4. 深入頁面檢查：使用 **pdf-page-extract** 擷取逐頁文字 span、呈現 PNG 預覽，並讀取頁面中繼資料

## 主要命令

- **pdf-analyze** (21pounder)：擷取文字區塊、表格與中繼資料；建立 PDF；合併/分割文件；處理表單欄位 — 通用 PDF 操作
- **pdf-processing-pro** (davila7)：生產級 PDF 處理 — 針對掃描文件進行 OCR、表單偵測與填寫、跨多個檔案批次處理、輸出驗證
- **pdf-page-extract** (abejitsu)：頁面層級精準度 — 擷取含位置/span 資料的文字、將個別頁面呈現為 PNG 圖片、取得頁數與尺寸

## 提示

- 流程：使用 pdf-page-extract 將頁面呈現為圖片，然後傳給 AI vision model 進行結構化資料擷取
- 批次處理大型文件：pdf-processing-pro 可在多檔案工作流程中處理驗證與錯誤復原
- 搭配 ai-media-production-toolkit：產生 PDF 報告後，將其封面頁呈現為圖片以便分享