PDF 處理工具包
精選

PDF 處理工具包

完整的 PDF 流程 — 擷取文字與表格、填寫表單、合併與分割文件、對掃描頁面進行 OCR,並呈現頁面層級預覽。

3 技能 3 安裝次數
pdfdocument-processingocrformsextractionproductivity
4 天前更新

安裝

執行此指令以安裝此技能包中的所有技能:

npx skillstore add @pdf-processing-toolkit

CLI 會自動偵測 Codex 與 Claude Code 資料夾;如果兩者都可用,會同時安裝。

總覽

使用指南

詳細指南

## 概覽

完整的 PDF 流程 — 擷取文字與表格、填寫表單、合併與分割文件、對掃描頁面進行 OCR,並呈現頁面層級預覽。結合三項互補技能,適用於一般、生產級與深度擷取 PDF 工作流程。

## 快速開始

1. 安裝:`npx skillstore add @pdf-processing-toolkit`
2. 從 PDF 擷取文字:使用 **pdf-analyze** 從任何文件擷取文字、表格或中繼資料
3. 處理生產工作流程:使用 **pdf-processing-pro** 進行 OCR、表單填寫、批次處理與驗證
4. 深入頁面檢查:使用 **pdf-page-extract** 擷取逐頁文字 span、呈現 PNG 預覽,並讀取頁面中繼資料

## 主要命令

- **pdf-analyze** (21pounder):擷取文字區塊、表格與中繼資料;建立 PDF;合併/分割文件;處理表單欄位 — 通用 PDF 操作
- **pdf-processing-pro** (davila7):生產級 PDF 處理 — 針對掃描文件進行 OCR、表單偵測與填寫、跨多個檔案批次處理、輸出驗證
- **pdf-page-extract** (abejitsu):頁面層級精準度 — 擷取含位置/span 資料的文字、將個別頁面呈現為 PNG 圖片、取得頁數與尺寸

## 提示

- 流程:使用 pdf-page-extract 將頁面呈現為圖片,然後傳給 AI vision model 進行結構化資料擷取
- 批次處理大型文件:pdf-processing-pro 可在多檔案工作流程中處理驗證與錯誤復原
- 搭配 ai-media-production-toolkit:產生 PDF 報告後,將其封面頁呈現為圖片以便分享

技能

3