技能 pdf
📄

pdf

安全 ⚡ 包含脚本📁 文件系统访问

自动处理PDF文档

也可从以下获取: AutumnsGrove,Azeem-2,92Bilal26,Cam10001110101,92Bilal26,davila7,ArtemisAI,DYAI2025,ZhanlinCui,ComposioHQ,K-Dense-AI,sickn33

PDF文档需要手动操作来提取数据、填写表单或合并多个文件。此技能提供编程工具来提取文本和表格、创建新PDF、合并和拆分文档,以及使用成熟的Python库自动填写表单。

支持: Claude Codex Code(CC)
🥉 76 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“pdf”。 Extract the text and tables from the quarterly report PDF

预期结果:

  • - Found 12 pages in the PDF
  • - Extracted 245 paragraphs of text
  • - Identified 3 tables with structured data
  • - Table 1: Revenue by Region (4 rows x 3 columns)
  • - Table 2: Expenses by Category (6 rows x 3 columns)
  • - Table 3: Growth Metrics (5 rows x 2 columns)

正在使用“pdf”。 Create a welcome document with company letterhead and branding

预期结果:

  • - Created 3-page PDF document
  • - Added company logo and letterhead on page 1
  • - Included 2 paragraphs of welcome text
  • - Added page numbers on all pages
  • - Applied brand colors to headers

正在使用“pdf”。 Fill out the tax form with the provided employee information

预期结果:

  • - Verified form has 15 fillable fields
  • - Filled text fields: name, address, SSN, income
  • - Set 3 checkbox fields
  • - Selected radio group option for filing status
  • - Saved completed form to completed_tax_form.pdf

安全审计

安全
v4 • 1/17/2026

Official Anthropic skill from github.com/anthropics/skills repository. Contains only PDF processing scripts using established Python libraries (pypdf, pdfplumber, reportlab). No network calls, no external command execution, no sensitive filesystem access beyond specified PDF files.

14
已扫描文件
1,943
分析行数
2
发现项
4
审计总数
审计者: claude 查看审计历史 →

质量评分

59
架构
100
可维护性
85
内容
29
社区
100
安全
91
规范符合性

你能构建什么

自动化表单数据录入

自动使用其他来源的数据填写PDF表单,减少手动数据录入工作。

从报表中提取表格

从PDF报表中提取表格数据,以便在电子表格或数据库中进行分析。

合并案例文档

将多个PDF文档合并为有序的案例文件,并正确排序页面。

试试这些提示

提取文本
Extract all text from input.pdf and save it to output.txt using pdfplumber.
合并文档
Merge doc1.pdf, doc2.pdf, and doc3.pdf into merged.pdf using pypdf.
填写表单
Fill the fields in form.pdf using the data from values.json. First check if the PDF has fillable fields.
创建PDF
Create a new PDF report with title, table of quarterly sales data, and page numbers using reportlab.

最佳实践

  • 使用pdfplumber进行文本提取,因为它比pypdf更好地保留布局
  • 在填写前验证表单字段值以尽早发现错误
  • 在填写不可填写的表单时先将其转换为图像以确保放置位置准确

避免

  • 不要在没有视觉分析的情况下尝试填写复杂的不可填写表单
  • 放置注释时不要跳过边界框验证
  • 不要在未获取密码的情况下处理受密码保护的PDF

常见问题

哪些PDF库可与Claude和Claude Code配合使用?
pypdf、pdfplumber、reportlab、pypdfium2、pdf-lib (JavaScript)和pdfjs-dist可与Claude配合使用。每种库都有不同的优势。
PDF处理有什么大小限制吗?
处理包含数百页的大型PDF可能需要分块处理以有效管理内存。
此技能能否与现有的文档工作流程集成?
可以。脚本可以从任何Python代码调用。使用脚本目录工具作为自动化管道的构建块。
处理PDF时我的数据安全吗?
所有处理都在本地进行。脚本只读取和写入指定的文件。不会将数据发送到外部服务。
为什么我的文本提取返回空结果?
扫描的PDF包含图像而非文本。对扫描的PDF使用OCR配合pytesseract。如果是加密的,请提供密码。
这与其他PDF工具相比如何?
此技能提供Claude特定的指令。qpdf和pdftotext等工具提供命令行替代方案。