技能 pdf-official
📦

pdf-official

低风险 📁 文件系统访问

使用 Claude 处理和填充 PDF 表单

手动填写 PDF 表单既繁琐又容易出错。此技能使 Claude 能够提取表单字段、验证布局,并以精确数据程序化填充 PDF。

支持: Claude Codex Code(CC)
🥉 76 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“pdf-official”。 检查 employment_application.pdf 中的可填充字段

预期结果:

发现 12 个可填充字段:first_name (文本)、last_name (文本)、email (文本)、phone (文本)、address (文本)、city (文本)、state (选择)、zip (文本)、position_applied (文本)、available_date (文本)、full_time (复选框)、part_time (复选框)。字段跨越第 1-2 页。

正在使用“pdf-official”。 使用以下信息填充表单:first_name=John, last_name=Doe, email=john@example.com

预期结果:

成功填充 employment_application.pdf 中的 12 个字段。输出保存到 employment_application_filled.pdf。所有字段值都已根据字段类型进行验证。

正在使用“pdf-official”。 为 fields.json 的第 1 页创建验证图像

预期结果:

在 page_1_validation.png 创建了带有 24 个边界框的验证图像。红色矩形标记文本输入区域,蓝色矩形标记标签。未检测到交叉。

安全审计

低风险
v1 • 2/24/2026

Static analyzer flagged 220 patterns but all are false positives. The 'Ruby backtick' detections are markdown code blocks in documentation, not shell execution. 'Weak crypto' and 'C2 keywords' findings have no basis in actual code. The skill uses legitimate Python PDF libraries (pypdf, pdfplumber, PIL) for expected file operations. No network exfiltration, command injection, or malicious patterns found.

12
已扫描文件
1,914
分析行数
2
发现项
1
审计总数
低风险问题 (1)
Filesystem Write Operations
Scripts write output PDF and JSON files to disk. This is expected behavior for a PDF manipulation tool but should be noted for sandboxing considerations.
审计者: claude

质量评分

59
架构
100
可维护性
87
内容
50
社区
88
安全
83
规范符合性

你能构建什么

行政工作的自动化表单填写

办公室工作人员可以让 Claude 从就业申请表、税务表格或注册文件中提取表单字段,然后准确、一致地用用户提供的信息填充它们。

研究的 PDF 数据提取

研究人员可以从学术 PDF 中提取表格和结构化数据,将其���换为 CSV 或 Excel 格式进行分析,而无需手动复制粘贴。

法律或合规文档准备

法律团队可以合并多个 PDF 文档,添加水印,应用一致的注释,并使用特定案例信息填充标准化表单。

试试这些提示

基础:检查 PDF 表单字段
检查此 PDF 是否具有可填充表单字段:[上传 PDF]。运行 check_fillable_fields 脚本并告诉我有哪些字段可用。
中级:提取和填充表单
从 [input.pdf] 中提取表单字段信息到 JSON 文件,然后使用这些值填充:[提供字段值]。将填充后的 PDF 创建为 [output.pdf]。
高级:不可填充表单处理
此 PDF 没有可填充字段。将其转换为图像,帮我识别文本输入区域的边界框,创建验证图像以验证放置,然后添加注释以使用 [数据] 填充表单。
专家:批量 PDF 操作
我有 50 个 PDF 表单需要使用此电子表格中的不同值填充相同字段。提取一次字段结构,然后使用相应的数据行处理所有 PDF。

最佳实践

  • 始终首先运行 check_fillable_fields 以确定 PDF 是否具有交互式表单字段或需要基于注释的填充
  • 在完成不可填充表单注释之前生成并目视检查验证图像,以确保准确的文本放置
  • 在运行填充操作之前将原始 PDF 作为备份保留,因为该过程会创建新的输出文件

避免

  • 不要跳过验证图像检查 - 边界框错误会导致文本出现在错误的位置
  • 不要假设所有 PDF 都有可填充字段 - 许多扫描表单需要手动边界框识别
  • 对于具有实际表单字段的表单,不要使用基于注释的填充 - 而是使用可填充字段方法

常见问题

可填充和不可填充 PDF 表单有什么区别?
可填充 PDF 具有可程序化填充的交互式表单字段(文本框、复选框)。不可填充 PDF 是静态图像或文本,需要视觉分析来确定应将文本作为注释放置的位置。
此技能可以处理扫描的 PDF 或图像吗?
可以,但需要 OCR (pytesseract) 从扫描文档中提取文本���准确性取决于扫描质量。对于填充扫描表单,使用基于注释的放置。
此技能使用哪些 Python 库?
主要库包括用于 PDF 操作的 pypdf、用于文本和表格��取的 pdfplumber,以及用于图像处理的 PIL (Pillow)。可选:用于 OCR 的 pytesseract,用于 PDF 到图像转换的 pdf2image。
如何验证填充的表单字段位置正确?
对于基于注释的填充,使用 create_validation_image 脚本,它在 PDF 图像上叠加彩色矩形。红色显示输入区域,蓝色显示标签。在生成最终 PDF 之前目视确认放置。
此技能可以将多个 PDF 合并为一个文档吗?
是的,该技能包括使用 pypdf 的合并功能。您可以按指定顺序将多个 PDF 文件组合成一个输出文档。
如果我为表��字段提供无效的字段值,会发生什么?
fill_fillable_fields 脚本根据字段类型验证值。对于复选框,它根据已选中/未选中的值进行验证。对于单选组和下拉菜单,它根据可用选项进行验证。无效值会导致脚本退出并显示错误消息。