📦

pdf

Name: pdf
Author: ZhanlinCui

低リスク 📁 ファイルシステムへのアクセス⚙️ 外部コマンド

PDF文書をプログラムで操作しフォームに記入する

こちらからも入手できます: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

PDF処理タスクには、抽出、操作、フォーム記入のための特殊なツールが必要です。このスキルは、Pythonライブラリーとコマンドラインツールを使用して包括的なPDF処理機能を提供します。

対応: Claude Codex Code(CC)

🥉 75 ブロンズ

スキルZIPをダウンロード

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

オンにして利用開始

テストする

「pdf」を使用しています。 document.pdfからテキストを抽出する

期待される結果:

5ページから2,450文字を正常に抽出しました。特定された主要セクション：エグゼクティブサマリー、財務データ、結論。

「pdf」を使用しています。 file1.pdf、file2.pdf、file3.pdfを結合する

期待される結果:

merged.pdf（合計15ページ）を作成：file1.pdf（3ページ）、file2.pdf（7ページ）、file3.pdf（5ページ）を結合

「pdf」を使用しています。 field_values.jsonでform.pdfに記入する

期待される結果:

2ページにまたがる12のフォームフィールドに記入しました。検証されたフィールド値でform_filled.pdfに出力を保存しました。

セキュリティ監査

低リスク

v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

スキャンされたファイル

1,878

解析された行数

検出結果

総監査数

中リスクの問題 (1)

forms.md:4 reference.md:11 SKILL.md:15

External Command Execution Patterns

Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.

低リスクの問題 (2)

scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

Filesystem Write Operations

Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.

scripts/extract_form_field_info.py:32 scripts/extract_form_field_info.py:81

Hardcoded Documentation URLs

Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.

リスク要因

📁 ファイルシステムへのアクセス (4)

reference.md:59 scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

⚙️ 外部コマンド (5)

forms.md:4 reference.md:11 SKILL.md:15 scripts/check_bounding_boxes.py:6 scripts/extract_form_field_info.py:11

監査者: claude

品質スコア

アーキテクチャ

100

保守性

コンテンツ

コミュニティ

セキュリティ

仕様準拠

作れるもの

PDFレポートからデータを抽出する

財務または科学的なPDFレポートからテキストコンテンツとテーブルを自動的に抽出し、データ分析に使用する

PDF申請フォームに記入する

ユーザーが提供したデータと検証により記入可能なPDFフォームをプログラムで完了させる

バッチPDF文書処理

自動化されたワークフローで複数のPDF文書を結合、分割、回転、透かし入れする

これらのプロンプトを試す

PDFからテキストを抽出する

添付されたPDF文書からすべてのテキストコンテンツを抽出し、主要な情報を要約してください。

複数のPDFを結合する

これらのPDFファイルを順番に結合してください：cover.pdf、chapter1.pdf、chapter2.pdf、appendix.pdf

ユーザーデータでPDFフォームに記入する

この申請フォームに記入する必要があります。まずフィールド情報を抽出してください，随后我将提供填充每个字段的值。

テーブルを抽出してExcelに変換する

この財務レポートPDFからすべてのテーブルを抽出し、各テーブルごとに別々のシートを持つExcelスプレッドシートとして保存してください。

ベストプラクティス

記入前に常にPDFフォームフィールドの値を検証してエラーを防ぐ
OCR用にPDFを画像に変換する際は高解像度設定（300 DPI以上）を使用する
記入不可能なPDFに注釈を追加する際はバウンディングボックスの交差を確認する

回避

記入不可能なフォームに記入する際にバウンディングボックスの視覚的検証をスキップしない
最初に復号化せずにパスワード保護されたPDFを処理しない
すべてのPDFが抽出可能なテキストを持つとは限らない - スキャンされたPDFにはOCRが必要

よくある質問

インストールする必要があるPythonライブラリは何ですか？

コアライブラリ：pypdf、pdfplumber、reportlab。オプション：OCR用のpytesseract、PDFから画像変換用のpdf2image。インストール方法：pip install pypdf pdfplumber reportlab

テキストのないスキャンされたPDFはどのように処理しますか？

スキャンされたPDFにはOCR処理が必要です。pytesseractワークフローを使用してください：pdf2imageでPDFページを画像に変換し、次にpytesseract.image_to_string()を適用してテキストを抽出します。

記入不可能なPDFフォームにこのスキルで記入できますか？

はい、計算された位置にテキスト注釈を追加することで可能です。プロセスには、PDFを画像に変換し、フィールド位置を視覚的に識別し、バウンディングボックスを作成し、注釈を追加することが含まれます。

どのようなコマンドラインツールが利用可能ですか？

poppler-utils（pdftotext、pdfimages、pdftoppm）、結合/分割用のqpdf、高度な操作用のpdftk。poppler-utilsとqpdfはシステムパッケージマネージャーでインストールしてください。

暗号化されたPDFを処理できますか？

pdfplumberのextract_tables()メソッドを使用してください。複雑なテーブルの場合、垂直戦略と水平戦略のパラメータでtable_settingsを構成して検出を改善します。

暗号化されたPDFを処理できますか？

パスワードをお持ちの場合、はい。pypdfのdecrypt()メソッドまたはqpdf --passwordオプションを使用してください。パスワードなしでは、暗号化されたPDFは処理できません。

開発者の詳細

作成者

ZhanlinCui

ライセンス

Proprietary. LICENSE.txt has complete terms

リポジトリ

https://github.com/ZhanlinCui/Ultimate-Agent-Skills-Collection/tree/main/pdf

参照

main

ファイル構成

📁 scripts/

📄 check_bounding_boxes_test.py

📄 check_bounding_boxes.py

📄 check_fillable_fields.py

📄 convert_pdf_to_images.py

📄 create_validation_image.py

📄 extract_form_field_info.py

📄 fill_fillable_fields.py

📄 fill_pdf_form_with_annotations.py

📄 forms.md

📄 reference.md

📄 SKILL.md