PDF文書をプログラムで操作しフォームに記入する
こちらからも入手できます: 92Bilal26,92Bilal26,davila7,ArtemisAI,AutumnsGrove,Azeem-2,DYAI2025,anthropics,K-Dense-AI,ComposioHQ,Cam10001110101
PDF処理タスクには、抽出、操作、フォーム記入のための特殊なツールが必要です。このスキルは、Pythonライブラリーとコマンドラインツールを使用して包括的なPDF処理機能を提供します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「pdf」を使用しています。 document.pdfからテキストを抽出する
期待される結果:
5ページから2,450文字を正常に抽出しました。特定された主要セクション:エグゼクティブサマリー、財務データ、結論。
「pdf」を使用しています。 file1.pdf、file2.pdf、file3.pdfを結合する
期待される結果:
merged.pdf(合計15ページ)を作成:file1.pdf(3ページ)、file2.pdf(7ページ)、file3.pdf(5ページ)を結合
「pdf」を使用しています。 field_values.jsonでform.pdfに記入する
期待される結果:
2ページにまたがる12のフォームフィールドに記入しました。検証されたフィールド値でform_filled.pdfに出力を保存しました。
セキュリティ監査
低リスクStatic analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.
中リスクの問題 (1)
低リスクの問題 (2)
リスク要因
品質スコア
作れるもの
PDFレポートからデータを抽出する
財務または科学的なPDFレポートからテキストコンテンツとテーブルを自動的に抽出し、データ分析に使用する
PDF申請フォームに記入する
ユーザーが提供したデータと検証により記入可能なPDFフォームをプログラムで完了させる
バッチPDF文書処理
自動化されたワークフローで複数のPDF文書を結合、分割、回転、透かし入れする
これらのプロンプトを試す
添付されたPDF文書からすべてのテキストコンテンツを抽出し、主要な情報を要約してください。
これらのPDFファイルを順番に結合してください:cover.pdf、chapter1.pdf、chapter2.pdf、appendix.pdf
この申請フォームに記入する必要があります。まずフィールド情報を抽出してください,随后我将提供填充每个字段的值。
この財務レポートPDFからすべてのテーブルを抽出し、各テーブルごとに別々のシートを持つExcelスプレッドシートとして保存してください。
ベストプラクティス
- 記入前に常にPDFフォームフィールドの値を検証してエラーを防ぐ
- OCR用にPDFを画像に変換する際は高解像度設定(300 DPI以上)を使用する
- 記入不可能なPDFに注釈を追加する際はバウンディングボックスの交差を確認する
回避
- 記入不可能なフォームに記入する際にバウンディングボックスの視覚的検証をスキップしない
- 最初に復号化せずにパスワード保護されたPDFを処理しない
- すべてのPDFが抽出可能なテキストを持つとは限らない - スキャンされたPDFにはOCRが必要