Claude で PDF ドキュメントを処理する
Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI,AutumnsGrove
PDF からデータを抽出したり、フォームに入力したり、ドキュメントを結合したりする必要がありますか?Claude は Python ライブラリとコマンドラインツールを使って PDF を読み取り、作成し、変更できます。
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "pdf". Read document.pdf and tell me what it contains
Résultat attendu:
- Document: document.pdf (12 pages)
- Contains: Invoice #2024-001 for Acme Corp
- Metadata: Created 2024-12-15, Author: J. Smith
- No fillable form fields detected
- Extracted 3 tables (financial summary on page 5)
Utilisation de "pdf". Fill out my application form
Résultat attendu:
- Analyzed form fields: 12 text fields, 3 checkboxes, 2 radio groups
- Filled 17 fields with provided values
- Output saved to: filled_application.pdf
- Validation: All fields populated correctly
Audit de sécurité
Risque faibleLegitimate PDF manipulation toolkit containing documentation and Python scripts using standard PDF libraries (pypdf, pdfplumber, reportlab). Static findings are false positives: 143 patterns detected in markdown files are code examples in documentation, not executable code. The Python scripts in scripts/ directory are standard PDF processing utilities with no malicious behavior.
Facteurs de risque
Score de qualité
Ce que vous pouvez construire
論文からデータを抽出
分析や参照のために研究論文から表やテキストを抽出
PDF フォームを自動入力
JSON 設定でフィールド値を指定してフォームを入力
契約書類を処理
複数ページの契約書を分割し、条項を抽出し、修正済み版を結合
Essayez ces prompts
Read the PDF at [file.pdf] and tell me how many pages it has, then extract all the text
Extract all tables from [report.pdf] and save them to a CSV file
Fill out the form in [application.pdf] using these field values: name=John Smith, email=john@example.com
Merge all PDFs in the [input] folder into one file, then split it into separate files by chapter
Bonnes pratiques
- テキスト抽出には pdfplumber、ドキュメント操作には pypdf、コマンドライン操作には qpdf を使用する
- 下流処理で精度が重要な場合は座標付きで表を抽出する
- メモリ問題を避けるために大きな PDF は処理前に分割する
Éviter
- プログラムでの抽出が速い場合は手作業でのコピー&ペーストをしない
- 入力可能なフォームフィールドと視覚的なテキストボックスを混同しない(別のアプローチが必要です)
- 印刷用に設計された PDF を編集しようとしない(代わりに print-to-PDF ワークフローを使用する)
Foire aux questions
どの AI ツールがこのスキルに対応していますか?
必要な Python パッケージは何ですか?
入力可能な PDF フォームはどうやって埋めますか?
PDF を処理するとき、データは安全ですか?
PDF のテキスト抽出が空になるのはなぜですか?
他の PDF ツールと何が違いますか?
Détails du développeur
Structure de fichiers