Compétences PDF Processing
📄
PDF Processing
Sûr
PDF文書の抽出と処理
PDFからの手動データ抽出は退屈でエラーが発生しやすいです。このスキルは、Pythonライブラリを使用してPDFからテキスト、テーブル、フォームデータを抽出するためのコードパターンを提供します。
Prend en charge: Claude Codex Code(CC)
1
Télécharger le ZIP du skill
2
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
3
Activez et commencez à utiliser
Tester
Utilisation de "PDF Processing". quarterly_report.pdfからすべてのテキストを抽出し、quarterly_report.txtに保存してください
Résultat attendu:
- ✓ すべての24ページからテキストを正常に抽出しました
- ✓ quarterly_report.txtに保存しました(45,678文字)
- ✓ 注意: 2ページに選択可能なテキストがない画像が含まれていました
Audit de sécurité
Sûrv3 • 1/10/2026
Pure documentation skill containing PDF processing examples. No executable code, network calls, or sensitive operations. All code samples use standard Python libraries (pdfplumber, pypdf) for their stated purpose of PDF manipulation.
2
Fichiers analysés
307
Lignes analysées
0
résultats
3
Total des audits
Aucun problème de sécurité trouvé
Audité par: claude Voir l’historique des audits →
Score de qualité
38
Architecture
100
Maintenabilité
81
Contenu
25
Communauté
100
Sécurité
70
Conformité aux spécifications
Ce que vous pouvez construire
テーブルデータの抽出
PDFレポートから表形式のデータをCSVやスプレッドシート形式に抽出して分析します。
フォーム入力の自動化
データベースやスプレッドシートのデータをプログラムでPDFフォームに入力します。
PDFワークフローの構築
アプリケーション内でPDF文書をマージ、分割、処理するパイプラインを作成します。
Essayez ces prompts
テキスト抽出
[file_path]にあるPDF文書からすべてのテキストを抽出し、[output_file]に保存してください。
テーブル抽出
[pdf_file]からすべてのテーブルを見つけて抽出し、CSVファイルとして保存してください。
フォーム入力
[form_path]にあるPDFフォームに次の値を入力してください: [field_values]。[output_path]に保存してください。
PDFのマージ
これらのPDFファイル [file_list]を[output_name]という1つの文書にマージしてください。
Bonnes pratiques
- 処理の前にPDFファイルを検証して、破損した文書でのエラーを回避してください
- 元のファイルのコピーで作業して、データの誤損失を防止してください
- 抽出可能なテキストがないページについては例外を適切に処理してください
Éviter
- 特定のページだけが必要な場合に全体のPDFを処理する
- 大規模で複雑なPDFファイルのエラー処理をスキップする
- まずフォームフィールド構造を分析せずにフォームに入力する
Foire aux questions
このスキルはどのPDFライブラリをサポートしていますか?
テキスト/テーブル抽出にはpdfplumber、操作にはpypdf、変換にはpdf2image、OCRにはpytesseractを使用します。
PDF処理のサイズ制限はありますか?
処理は利用可能なシステムメモリによって制限されます。非常大的なファイルは、チャンク化された処理が必要になる場合があります。
このスキルは他のツール��統合できますか?
はい。Claude、Codex、またはClaude CodeでPythonスクリプトを使用して、PDF処理と他のワークフローを連鎖させることができます。
処理中、データは安全ですか?
はい。すべての処理はローカルで実行されます。データは外部サーバーに送信されません。ファイルはパスを指定したときにのみ読み取られます。
スキャンされたPDFにテキストが表示されないのはなぜですか?
スキャンされたPDFには画像が含まれており、選択可能なテキストがありません。OCRを有効にしたpytesseractを使用して、スキャンからテキストを抽出してください。
オンラインツールとどう異なりますか?
このスキルはPython環境でローカルに実行されます。ファイルのアップロードはなく、プライバシーに関する懸念もなく、オフラインで動作します。