pdf-processing
PythonライブラリでPDFファイルを処理する
PDFファイルの操作には、複数のPythonライブラリとAPIに関する専門的な知識が必要です。このスキルは、pdfplumberとpypdfライブラリを使用して、テキストやテーブルの抽出、フォームの入力、ドキュメントの結合、PDF処理タスクに関する包括的なガイダンスを提供します。
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "pdf-processing". Extract text from the first page of document.pdf
Resultado esperado:
スキルはpdfplumberを使用したPythonコードを提供し、PDFを開いて最初のページからテキストを抽出し、抽出したコンテンツを表示します。コードには、空のページや読み取り不可能なテキストのエラーハンドリングが含まれています。
Usando "pdf-processing". Fill the contact form with my information and flatten it
Resultado esperado:
スキルはPDFフォームを読み込み、指定されたフィールドを提供された値で更新し、フォームをフラット化してこれ以上の編集を防止し、結果を新しいファイルに保存するPythonコードを生成します。コードには、必要なデータが含まれていることを確認するフィールド検証が含まれています。
Usando "pdf-processing". Merge three PDF files into one document
Resultado esperado:
スキルはpypdfのPdfMergerクラスを使用して、指定されたPDFファイルを決められた順序で結合し、結合された出力を新しいファイルに書き込み、リソースリークを避けるためにすべてのファイルハンドルを適切に閉じるコードを作成します。
Auditoría de seguridad
SeguroThis skill provides documentation and code examples for PDF processing using Python libraries. The static analyzer detected 46 pattern matches, but all are false positives. The code snippets shown are documentation examples in markdown files demonstrating legitimate PDF manipulation libraries. No external commands, network access, or filesystem risks were found in executable code. The skill contains only educational documentation without executable scripts.
Factores de riesgo
📁 Acceso al sistema de archivos (5)
Puntuación de calidad
Lo que puedes crear
フォーム処理の自動化
法務専門家はデータベースやスプレッドシートから客户データを使用して、標準的な法的フォームに自動的に入力でき、手動のデータ入力エラーを減らし、退屈な作業を節約できます。
財務データの抽出
データアナリストは財務レポートや請求書からテーブルやテキストを抽出し、分析ツールにインポートできます。これにより、数百のドキュメントの自動処理が可能になり、レポート作成とコンプライアンスに役立ちます。
バッチドキュメント処理
開発者は複数のPDFレポートを統合ドキュメントに結合したり、大きなPDFをセクションに分割したり、特定のページを抽出して異なる関係者に配布できます。
Prueba estos prompts
Extract all text from the PDF file document.pdf and save it to a text file
Extract all tables from report.pdf and save them to a CSV file for analysis
Fill the form.pdf with name John Doe, email john@example.com, and address 123 Main St, then save as filled_form.pdf
Merge file1.pdf, file2.pdf, and file3.pdf into combined.pdf, then extract pages 5-10 into a separate file
Mejores prácticas
- PDFフォームに入力する前に入力データを検証して、必要なフィールドに値が入力され、データ形式が正しいことを確認する
- 元のPDFファイルのコピーで作業して、ソースドキュメントを保持し、処理エラーからの回復を可能にする
- 使用後にPDFオブジェクトを閉じ、例外を処理して大批のファイルを処理する際のリソースリークを防止する
Evitar
- OCR設定なしでスキャンされたPDFからテキストを抽出しようとすると、空の出力やエラーが発生する
- 必要なページだけの場合に大きいPDF全体を処理すると、メモリと処理時間が浪費される
- 入力後にフォームをフラット化しないと、配布先の受信者がロックすべき機密データを変更できる