Les documents PDF contiennent des données précieuses qui sont difficiles à accéder par programmation. Cette compétence fournit aux agents IA les capacités d'extraire du texte, des tableaux et des données de formulaires à partir de PDF, ainsi que de manipuler des documents par des opérations de fusion, de分割 et de mise en forme.
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「pdf-processing」を使用しています。 Extract all text and tables from the quarterly report PDF
期待される結果:
- Extracted 24 pages of text content
- Found 8 tables in the document
- Saved tables as CSV files: table_1.csv through table_8.csv
- Text saved to quarterly_report.txt (preserved headings and structure)
セキュリティ監査
安全Pure prompt-based skill with no executable code. The SKILL.md provides AI instructions for PDF processing using standard libraries like pdfplumber and PyPDF2. No scripts, network calls, or concerning capabilities detected.
品質スコア
作れるもの
Extraire des données structurées
Extraire des tableaux et des données de rapports PDF pour analyse dans des tableurs ou des bases de données
Automatiser les flux de travail de formulaires
Remplir des formulaires PDF par programmation et traiter les données de soumission de formulaires
Construire une automatisation PDF
Intégrer le traitement PDF dans des pipelines de gestion de documents plus larges
これらのプロンプトを試す
Extract all text content from the PDF file at [file_path]. Preserve paragraph structure and headings.
Find all tables in [file_path] and convert them to CSV format. Save each table as a separate file.
Fill the PDF form at [form_path] with the following data: [key-value pairs]. Save the completed form to [output_path].
Merge all PDF files in [source_directory] into a single document. Add a header page and page numbers to each page. Save to [output_path].
ベストプラクティス
- Vérifier si les PDF sont chiffrés avant de tenter de les traiter
- Utiliser l'OCR (pytesseract) pour les documents scannés afin de permettre l'extraction de texte
- Valider les données de tableau extraites après extraction pour vérifier leur exactitude
回避
- Tenter d'extraire du texte de PDF scannés sans prétraitement OCR
- Traiter de grands PDF sans pagination ni découpage
- Ignorer les types de champs de formulaires PDF lors du remplissage de formulaires