Compétences pdf-analyze
📄

pdf-analyze

Risque faible ⚙️ Commandes externes📁 Accès au système de fichiers🌐 Accès réseau

PDF-Dokumente zur Extraktion und Formularausfüllung verarbeiten

Également disponible depuis: 21pounder

PDF-Dokumente enthalten oft wichtige Daten, die programmatisch schwer zugänglich sind. Diese Fähigkeit bietet Claude umfassende Werkzeuge zum Extrahieren von Text und Tabellen, Ausfüllen von Formularen, Zusammenführen von Dokumenten und Konvertieren von PDFs in Bilder zur Analyse.

Prend en charge: Claude Codex Code(CC)
🥉 73 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf-analyze". Extract text from report.pdf and list all tables found

Résultat attendu:

  • Extracted 24 pages from report.pdf
  • Found 5 tables:
  • - Table 1: 'Revenue by Region' (page 3)
  • - Table 2: 'Q4 Performance Metrics' (page 7)
  • - Table 3: 'Customer Demographics' (page 12)
  • - Table 4: 'Year-over-Year Growth' (page 18)
  • - Table 5: 'Projected 2025 Targets' (page 22)
  • Saved extracted_text.txt (45 KB) and tables to tables_20250110.xlsx

Audit de sécurité

Risque faible
v3 • 1/16/2026

This is a legitimate PDF processing toolkit. The static analyzer flagged 173 potential issues, but ALL are false positives. The 'Ruby/shell backtick execution' patterns are Markdown code formatting delimiters, not actual command execution. 'Weak cryptographic algorithm' detections are test fixture data with hash-like strings, not crypto operations. 'C2 keywords' refers to 'encrypt' in PDF password documentation. No network exfiltration, credential theft, or obfuscation patterns exist. The skill's behavior fully aligns with its stated purpose.

12
Fichiers analysés
1,729
Lignes analysées
3
résultats
3
Total des audits

Facteurs de risque

⚙️ Commandes externes (104)
FORMS.md:4 FORMS.md:8 FORMS.md:9-52 FORMS.md:52-54 FORMS.md:54-56 FORMS.md:56-57 FORMS.md:57-60 FORMS.md:60-73 FORMS.md:73-74 FORMS.md:74-75 FORMS.md:75-87 FORMS.md:87-94 FORMS.md:94-98 FORMS.md:98-102 FORMS.md:102-104 FORMS.md:104-108 FORMS.md:108-111 FORMS.md:111-115 FORMS.md:115-118 FORMS.md:118-122 FORMS.md:122-124 FORMS.md:124-131 FORMS.md:131-132 FORMS.md:132-177 FORMS.md:177-180 FORMS.md:186 FORMS.md:187 REFERENCE.md:11-34 REFERENCE.md:34-37 REFERENCE.md:37-44 REFERENCE.md:44-53 REFERENCE.md:53-64 REFERENCE.md:64-78 REFERENCE.md:78-81 REFERENCE.md:81-139 REFERENCE.md:139-145 REFERENCE.md:145-149 REFERENCE.md:149-151 REFERENCE.md:151-154 REFERENCE.md:154-162 REFERENCE.md:162-178 REFERENCE.md:178-183 REFERENCE.md:183-193 REFERENCE.md:193-196 REFERENCE.md:196-200 REFERENCE.md:200-203 REFERENCE.md:203-214 scripts/check_bounding_boxes.py:6 scripts/check_bounding_boxes.py:41 scripts/check_bounding_boxes.py:43 scripts/check_bounding_boxes.py:43 scripts/check_bounding_boxes.py:53 scripts/check_bounding_boxes.py:66 scripts/convert_pdf_to_images.py:14 scripts/create_validation_image.py:12 scripts/extract_form_field_info.py:11 scripts/extract_form_field_info.py:11 scripts/extract_form_field_info.py:38 scripts/fill_fillable_fields.py:34 scripts/fill_fillable_fields.py:37 scripts/fill_fillable_fields.py:84 scripts/fill_fillable_fields.py:86 scripts/fill_fillable_fields.py:87 scripts/fill_fillable_fields.py:88 scripts/fill_fillable_fields.py:89 scripts/fill_pdf_form_with_annotations.py:8 scripts/fill_pdf_form_with_annotations.py:31 SKILL.md:15-26 SKILL.md:26-33 SKILL.md:33-44 SKILL.md:44-47 SKILL.md:47-54 SKILL.md:54-57 SKILL.md:57-64 SKILL.md:64-67 SKILL.md:67-77 SKILL.md:77-82 SKILL.md:82-89 SKILL.md:89-92 SKILL.md:92-100 SKILL.md:100-103 SKILL.md:103-119 SKILL.md:119-124 SKILL.md:124-140 SKILL.md:140-143 SKILL.md:143-167 SKILL.md:167-172 SKILL.md:172-181 SKILL.md:181-184 SKILL.md:184-197 SKILL.md:197-200 SKILL.md:200-209 SKILL.md:209-214 SKILL.md:214-230 SKILL.md:230-233 SKILL.md:233-249 SKILL.md:249-252 SKILL.md:252-257 SKILL.md:257-260 SKILL.md:260-274 SKILL.md:274-280 SKILL.md:280-282 SKILL.md:282-283 SKILL.md:283-285
📁 Accès au système de fichiers (16)
🌐 Accès réseau (4)

Score de qualité

59
Architecture
100
Maintenabilité
83
Contenu
22
Communauté
90
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Tabellen aus Berichten extrahieren

Strukturierte Daten aus Finanzberichten, Forschungsarbeiten und statistischen Dokumenten in CSV- oder Excel-Format extrahieren.

Formularausfüllung automatisieren

PDF-Formulare programmatisch mit validierten Daten für Anträge, Umfragen und offizielle Dokumente ausfüllen.

PDF-Verarbeitungs-Workflows erstellen

Dokumentenverarbeitungs-Pipelines erstellen, die PDFs für Anwendungen und Dienste zusammenführen, aufteilen und transformieren.

Essayez ces prompts

PDF-Text extrahieren
Extract all text from document.pdf using pdfplumber and save it to extracted_text.txt
Formularfelder auflisten
Check if application_form.pdf has fillable form fields, and if so, list all field names and types
Tabellen extrahieren
Extract all tables from quarterly_report.pdf and save them to an Excel file with one sheet per table
PDF-Formular ausfüllen
Fill in the following fields in application_form.pdf using data from field_values.json and save to completed_form.pdf

Bonnes pratiques

  • Formularfeldwerte vor der Übermittlung validieren, um Fehler frühzeitig zu erkennen
  • PDF zuerst in Bilder konvertieren, wenn mit nicht-ausfüllbaren Formularen gearbeitet wird, um die Annotationsplatzierung visuell zu überprüfen
  • Das Bounding-Box-Validierungsskript verwenden, um sicherzustellen, dass Annotationen vorhandene Inhalte nicht überlappen oder verdecken

Éviter

  • Den Formularfeldvalidierungsschritt vor dem Ausfüllen von PDFs überspringen
  • Nicht-ausfüllbare PDFs nicht zuerst zur visuellen Analyse in Bilder konvertieren
  • Feste Dateipfade anstelle von Parametern für die Wiederverwendbarkeit verwenden

Foire aux questions

Welche Python-Bibliotheken verwendet diese Fähigkeit?
Primäre Bibliotheken sind pypdf für grundlegende Operationen, pdfplumber für Text- und Tabellenextrahierung und reportlab für das Erstellen neuer PDFs.
Was sind die Systemanforderungen?
Erfordert Python 3.8+ mit pip install von pypdf, pdfplumber, reportlab, pdf2image und PIL. Poppler muss für die PDF-zu-Bild-Konvertierung installiert sein.
Wie fülle ich ein gescanntes PDF aus, das nicht ausfüllbar ist?
Verwenden Sie den Workflow für nicht-ausfüllbare Formulare: PDF in Bilder konvertieren, Texteingabepositionen manuell bestimmen, fields.json mit Bounding-Boxen erstellen, dann fill_pdf_form_with_annotations.py verwenden.
Sind meine Daten bei der PDF-Verarbeitung sicher?
Ja. Die gesamte Verarbeitung erfolgt lokal mit Python-Bibliotheken. Es werden keine Daten an externe Server gesendet. Dateien werden nur von und zu Pfaden gelesen und geschrieben, die Sie angeben.
Warum werden meine ausgefüllten PDFs mit Annotationen an der falschen Position angezeigt?
Dies deutet normalerweise auf eine falsche Koordinatentransformation hin. PDF-Koordinaten beginnen unten links, während Bildkoordinaten oben links beginnen. Überprüfen Sie Ihre Bounding-Box-Konvertierungslogik.
Wie unterscheidet sich dies von der Verwendung von pdf-lib in JavaScript?
Die Python-Werkzeuge bieten ausgereiftere Textextraktion und Tabellenanalyse. pdf-lib eignet sich besser für Browser-Umgebungen oder Node.js-Projekte, die PDFs clientseitig erstellen oder bearbeiten müssen.