📄

pdf-analyze

Name: pdf-analyze
Author: 21pounder

Niedriges Risiko ⚙️ Externe Befehle📁 Dateisystemzugriff🌐 Netzwerkzugriff

PDF-Dokumente zur Extraktion und Formularausfüllung verarbeiten

Auch verfügbar von: 21pounder

PDF-Dokumente enthalten oft wichtige Daten, die programmatisch schwer zugänglich sind. Diese Fähigkeit bietet Claude umfassende Werkzeuge zum Extrahieren von Text und Tabellen, Ausfüllen von Formularen, Zusammenführen von Dokumenten und Konvertieren von PDFs in Bilder zur Analyse.

Unterstützt: Claude Codex Code(CC)

🥉 73 Bronze

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "pdf-analyze". Extract text from report.pdf and list all tables found

Erwartetes Ergebnis:

Extracted 24 pages from report.pdf
Found 5 tables:
- Table 1: 'Revenue by Region' (page 3)
- Table 2: 'Q4 Performance Metrics' (page 7)
- Table 3: 'Customer Demographics' (page 12)
- Table 4: 'Year-over-Year Growth' (page 18)
- Table 5: 'Projected 2025 Targets' (page 22)
Saved extracted_text.txt (45 KB) and tables to tables_20250110.xlsx

Sicherheitsaudit

Niedriges Risiko

v3 • 1/16/2026

This is a legitimate PDF processing toolkit. The static analyzer flagged 173 potential issues, but ALL are false positives. The 'Ruby/shell backtick execution' patterns are Markdown code formatting delimiters, not actual command execution. 'Weak cryptographic algorithm' detections are test fixture data with hash-like strings, not crypto operations. 'C2 keywords' refers to 'encrypt' in PDF password documentation. No network exfiltration, credential theft, or obfuscation patterns exist. The skill's behavior fully aligns with its stated purpose.

Gescannte Dateien

1,729

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (104)

FORMS.md:4 FORMS.md:8 FORMS.md:9-52 FORMS.md:52-54 FORMS.md:54-56 FORMS.md:56-57 FORMS.md:57-60 FORMS.md:60-73 FORMS.md:73-74 FORMS.md:74-75 FORMS.md:75-87 FORMS.md:87-94 FORMS.md:94-98 FORMS.md:98-102 FORMS.md:102-104 FORMS.md:104-108 FORMS.md:108-111 FORMS.md:111-115 FORMS.md:115-118 FORMS.md:118-122 FORMS.md:122-124 FORMS.md:124-131 FORMS.md:131-132 FORMS.md:132-177 FORMS.md:177-180 FORMS.md:186 FORMS.md:187 REFERENCE.md:11-34 REFERENCE.md:34-37 REFERENCE.md:37-44 REFERENCE.md:44-53 REFERENCE.md:53-64 REFERENCE.md:64-78 REFERENCE.md:78-81 REFERENCE.md:81-139 REFERENCE.md:139-145 REFERENCE.md:145-149 REFERENCE.md:149-151 REFERENCE.md:151-154 REFERENCE.md:154-162 REFERENCE.md:162-178 REFERENCE.md:178-183 REFERENCE.md:183-193 REFERENCE.md:193-196 REFERENCE.md:196-200 REFERENCE.md:200-203 REFERENCE.md:203-214 scripts/check_bounding_boxes.py:6 scripts/check_bounding_boxes.py:41 scripts/check_bounding_boxes.py:43 scripts/check_bounding_boxes.py:43 scripts/check_bounding_boxes.py:53 scripts/check_bounding_boxes.py:66 scripts/convert_pdf_to_images.py:14 scripts/create_validation_image.py:12 scripts/extract_form_field_info.py:11 scripts/extract_form_field_info.py:11 scripts/extract_form_field_info.py:38 scripts/fill_fillable_fields.py:34 scripts/fill_fillable_fields.py:37 scripts/fill_fillable_fields.py:84 scripts/fill_fillable_fields.py:86 scripts/fill_fillable_fields.py:87 scripts/fill_fillable_fields.py:88 scripts/fill_fillable_fields.py:89 scripts/fill_pdf_form_with_annotations.py:8 scripts/fill_pdf_form_with_annotations.py:31 SKILL.md:15-26 SKILL.md:26-33 SKILL.md:33-44 SKILL.md:44-47 SKILL.md:47-54 SKILL.md:54-57 SKILL.md:57-64 SKILL.md:64-67 SKILL.md:67-77 SKILL.md:77-82 SKILL.md:82-89 SKILL.md:89-92 SKILL.md:92-100 SKILL.md:100-103 SKILL.md:103-119 SKILL.md:119-124 SKILL.md:124-140 SKILL.md:140-143 SKILL.md:143-167 SKILL.md:167-172 SKILL.md:172-181 SKILL.md:181-184 SKILL.md:184-197 SKILL.md:197-200 SKILL.md:200-209 SKILL.md:209-214 SKILL.md:214-230 SKILL.md:230-233 SKILL.md:233-249 SKILL.md:249-252 SKILL.md:252-257 SKILL.md:257-260 SKILL.md:260-274 SKILL.md:274-280 SKILL.md:280-282 SKILL.md:282-283 SKILL.md:283-285

📁 Dateisystemzugriff (16)

REFERENCE.md:59 REFERENCE.md:76 REFERENCE.md:137 REFERENCE.md:59 REFERENCE.md:76 REFERENCE.md:137 REFERENCE.md:176 scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93 skill-report.json:6 SKILL.md:42 SKILL.md:52 SKILL.md:75 SKILL.md:247 SKILL.md:272

🌐 Netzwerkzugriff (4)

scripts/extract_form_field_info.py:32 scripts/extract_form_field_info.py:81 scripts/fill_pdf_form_with_annotations.py:78 skill-report.json:6

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Tabellen aus Berichten extrahieren

Strukturierte Daten aus Finanzberichten, Forschungsarbeiten und statistischen Dokumenten in CSV- oder Excel-Format extrahieren.

Formularausfüllung automatisieren

PDF-Formulare programmatisch mit validierten Daten für Anträge, Umfragen und offizielle Dokumente ausfüllen.

PDF-Verarbeitungs-Workflows erstellen

Dokumentenverarbeitungs-Pipelines erstellen, die PDFs für Anwendungen und Dienste zusammenführen, aufteilen und transformieren.

Probiere diese Prompts

PDF-Text extrahieren

Extract all text from document.pdf using pdfplumber and save it to extracted_text.txt

Formularfelder auflisten

Check if application_form.pdf has fillable form fields, and if so, list all field names and types

Tabellen extrahieren

Extract all tables from quarterly_report.pdf and save them to an Excel file with one sheet per table

PDF-Formular ausfüllen

Fill in the following fields in application_form.pdf using data from field_values.json and save to completed_form.pdf

Bewährte Verfahren

Formularfeldwerte vor der Übermittlung validieren, um Fehler frühzeitig zu erkennen
PDF zuerst in Bilder konvertieren, wenn mit nicht-ausfüllbaren Formularen gearbeitet wird, um die Annotationsplatzierung visuell zu überprüfen
Das Bounding-Box-Validierungsskript verwenden, um sicherzustellen, dass Annotationen vorhandene Inhalte nicht überlappen oder verdecken

Vermeiden

Den Formularfeldvalidierungsschritt vor dem Ausfüllen von PDFs überspringen
Nicht-ausfüllbare PDFs nicht zuerst zur visuellen Analyse in Bilder konvertieren
Feste Dateipfade anstelle von Parametern für die Wiederverwendbarkeit verwenden

Häufig gestellte Fragen

Welche Python-Bibliotheken verwendet diese Fähigkeit?

Primäre Bibliotheken sind pypdf für grundlegende Operationen, pdfplumber für Text- und Tabellenextrahierung und reportlab für das Erstellen neuer PDFs.

Was sind die Systemanforderungen?

Erfordert Python 3.8+ mit pip install von pypdf, pdfplumber, reportlab, pdf2image und PIL. Poppler muss für die PDF-zu-Bild-Konvertierung installiert sein.

Wie fülle ich ein gescanntes PDF aus, das nicht ausfüllbar ist?

Verwenden Sie den Workflow für nicht-ausfüllbare Formulare: PDF in Bilder konvertieren, Texteingabepositionen manuell bestimmen, fields.json mit Bounding-Boxen erstellen, dann fill_pdf_form_with_annotations.py verwenden.

Sind meine Daten bei der PDF-Verarbeitung sicher?

Ja. Die gesamte Verarbeitung erfolgt lokal mit Python-Bibliotheken. Es werden keine Daten an externe Server gesendet. Dateien werden nur von und zu Pfaden gelesen und geschrieben, die Sie angeben.

Warum werden meine ausgefüllten PDFs mit Annotationen an der falschen Position angezeigt?

Dies deutet normalerweise auf eine falsche Koordinatentransformation hin. PDF-Koordinaten beginnen unten links, während Bildkoordinaten oben links beginnen. Überprüfen Sie Ihre Bounding-Box-Konvertierungslogik.

Wie unterscheidet sich dies von der Verwendung von pdf-lib in JavaScript?

Die Python-Werkzeuge bieten ausgereiftere Textextraktion und Tabellenanalyse. pdf-lib eignet sich besser für Browser-Umgebungen oder Node.js-Projekte, die PDFs clientseitig erstellen oder bearbeiten müssen.