PDF-Verarbeitungs-Toolkit
Kuratierte

PDF-Verarbeitungs-Toolkit

Vollständige PDF-Pipeline — Text und Tabellen extrahieren, Formulare ausfüllen, Dokumente zusammenführen und aufteilen, gescannte Seiten per OCR verarbeiten und Vorschauen auf Seitenebene rendern.

3 Skills 3 Installationen
pdfdocument-processingocrformsextractionproductivity
Aktualisiert vor 4 Tagen

Installieren

Führen Sie diesen Befehl aus, um alle Skills in diesem Pack zu installieren:

npx skillstore add @pdf-processing-toolkit

Die CLI erkennt Ordner für Codex und Claude Code automatisch und installiert in beide, wenn sie vorhanden sind.

Übersicht

Nutzungsleitfaden

Detaillierter Leitfaden

## Übersicht

Vollständige PDF-Pipeline — Text und Tabellen extrahieren, Formulare ausfüllen, Dokumente zusammenführen und aufteilen, gescannte Seiten per OCR verarbeiten und Vorschauen auf Seitenebene rendern. Kombiniert drei sich ergänzende Skills für allgemeine, produktionsreife und tiefgehende PDF-Extraktionsworkflows.

## Schnellstart

1. Installieren: `npx skillstore add @pdf-processing-toolkit`
2. Text aus einem PDF extrahieren: Verwende **pdf-analyze**, um Text, Tabellen oder Metadaten aus jedem Dokument zu ziehen
3. Produktionsworkflows handhaben: Verwende **pdf-processing-pro** für OCR, Formularausfüllung, Batch-Verarbeitung und Validierung
4. Tiefgehende Seiteninspektion: Verwende **pdf-page-extract**, um Textspannen pro Seite zu extrahieren, PNG-Vorschauen zu rendern und Seitenmetadaten auszulesen

## Wichtige Befehle

- **pdf-analyze** (21pounder): Textblöcke, Tabellen und Metadaten extrahieren; PDFs erstellen; Dokumente zusammenführen/aufteilen; Formularfelder handhaben — allgemeine PDF-Operationen
- **pdf-processing-pro** (davila7): Produktionsreife PDF-Verarbeitung — OCR für gescannte Dokumente, Formularerkennung und -ausfüllung, Batch-Verarbeitung über mehrere Dateien hinweg, Ausgabevalidierung
- **pdf-page-extract** (abejitsu): Präzision auf Seitenebene — Text mit Positions-/Span-Daten extrahieren, einzelne Seiten als PNG-Bilder rendern, Seitenanzahl und Abmessungen abrufen

## Tipps

- Pipeline: Verwende pdf-page-extract, um Seiten als Bilder zu rendern, und übergib sie dann an ein AI vision model zur strukturierten Datenextraktion
- Große Dokumente per Batch verarbeiten: pdf-processing-pro übernimmt Validierung und Fehlerbehebung über Workflows mit mehreren Dateien hinweg
- Mit ai-media-production-toolkit kombinieren: Erstelle einen PDF-Bericht und rendere anschließend dessen Deckblatt als Bild zum Teilen

Skills

3