Kuratierte

PDF-Verarbeitungs-Toolkit

Vollständige PDF-Pipeline — Text und Tabellen extrahieren, Formulare ausfüllen, Dokumente zusammenführen und aufteilen, gescannte Seiten per OCR verarbeiten und Vorschauen auf Seitenebene rendern.

3 Skills 3 Installationen

pdfdocument-processingocrformsextractionproductivity

Aktualisiert vor 4 Tagen

Installieren

Führen Sie diesen Befehl aus, um alle Skills in diesem Pack zu installieren:

npx skillstore add @pdf-processing-toolkit

Die CLI erkennt Ordner für Codex und Claude Code automatisch und installiert in beide, wenn sie vorhanden sind.

Übersicht

Nutzungsleitfaden

Detaillierter Leitfaden

## Übersicht

Vollständige PDF-Pipeline — Text und Tabellen extrahieren, Formulare ausfüllen, Dokumente zusammenführen und aufteilen, gescannte Seiten per OCR verarbeiten und Vorschauen auf Seitenebene rendern. Kombiniert drei sich ergänzende Skills für allgemeine, produktionsreife und tiefgehende PDF-Extraktionsworkflows.

## Schnellstart

1. Installieren: `npx skillstore add @pdf-processing-toolkit`
2. Text aus einem PDF extrahieren: Verwende **pdf-analyze**, um Text, Tabellen oder Metadaten aus jedem Dokument zu ziehen
3. Produktionsworkflows handhaben: Verwende **pdf-processing-pro** für OCR, Formularausfüllung, Batch-Verarbeitung und Validierung
4. Tiefgehende Seiteninspektion: Verwende **pdf-page-extract**, um Textspannen pro Seite zu extrahieren, PNG-Vorschauen zu rendern und Seitenmetadaten auszulesen

## Wichtige Befehle

- **pdf-analyze** (21pounder): Textblöcke, Tabellen und Metadaten extrahieren; PDFs erstellen; Dokumente zusammenführen/aufteilen; Formularfelder handhaben — allgemeine PDF-Operationen
- **pdf-processing-pro** (davila7): Produktionsreife PDF-Verarbeitung — OCR für gescannte Dokumente, Formularerkennung und -ausfüllung, Batch-Verarbeitung über mehrere Dateien hinweg, Ausgabevalidierung
- **pdf-page-extract** (abejitsu): Präzision auf Seitenebene — Text mit Positions-/Span-Daten extrahieren, einzelne Seiten als PNG-Bilder rendern, Seitenanzahl und Abmessungen abrufen

## Tipps

- Pipeline: Verwende pdf-page-extract, um Seiten als Bilder zu rendern, und übergib sie dann an ein AI vision model zur strukturierten Datenextraktion
- Große Dokumente per Batch verarbeiten: pdf-processing-pro übernimmt Validierung und Fehlerbehebung über Workflows mit mehreren Dateien hinweg
- Mit ai-media-production-toolkit kombinieren: Erstelle einen PDF-Bericht und rendere anschließend dessen Deckblatt als Bild zum Teilen

Skills

📦

pdf-analyze

Hohes Risiko 38

PDF-Dokumente analysieren und bearbeiten

PDF-Workflows erfordern oft mehrere Bibliotheken und eine sorgfältige Formularverarbeitung. Diese Skill bietet Claude, Codex und Claude Code strukturierte Anleitung für lokale PDF-Extraktion, Konvertierung, Bearbeitung und Formularbefüllung.

📊 Office & Berichte von 21pounder ⚡📁⚙️

📦

pdf-processing-pro

Mittleres Risiko 77

PDFs mit Formularen, Tabellen und OCR verarbeiten

Komplexe PDFs erfordern oft Formularanalyse, Tabellenextraktion, OCR und sorgfältige Validierung. Diese Skill bietet Claude, Codex und Claude Code praktische Workflows für lokale PDF-Verarbeitungsaufgaben.

📊 Daten & Analysen von davila7 ⚙️📁🌐

📦

pdf-page-extract

Mittleres Risiko 73

PDF-Textspannen und gerenderte Bilder extrahieren

Extrahiere detaillierte Text- und visuelle Daten aus PDF-Seiten. Diese Skill erfasst Schriftmetadaten, Textpositionen und gerenderte Bilder, um präzise, KI-gesteuerte HTML-Generierungs-Workflows zu ermöglichen.

📊 Daten & Analysen von AbeJitsu ⚙️📁