Boîte à outils de traitement PDF
Sélectionnées

Boîte à outils de traitement PDF

Pipeline PDF complet — extrayez du texte et des tableaux, remplissez des formulaires, fusionnez et divisez des documents, appliquez l’OCR aux pages numérisées, et générez des aperçus au niveau des pages.

3 compétences 3 installations
pdfdocument-processingocrformsextractionproductivity
Mis à jour il y a 4 jours

Installer

Exécutez cette commande pour installer toutes les compétences de ce pack :

npx skillstore add @pdf-processing-toolkit

La CLI détecte automatiquement les dossiers Codex et Claude Code et installe la compétence dans les deux lorsqu’ils sont disponibles.

Aperçu

Guide d’utilisation

Guide détaillé

## Vue d’ensemble

Pipeline PDF complet — extrayez du texte et des tableaux, remplissez des formulaires, fusionnez et divisez des documents, appliquez l’OCR aux pages numérisées, et générez des aperçus au niveau des pages. Combine trois compétences complémentaires pour des workflows PDF généraux, de qualité production et d’extraction approfondie.

## Démarrage rapide

1. Installez : `npx skillstore add @pdf-processing-toolkit`
2. Extrayez le texte d’un PDF : utilisez **pdf-analyze** pour extraire du texte, des tableaux ou des métadonnées de n’importe quel document
3. Gérez les workflows de production : utilisez **pdf-processing-pro** pour l’OCR, le remplissage de formulaires, le traitement par lots et la validation
4. Inspection approfondie des pages : utilisez **pdf-page-extract** pour extraire les segments de texte par page, générer des aperçus PNG et lire les métadonnées des pages

## Commandes clés

- **pdf-analyze** (21pounder) : Extrayez des blocs de texte, des tableaux et des métadonnées ; créez des PDF ; fusionnez/divisez des documents ; gérez les champs de formulaire — opérations PDF polyvalentes
- **pdf-processing-pro** (davila7) : Gestion PDF de qualité production — OCR pour les documents numérisés, détection et remplissage de formulaires, traitement par lots sur plusieurs fichiers, validation de sortie
- **pdf-page-extract** (abejitsu) : Précision au niveau des pages — extrayez le texte avec les données de position/segment, générez des pages individuelles sous forme d’images PNG, récupérez le nombre de pages et les dimensions

## Conseils

- Pipeline : utilisez pdf-page-extract pour générer les pages sous forme d’images, puis transmettez-les à un modèle de vision AI pour l’extraction de données structurées
- Documents volumineux par lots : pdf-processing-pro gère la validation et la récupération d’erreurs dans les workflows multi-fichiers
- Combinez avec ai-media-production-toolkit : générez un rapport PDF, puis générez sa page de couverture sous forme d’image pour le partage

Compétences

3