Compétences pdf-official
📦

pdf-official

Risque faible 📁 Accès au système de fichiers

Traiter et remplir des formulaires PDF avec Claude

Remplir manuellement des formulaires PDF est fastidieux et sujet aux erreurs. Cette compétence permet à Claude d'extraire les champs de formulaire, de valider les mises en page et de peupler les PDFs programmatiquement avec des données précises.

Prend en charge: Claude Codex Code(CC)
🥉 76 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf-official". Vérifier les champs consultables dans employment_application.pdf

Résultat attendu:

12 champs consultables trouvés : first_name (texte), last_name (texte), email (texte), phone (texte), address (texte), city (texte), state (choix), zip (texte), position_applied (texte), available_date (texte), full_time (case à cocher), part_time (case à cocher). Champs répartis sur les pages 1-2.

Utilisation de "pdf-official". Remplir le formulaire avec : first_name=John, last_name=Doe, email=john@example.com

Résultat attendu:

12 champs remplis avec succès dans employment_application.pdf. Sortie enregistrée dans employment_application_filled.pdf. Toutes les valeurs de champ validées par rapport aux types de champ.

Utilisation de "pdf-official". Créer une image de validation pour la page 1 de fields.json

Résultat attendu:

Image de validation créée dans page_1_validation.png avec 24 boîtes englobantes. Les rectangles rouges marquent les zones de saisie de texte, les rectangles bleus marquent les étiquettes. Aucune intersection détectée.

Audit de sécurité

Risque faible
v1 • 2/24/2026

Static analyzer flagged 220 patterns but all are false positives. The 'Ruby backtick' detections are markdown code blocks in documentation, not shell execution. 'Weak crypto' and 'C2 keywords' findings have no basis in actual code. The skill uses legitimate Python PDF libraries (pypdf, pdfplumber, PIL) for expected file operations. No network exfiltration, command injection, or malicious patterns found.

12
Fichiers analysés
1,914
Lignes analysées
2
résultats
1
Total des audits
Problèmes à risque faible (1)
Filesystem Write Operations
Scripts write output PDF and JSON files to disk. This is expected behavior for a PDF manipulation tool but should be noted for sandboxing considerations.
Audité par: claude

Score de qualité

59
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
88
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

Remplissage automatique de formulaires pour le travail administratif

Les employés de bureau peuvent demander à Claude d'extraire les champs de formulaire des demandes d'emploi, formulaires fiscaux ou documents d'inscription, puis de les peupler avec les informations fournies par l'utilisateur de manière précise et cohérente.

Extraction de données PDF pour la recherche

Les chercheurs peuvent extraire des tableaux et des données structurées depuis des PDFs académiques, en les convertissant en format CSV ou Excel pour l'analyse sans copier-coller manuel.

Préparation de documents pour le juridique ou la conformité

Les équipes juridiques peuvent fusionner plusieurs documents PDF, ajouter des filigranes, appliquer des annotations cohérentes et remplir des formulaires standardisés avec des informations spécifiques aux dossiers.

Essayez ces prompts

Base : Vérifier les champs de formulaire PDF
Vérifier si ce PDF a des champs de formulaire consultables : [télécharger PDF]. Exécuter le script check_fillable_fields et indiquer quels champs sont disponibles.
Intermédiaire : Extraire et remplir un formulaire
Extraire les informations de champ de formulaire depuis [input.pdf] vers un fichier JSON, puis le remplir avec ces valeurs : [fournir les valeurs des champs]. Créer le PDF rempli comme [output.pdf].
Avancé : Traitement de formulaire non consultable
Ce PDF n'a pas de champs consultables. Le convertir en images, aider à identifier les boîtes englobantes pour les zones de saisie de texte, créer des images de validation pour vérifier le placement, puis ajouter des annotations pour remplir le formulaire avec [data].
Expert : Opérations PDF en lot
J'ai 50 formulaires PDF qui nécessitent que les mêmes champs soient remplis avec différentes valeurs depuis ce tableur. Extraire la structure de champ une fois, puis traiter tous les PDFs avec leurs lignes de données correspondantes.

Bonnes pratiques

  • Toujours exécuter check_fillable_fields en premier pour déterminer si le PDF a des champs de formulaire interactifs ou nécessite un remplissage par annotation
  • Générer et inspecter visuellement les images de validation avant de finaliser les annotations de formulaire non consultable pour garantir un placement précis du texte
  • Conserver les PDFs originaux comme sauvegardes avant d'exécuter les opérations de remplissage, car le processus crée de nouveaux fichiers de sortie

Éviter

  • Ne pas ignorer l'inspection des images de validation - les erreurs de boîte englobante résultent en du texte apparaissant aux mauvais emplacements
  • Ne pas supposer que tous les PDFs ont des champs consultables - de nombreux formulaires scannés nécessitent une identification manuelle des boîtes englobantes
  • Ne pas utiliser le remplissage par annotation pour les formulaires qui ont de véritables champs de formulaire - utiliser plutôt l'approche par champ consultable

Foire aux questions

Quelle est la différence entre les formulaires PDF consultables et non consultables ?
Les PDFs consultables ont des champs de formulaire interactifs (zones de texte, cases à cocher) qui peuvent être peuplés programmatiquement. Les PDFs non consultables sont des images ou du texte statique qui nécessitent une analyse visuelle pour déterminer où le texte doit être placé comme annotations.
Cette compétence peut-elle gérer les PDFs scannés ou les images ?
Oui, mais cela nécessite l'OCR (pytesseract) pour extraire le texte des documents scannés. La précision dépend de la qualité du scan. Pour remplir des formulaires scannés, le placement par annotation est utilisé.
Quelles bibliothèques Python cette compétence utilise-t-elle ?
Les bibliothèques principales incluent pypdf pour la manipulation PDF, pdfplumber pour l'extraction de texte et de tableaux, et PIL (Pillow) pour le traitement d'images. Optionnel : pytesseract pour l'OCR, pdf2image pour la conversion PDF-vers-image.
Comment valider que les champs de formulaire remplis sont positionnés correctement ?
Pour le remplissage par annotation, utiliser le script create_validation_image qui superpose des rectangles colorés sur les images de votre PDF. Le rouge montre les zones de saisie, le bleu montre les étiquettes. Confirmer visuellement le placement avant de générer le PDF final.
Cette compétence peut-elle fusionner plusieurs PDFs en un seul document ?
Oui, la compétence inclut une fonctionnalité de fusion utilisant pypdf. Vous pouvez combiner plusieurs fichiers PDF dans un ordre spécifié en un seul document de sortie.
Que se passe-t-il si je fournis une valeur de champ invalide pour un champ de formulaire ?
Le script fill_fillable_fields valide les valeurs par rapport aux types de champ. Pour les cases à cocher, il vérifie par rapport aux valeurs coché/décoché. Pour les groupes de boutons radio et les listes déroulantes, il valide par rapport aux options disponibles. Les valeurs invalides font que le script se termine avec un message d'erreur.