Manipuler les documents PDF et remplir des formulaires par programmation
Également disponible depuis: 92Bilal26,92Bilal26,davila7,ArtemisAI,AutumnsGrove,Azeem-2,DYAI2025,anthropics,K-Dense-AI,ComposioHQ,Cam10001110101
Les tâches de traitement PDF nécessitent des outils spécialisés pour l'extraction, la manipulation et le remplissage de formulaires. Cette compétence offre des capacités complètes de manipulation de PDF en utilisant des bibliothèques Python et des outils en ligne de commande.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "pdf". Extract text from document.pdf
Résultat attendu:
Successfully extracted 2,450 characters from 5 pages. Key sections identified: Executive Summary, Financial Data, Conclusions.
Utilisation de "pdf". Merge file1.pdf, file2.pdf, file3.pdf
Résultat attendu:
Created merged.pdf (15 pages total) combining: file1.pdf (3 pages), file2.pdf (7 pages), file3.pdf (5 pages)
Utilisation de "pdf". Fill form.pdf with field_values.json
Résultat attendu:
Filled 12 form fields across 2 pages. Output saved to form_filled.pdf with validated field values.
Audit de sécurité
Risque faibleStatic analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.
Problèmes à risque moyen (1)
Problèmes à risque faible (2)
Facteurs de risque
📁 Accès au système de fichiers (4)
⚙️ Commandes externes (5)
Score de qualité
Ce que vous pouvez construire
Extraire des données des rapports PDF
Extraire automatiquement le contenu textuel et les tableaux des rapports PDF financiers ou scientifiques pour l'analyse de données
Remplir les formulaires de demande PDF
Compléter programmatiquement les formulaires PDF remplissables avec les données fournies par l'utilisateur et la validation
Traitement par lots de documents PDF
Fusionner, diviser, faire pivoter et filigraner plusieurs documents PDF dans des flux de travail automatisés
Essayez ces prompts
Extraire tout le contenu textuel du document PDF joint et résumer les informations clés.
Combiner ces fichiers PDF en un seul document dans l'ordre : cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf
Je dois remplir ce formulaire de demande. Extrayez d'abord les informations des champs, puis je vous fournirai les valeurs pour chaque champ.
Extraire tous les tableaux de ce rapport financier PDF et les enregistrer dans un tableur Excel avec des feuilles séparées pour chaque tableau
Bonnes pratiques
- Val toujours les valeurs des champs de formulaire PDF avant de les remplir pour éviter les erreurs
- Utilisez des paramètres haute résolution (300+ DPI) lors de la conversion des PDF en images pour l'OCR
- Vérifiez les intersections des boîtes englobantes lors de l'ajout d'annotations aux PDF non remplissables
Éviter
- Ne sautez pas la validation visuelle des boîtes englobantes lors du remplissage de formulaires non remplissables
- Évitez de traiter les PDF protégés par mot de passe sans les déchiffrer d'abord
- Ne supposez pas que tous les PDF ont du texte extractible - les PDF numérisés nécessitent l'OCR
Foire aux questions
Quelles bibliothèques Python dois-je installer ?
Comment gérer les PDF numérisés sans texte ?
Cette compétence peut-elle remplir des formulaires PDF qui ne sont pas remplissables ?
Quels outils en ligne de commande sont disponibles ?
Comment extraire les tableaux des PDF ?
Puis-je traiter les PDF chiffrés ?
Détails du développeur
Structure de fichiers