📦

pdf

Risque faible 📁 Accès au système de fichiers⚙️ Commandes externes

Manipular documentos PDF e preencher formulários programaticamente

Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ComposioHQ,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI,AutumnsGrove

Tarefas de processamento de PDF requerem ferramentas especializadas para extração, manipulação e preenchimento de formulários. Esta habilidade fornece capacidades abrangentes de manipulação de PDF usando bibliotecas Python e ferramentas de linha de comando.

Prend en charge: Claude Codex Code(CC)
🥉 75 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf". Extract text from document.pdf

Résultat attendu:

Successfully extracted 2,450 characters from 5 pages. Key sections identified: Executive Summary, Financial Data, Conclusions.

Utilisation de "pdf". Merge file1.pdf, file2.pdf, file3.pdf

Résultat attendu:

Created merged.pdf (15 pages total) combining: file1.pdf (3 pages), file2.pdf (7 pages), file3.pdf (5 pages)

Utilisation de "pdf". Fill form.pdf with field_values.json

Résultat attendu:

Filled 12 form fields across 2 pages. Output saved to form_filled.pdf with validated field values.

Audit de sécurité

Risque faible
v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

11
Fichiers analysés
1,878
Lignes analysées
5
résultats
1
Total des audits
Problèmes à risque moyen (1)
External Command Execution Patterns
Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.
Problèmes à risque faible (2)
Filesystem Write Operations
Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.
Hardcoded Documentation URLs
Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.
Audité par: claude

Score de qualité

59
Architecture
100
Maintenabilité
87
Contenu
45
Communauté
81
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Extrair dados de relatórios em PDF

Extrair automaticamente o conteúdo de texto e tabelas de relatórios PDF financeiros ou científicos para análise de dados

Preencher formulários de aplicação em PDF

Preencher programaticamente formulários PDF preenchíveis com dados fornecidos pelo usuário e validação

Processamento em lote de documentos PDF

Mesclar, dividir, girar e adicionar marcas d'água em múltiplos documentos PDF em fluxos de trabalho automatizados

Essayez ces prompts

Extrair texto de um PDF
Extrair todo o conteúdo de texto do documento PDF anexado e resumir as informações principais.
Mesclar vários PDFs
Combinar estes arquivos PDF em um único documento na ordem: cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf
Preencher um formulário PDF com dados do usuário
Preciso preencher este formulário de inscrição. Primeiro extraia as informações dos campos, depois fornecerei os valores para preencher cada campo.
Extrair tabelas e converter para Excel
Extrair todas as tabelas deste relatório PDF financeiro e salvá-las como uma planilha Excel com folhas separadas para cada tabela

Bonnes pratiques

  • Sempre valide os valores dos campos do formulário PDF antes de preenchê-los para evitar erros
  • Use configurações de alta resolução (300+ DPI) ao converter PDFs em imagens para OCR
  • Verifique as interseções das caixas delimitadoras ao adicionar anotações a PDFs não preenchíveis

Éviter

  • Não pule a validação visual das caixas delimitadoras ao preencher formulários não preenchíveis
  • Evite processar PDFs protegidos por senha sem primeiro descriptografá-los
  • Não assuma que todos os PDFs têm texto extraível - PDFs digitalizados requerem OCR

Foire aux questions

Quais bibliotecas Python preciso ter instaladas?
Bibliotecas principais: pypdf, pdfplumber, reportlab. Opcional: pytesseract para OCR, pdf2image para conversão de PDF para imagem. Instale com: pip install pypdf pdfplumber reportlab
Como lidar com PDFs digitalizados sem texto?
PDFs digitalizados requerem processamento de OCR. Use o fluxo de trabalho pytesseract: converta as páginas PDF em imagens com pdf2image, depois aplique pytesseract.image_to_string() para extrair o texto.
Esta habilidade pode preencher formulários PDF que não são preenchíveis?
Sim, adicionando anotações de texto em posições calculadas. O processo envolve converter o PDF em imagens, identificar visualmente os locais dos campos, criar caixas delimitadoras e adicionar anotações.
Quais ferramentas de linha de comando estão disponíveis?
poppler-utils (pdftotext, pdfimages, pdftoppm), qpdf para mesclagem/divisão, e pdftk para operações avançadas. Instale poppler-utils e qpdf através do gerenciador de pacotes do seu sistema.
Como extrair tabelas de PDFs?
Use o método extract_tables() do pdfplumber. Para tabelas complexas, configure table_settings com os parâmetros vertical_strategy e horizontal_strategy para melhor detecção.
Posso processar PDFs criptografados?
Sim, se você tiver a senha. Use o método decrypt() do pypdf ou a opção qpdf --password. Sem a senha, PDFs criptografados não podem ser processados.