📦

pdf

Baixo Risco 📁 Acesso ao sistema de arquivos⚙️ Comandos externos

Manipular documentos PDF e preencher formulários programaticamente

Também disponível em: 92Bilal26,92Bilal26,davila7,ArtemisAI,AutumnsGrove,Azeem-2,DYAI2025,anthropics,K-Dense-AI,ComposioHQ,Cam10001110101

Tarefas de processamento de PDF requerem ferramentas especializadas para extração, manipulação e preenchimento de formulários. Esta habilidade fornece capacidades abrangentes de manipulação de PDF usando bibliotecas Python e ferramentas de linha de comando.

Suporta: Claude Codex Code(CC)
🥉 76 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "pdf". Extract text from document.pdf

Resultado esperado:

Successfully extracted 2,450 characters from 5 pages. Key sections identified: Executive Summary, Financial Data, Conclusions.

A utilizar "pdf". Merge file1.pdf, file2.pdf, file3.pdf

Resultado esperado:

Created merged.pdf (15 pages total) combining: file1.pdf (3 pages), file2.pdf (7 pages), file3.pdf (5 pages)

A utilizar "pdf". Fill form.pdf with field_values.json

Resultado esperado:

Filled 12 form fields across 2 pages. Output saved to form_filled.pdf with validated field values.

Auditoria de Segurança

Baixo Risco
v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

11
Arquivos analisados
1,878
Linhas analisadas
5
achados
1
Total de auditorias
Problemas de Risco Médio (1)
External Command Execution Patterns
Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.
Problemas de Baixo Risco (2)
Filesystem Write Operations
Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.
Hardcoded Documentation URLs
Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.
Auditado por: claude

Pontuação de qualidade

59
Arquitetura
100
Manutenibilidade
87
Conteúdo
50
Comunidade
81
Segurança
91
Conformidade com especificações

O Que Você Pode Construir

Extrair dados de relatórios em PDF

Extrair automaticamente o conteúdo de texto e tabelas de relatórios PDF financeiros ou científicos para análise de dados

Preencher formulários de aplicação em PDF

Preencher programaticamente formulários PDF preenchíveis com dados fornecidos pelo usuário e validação

Processamento em lote de documentos PDF

Mesclar, dividir, girar e adicionar marcas d'água em múltiplos documentos PDF em fluxos de trabalho automatizados

Tente Estes Prompts

Extrair texto de um PDF
Extrair todo o conteúdo de texto do documento PDF anexado e resumir as informações principais.
Mesclar vários PDFs
Combinar estes arquivos PDF em um único documento na ordem: cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf
Preencher um formulário PDF com dados do usuário
Preciso preencher este formulário de inscrição. Primeiro extraia as informações dos campos, depois fornecerei os valores para preencher cada campo.
Extrair tabelas e converter para Excel
Extrair todas as tabelas deste relatório PDF financeiro e salvá-las como uma planilha Excel com folhas separadas para cada tabela

Melhores Práticas

  • Sempre valide os valores dos campos do formulário PDF antes de preenchê-los para evitar erros
  • Use configurações de alta resolução (300+ DPI) ao converter PDFs em imagens para OCR
  • Verifique as interseções das caixas delimitadoras ao adicionar anotações a PDFs não preenchíveis

Evitar

  • Não pule a validação visual das caixas delimitadoras ao preencher formulários não preenchíveis
  • Evite processar PDFs protegidos por senha sem primeiro descriptografá-los
  • Não assuma que todos os PDFs têm texto extraível - PDFs digitalizados requerem OCR

Perguntas Frequentes

Quais bibliotecas Python preciso ter instaladas?
Bibliotecas principais: pypdf, pdfplumber, reportlab. Opcional: pytesseract para OCR, pdf2image para conversão de PDF para imagem. Instale com: pip install pypdf pdfplumber reportlab
Como lidar com PDFs digitalizados sem texto?
PDFs digitalizados requerem processamento de OCR. Use o fluxo de trabalho pytesseract: converta as páginas PDF em imagens com pdf2image, depois aplique pytesseract.image_to_string() para extrair o texto.
Esta habilidade pode preencher formulários PDF que não são preenchíveis?
Sim, adicionando anotações de texto em posições calculadas. O processo envolve converter o PDF em imagens, identificar visualmente os locais dos campos, criar caixas delimitadoras e adicionar anotações.
Quais ferramentas de linha de comando estão disponíveis?
poppler-utils (pdftotext, pdfimages, pdftoppm), qpdf para mesclagem/divisão, e pdftk para operações avançadas. Instale poppler-utils e qpdf através do gerenciador de pacotes do seu sistema.
Como extrair tabelas de PDFs?
Use o método extract_tables() do pdfplumber. Para tabelas complexas, configure table_settings com os parâmetros vertical_strategy e horizontal_strategy para melhor detecção.
Posso processar PDFs criptografados?
Sim, se você tiver a senha. Use o método decrypt() do pypdf ou a opção qpdf --password. Sem a senha, PDFs criptografados não podem ser processados.