📦

pdf

Name: pdf
Author: ZhanlinCui

Baixo Risco 📁 Acesso ao sistema de arquivos⚙️ Comandos externos

Manipular documentos PDF e preencher formulários programaticamente

Também disponível em: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

Tarefas de processamento de PDF requerem ferramentas especializadas para extração, manipulação e preenchimento de formulários. Esta habilidade fornece capacidades abrangentes de manipulação de PDF usando bibliotecas Python e ferramentas de linha de comando.

Suporta: Claude Codex Code(CC)

🥉 75 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "pdf". Extract text from document.pdf

Resultado esperado:

Successfully extracted 2,450 characters from 5 pages. Key sections identified: Executive Summary, Financial Data, Conclusions.

A utilizar "pdf". Merge file1.pdf, file2.pdf, file3.pdf

Resultado esperado:

Created merged.pdf (15 pages total) combining: file1.pdf (3 pages), file2.pdf (7 pages), file3.pdf (5 pages)

A utilizar "pdf". Fill form.pdf with field_values.json

Resultado esperado:

Filled 12 form fields across 2 pages. Output saved to form_filled.pdf with validated field values.

Auditoria de Segurança

Baixo Risco

v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

Arquivos analisados

1,878

Linhas analisadas

achados

Total de auditorias

Problemas de Risco Médio (1)

forms.md:4 reference.md:11 SKILL.md:15

External Command Execution Patterns

Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.

Problemas de Baixo Risco (2)

scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

Filesystem Write Operations

Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.

scripts/extract_form_field_info.py:32 scripts/extract_form_field_info.py:81

Hardcoded Documentation URLs

Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.

Fatores de risco

📁 Acesso ao sistema de arquivos (4)

reference.md:59 scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

⚙️ Comandos externos (5)

forms.md:4 reference.md:11 SKILL.md:15 scripts/check_bounding_boxes.py:6 scripts/extract_form_field_info.py:11

Auditado por: claude

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

Segurança

Conformidade com especificações

O Que Você Pode Construir

Extrair dados de relatórios em PDF

Extrair automaticamente o conteúdo de texto e tabelas de relatórios PDF financeiros ou científicos para análise de dados

Preencher formulários de aplicação em PDF

Preencher programaticamente formulários PDF preenchíveis com dados fornecidos pelo usuário e validação

Processamento em lote de documentos PDF

Mesclar, dividir, girar e adicionar marcas d'água em múltiplos documentos PDF em fluxos de trabalho automatizados

Tente Estes Prompts

Extrair texto de um PDF

Extrair todo o conteúdo de texto do documento PDF anexado e resumir as informações principais.

Mesclar vários PDFs

Combinar estes arquivos PDF em um único documento na ordem: cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf

Preencher um formulário PDF com dados do usuário

Preciso preencher este formulário de inscrição. Primeiro extraia as informações dos campos, depois fornecerei os valores para preencher cada campo.

Extrair tabelas e converter para Excel

Extrair todas as tabelas deste relatório PDF financeiro e salvá-las como uma planilha Excel com folhas separadas para cada tabela

Melhores Práticas

Sempre valide os valores dos campos do formulário PDF antes de preenchê-los para evitar erros
Use configurações de alta resolução (300+ DPI) ao converter PDFs em imagens para OCR
Verifique as interseções das caixas delimitadoras ao adicionar anotações a PDFs não preenchíveis

Evitar

Não pule a validação visual das caixas delimitadoras ao preencher formulários não preenchíveis
Evite processar PDFs protegidos por senha sem primeiro descriptografá-los
Não assuma que todos os PDFs têm texto extraível - PDFs digitalizados requerem OCR

Perguntas Frequentes

Quais bibliotecas Python preciso ter instaladas?

Bibliotecas principais: pypdf, pdfplumber, reportlab. Opcional: pytesseract para OCR, pdf2image para conversão de PDF para imagem. Instale com: pip install pypdf pdfplumber reportlab

Como lidar com PDFs digitalizados sem texto?

PDFs digitalizados requerem processamento de OCR. Use o fluxo de trabalho pytesseract: converta as páginas PDF em imagens com pdf2image, depois aplique pytesseract.image_to_string() para extrair o texto.

Esta habilidade pode preencher formulários PDF que não são preenchíveis?

Sim, adicionando anotações de texto em posições calculadas. O processo envolve converter o PDF em imagens, identificar visualmente os locais dos campos, criar caixas delimitadoras e adicionar anotações.

Quais ferramentas de linha de comando estão disponíveis?

poppler-utils (pdftotext, pdfimages, pdftoppm), qpdf para mesclagem/divisão, e pdftk para operações avançadas. Instale poppler-utils e qpdf através do gerenciador de pacotes do seu sistema.

Como extrair tabelas de PDFs?

Use o método extract_tables() do pdfplumber. Para tabelas complexas, configure table_settings com os parâmetros vertical_strategy e horizontal_strategy para melhor detecção.

Posso processar PDFs criptografados?

Sim, se você tiver a senha. Use o método decrypt() do pypdf ou a opção qpdf --password. Sem a senha, PDFs criptografados não podem ser processados.