📄

pdf

Name: pdf
Author: ArtemisAI

Baixo Risco ⚡ Contém scripts📁 Acesso ao sistema de arquivos

Processar documentos PDF

Também disponível em: sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

Documentos PDF exigem ferramentas especializadas para extração, modificação e preenchimento de formulários. Esta skill oferece capacidades abrangentes de processamento de PDF, incluindo extração de texto, detecção de tabelas, junção e divisão de documentos e manipulação de campos de formulários usando bibliotecas Python.

Suporta: Claude Codex Code(CC)

🥉 72 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "pdf". Extract text from report.pdf

Resultado esperado:

Extraídas 15 páginas de report.pdf
Texto salvo em report.txt (45,230 caracteres)
Encontradas 3 tabelas nas páginas 5, 8 e 12

A utilizar "pdf". Merge all invoices into one file

Resultado esperado:

Combinados 12 arquivos PDF em merged_invoices.pdf
Total de páginas: 48
Usado pypdf para a junção de documentos

A utilizar "pdf". Fill out the application form

Resultado esperado:

Identificados 8 campos de formulário preenchíveis
Todos os campos preenchidos com os dados fornecidos
Salvo em completed_application.pdf

Auditoria de Segurança

Baixo Risco

v5 • 1/16/2026

This is a legitimate PDF manipulation skill containing 8 Python scripts for document processing. The 227 static findings are false positives: documentation examples showing command syntax are not actual shell execution; legitimate file I/O uses standard PDF libraries (pypdf, pdfplumber); cryptographic references are for PDF password protection; and flagged keywords like 'command' appear only in documentation context. No network calls, no command injection, no credential handling.

Arquivos analisados

2,233

Linhas analisadas

achados

Total de auditorias

Problemas de Baixo Risco (1)

scripts/fill_fillable_fields.py:12

User-specified file paths accessed

Scripts accept file paths as command-line arguments for PDF processing. Expected behavior for document tools.

Fatores de risco

⚡ Contém scripts (3)

scripts/fill_fillable_fields.py:1-115 scripts/check_bounding_boxes.py:1-71 scripts/extract_form_field_info.py:1-153

📁 Acesso ao sistema de arquivos (2)

scripts/fill_fillable_fields.py:12-56 scripts/extract_form_field_info.py:140-145

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

Segurança

Conformidade com especificações

O Que Você Pode Construir

Automatizar o preenchimento de formulários

Preencher formulários PDF programaticamente usando informações de campos extraídas e verificações de validação

Extrair dados estruturados

Extrair tabelas e texto de relatórios em PDF para análise em planilhas e processamento de dados

Organizar coleções de documentos

Juntar, dividir e reorganizar documentos PDF para fluxos de trabalho eficientes de gestão de arquivos

Tente Estes Prompts

Extrair texto de PDF

Extract all text from document.pdf and save it to a text file

Juntar PDFs

Merge report1.pdf, report2.pdf, and report3.pdf into quarterly_report.pdf

Preencher formulários PDF

Fill in application_form.pdf with the following data: name=John Smith, email=john@example.com, and save the completed form

Processar lotes de documentos

Extract tables from all PDFs in the /invoices directory and save each to a separate CSV file

Melhores Práticas

Validar arquivos PDF antes do processamento para lidar com documentos corrompidos ou criptografados de forma adequada
Usar validação de caixas delimitadoras ao preencher formulários PDF não preenchíveis para garantir posicionamento preciso
Processar PDFs grandes em partes para gerenciar o uso de memória de forma eficaz

Evitar

Tentar processar PDFs protegidos por senha sem primeiro obter a senha
Ignorar a validação de caixas delimitadoras ao preencher formulários PDF não preenchíveis
Processar PDFs extremamente grandes sem particionamento ou gerenciamento de memória

Perguntas Frequentes

Quais bibliotecas Python são necessárias?

Instale pypdf, pdfplumber, reportlab e pdf2image usando pip. Recursos de OCR precisam do pytesseract.

Quais são os limites de tamanho para processamento de PDFs?

O desempenho depende da memória disponível. Documentos muito grandes devem ser processados em seções.

Esta skill pode se integrar a outras ferramentas?

Sim, scripts Python podem ser chamados de qualquer ferramenta de IA ou integrados a fluxos de trabalho maiores de processamento de documentos.

Os dados dos PDFs são armazenados ou transmitidos?

Não. Todo o processamento ocorre localmente. Os arquivos são lidos e gravados nos caminhos que você especificar.

Por que o preenchimento do formulário falhou?

Causas comuns incluem: PDF criptografado, campos de formulário não detectados corretamente ou sobreposição de caixas delimitadoras.

Como isso se compara a ferramentas online de PDF?

Esta skill roda localmente para privacidade, lida com operações em lote e pode ser automatizada em fluxos de trabalho de IA.

Detalhes do Desenvolvedor

Autor

ArtemisAI

Licença

Proprietary. LICENSE.txt has complete terms

Repositório

https://github.com/ArtemisAI/code-execution-with-MCP/tree/main/skills/document-skills/pdf

Referência

main

Estrutura de arquivos

📁 scripts/

📄 check_bounding_boxes_test.py

📄 check_bounding_boxes.py

📄 check_fillable_fields.py

📄 convert_pdf_to_images.py

📄 create_validation_image.py

📄 extract_form_field_info.py

📄 fill_fillable_fields.py

📄 fill_pdf_form_with_annotations.py

📄 forms.md

📄 LICENSE.txt

📄 reference.md

📄 SKILL.md