pdf

Name: pdf
Author: davila7

Seguro 📁 Acesso ao sistema de arquivos⚡ Contém scripts

Processar documentos PDF com eficiência

Também disponível em: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,AutumnsGrove,DYAI2025,K-Dense-AI,Cam10001110101,ComposioHQ

O processamento manual de PDF é demorado e propenso a erros. Esta habilidade oferece acesso programático para extrair texto, mesclar documentos, preencher formulários e converter arquivos usando bibliotecas Python.

Suporta: Claude Codex Code(CC)

🥉 76 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "pdf". Extraia o texto de quarterly_report.pdf

Resultado esperado:

Texto extraído com sucesso de 24 páginas
Salvo em quarterly_report.txt (45.678 caracteres)
Encontradas 8 tabelas nas páginas 5, 12, 18-20

A utilizar "pdf". Mescle contract1.pdf, contract2.pdf e appendix.pdf

Resultado esperado:

3 documentos mesclados em combined_contract.pdf
Total de páginas: 47
Todos os marcadores e links preservados

A utilizar "pdf". Preencha application_form.pdf com dados de applicant.json

Resultado esperado:

12 campos do formulário preenchidos
Salvo em application_filled.pdf
Todos os valores dos campos validados com sucesso

Auditoria de Segurança

Seguro

v5 • 1/17/2026

All 228 static findings are FALSE POSITIVES. The skill contains legitimate PDF processing documentation and Python scripts. Findings are caused by markdown code formatting (backticks), PDF annotation syntax misidentified as crypto, and standard file I/O for document processing.

Arquivos analisados

2,230

Linhas analisadas

achados

Total de auditorias

Fatores de risco

📁 Acesso ao sistema de arquivos (2)

scripts/fill_fillable_fields.py:13-14 scripts/extract_form_field_info.py:141

⚡ Contém scripts (2)

scripts/check_fillable_fields.py:1-13 scripts/fill_fillable_fields.py:1-115

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

100

Conformidade com especificações

O Que Você Pode Construir

Extrair dados de tabelas

Extraia tabelas estruturadas de artigos científicos e relatórios para planilhas para análise.

Automatizar preenchimento de formulários

Processe em lote formulários PDF preenchíveis mapeando dados de configurações JSON.

Organizar documentos de processos

Mescle e divida documentos jurídicos, extraia trechos-chave de texto e crie relatórios padronizados.

Tente Estes Prompts

Extrair texto

Extract all text from {filename.pdf} and save it to {output.txt}

Mesclar documentos

Merge {file1.pdf}, {file2.pdf}, and {file3.pdf} into a single document named {combined.pdf}

Preencher formulários

Fill the PDF form at {form.pdf} using the field values in {values.json}. Save the result as {filled.pdf}

Extrair tabelas

Extract all tables from {document.pdf} and save them to an Excel spreadsheet with each table on a separate sheet

Melhores Práticas

Verifique se os campos do formulário PDF existem antes de preenchê-los executando check_fillable_fields.py
Use imagens de validação para confirmar a precisão da caixa delimitadora para formulários não preenchíveis
Teste com um pequeno conjunto de arquivos antes de processar grandes conjuntos de documentos em lote

Evitar

Processar PDFs protegidos por senha sem verificar a criptografia primeiro
Pular etapas de validação ao preencher anotações de formulários não preenchíveis
Assumir que todos os PDFs digitalizados contêm texto extraível sem OCR

Perguntas Frequentes

Esta habilidade pode processar PDFs digitalizados?

PDFs digitalizados requerem OCR. Use pytesseract para converter imagens em texto primeiro.

Quais tipos de formulários PDF são suportados?

Suporta campos de texto, caixas de seleção, grupos de rádio e campos de seleção em formulários PDF preenchíveis.

Como preencho formulários PDF não preenchíveis?

Converta em imagens, crie fields.json com caixas delimitadoras, e então use fill_pdf_form_with_annotations.py.

Meus dados estão seguros ao processar PDFs?

Sim. Todo o processamento acontece localmente. Nenhum dado é enviado para servidores externos.

Por que minhas anotações não estão visíveis no visualizador PDF?

Alguns visualizadores exigem que você mostre anotações ou podem precisar que o arquivo seja salvo com sinalizadores específicos.

Como isso se compara ao Adobe Acrobat?

Esta habilidade oferece controle programático para automação. Para tarefas manuais únicas, o Adobe pode ser mais simples.

Detalhes do Desenvolvedor

Autor

davila7

Licença

Proprietary. LICENSE.txt has complete terms

Repositório

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/document-skills/pdf

Referência

main

Estrutura de arquivos

📁 scripts/

📄 check_bounding_boxes_test.py

📄 check_bounding_boxes.py

📄 check_fillable_fields.py

📄 convert_pdf_to_images.py

📄 create_validation_image.py

📄 extract_form_field_info.py

📄 fill_fillable_fields.py

📄 fill_pdf_form_with_annotations.py

📄 forms.md

📄 LICENSE.txt

📄 reference.md

📄 SKILL.md