Processar documentos PDF
Également disponible depuis: sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ
Documentos PDF exigem ferramentas especializadas para extração, modificação e preenchimento de formulários. Esta skill oferece capacidades abrangentes de processamento de PDF, incluindo extração de texto, detecção de tabelas, junção e divisão de documentos e manipulação de campos de formulários usando bibliotecas Python.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "pdf". Extract text from report.pdf
Résultat attendu:
- Extraídas 15 páginas de report.pdf
- Texto salvo em report.txt (45,230 caracteres)
- Encontradas 3 tabelas nas páginas 5, 8 e 12
Utilisation de "pdf". Merge all invoices into one file
Résultat attendu:
- Combinados 12 arquivos PDF em merged_invoices.pdf
- Total de páginas: 48
- Usado pypdf para a junção de documentos
Utilisation de "pdf". Fill out the application form
Résultat attendu:
- Identificados 8 campos de formulário preenchíveis
- Todos os campos preenchidos com os dados fornecidos
- Salvo em completed_application.pdf
Audit de sécurité
Risque faibleThis is a legitimate PDF manipulation skill containing 8 Python scripts for document processing. The 227 static findings are false positives: documentation examples showing command syntax are not actual shell execution; legitimate file I/O uses standard PDF libraries (pypdf, pdfplumber); cryptographic references are for PDF password protection; and flagged keywords like 'command' appear only in documentation context. No network calls, no command injection, no credential handling.
Problèmes à risque faible (1)
Facteurs de risque
⚡ Contient des scripts (3)
📁 Accès au système de fichiers (2)
Score de qualité
Ce que vous pouvez construire
Automatizar o preenchimento de formulários
Preencher formulários PDF programaticamente usando informações de campos extraídas e verificações de validação
Extrair dados estruturados
Extrair tabelas e texto de relatórios em PDF para análise em planilhas e processamento de dados
Organizar coleções de documentos
Juntar, dividir e reorganizar documentos PDF para fluxos de trabalho eficientes de gestão de arquivos
Essayez ces prompts
Extract all text from document.pdf and save it to a text file
Merge report1.pdf, report2.pdf, and report3.pdf into quarterly_report.pdf
Fill in application_form.pdf with the following data: name=John Smith, email=john@example.com, and save the completed form
Extract tables from all PDFs in the /invoices directory and save each to a separate CSV file
Bonnes pratiques
- Validar arquivos PDF antes do processamento para lidar com documentos corrompidos ou criptografados de forma adequada
- Usar validação de caixas delimitadoras ao preencher formulários PDF não preenchíveis para garantir posicionamento preciso
- Processar PDFs grandes em partes para gerenciar o uso de memória de forma eficaz
Éviter
- Tentar processar PDFs protegidos por senha sem primeiro obter a senha
- Ignorar a validação de caixas delimitadoras ao preencher formulários PDF não preenchíveis
- Processar PDFs extremamente grandes sem particionamento ou gerenciamento de memória
Foire aux questions
Quais bibliotecas Python são necessárias?
Quais são os limites de tamanho para processamento de PDFs?
Esta skill pode se integrar a outras ferramentas?
Os dados dos PDFs são armazenados ou transmitidos?
Por que o preenchimento do formulário falhou?
Como isso se compara a ferramentas online de PDF?
Détails du développeur
Structure de fichiers