pdf-processing
Extraer y procesar documentos PDF
또한 다음에서 사용할 수 있습니다: 0xkynz,Joseph OBrien,0xkynz
Los documentos PDF contienen datos valiosos pero son difíciles de procesar programáticamente. Esta habilidad proporciona patrones de código para extraer texto, tablas y datos de formularios de PDFs utilizando bibliotecas de Python como pdfplumber y pypdf.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"pdf-processing" 사용 중입니다. Extract text from contract.pdf
예상 결과:
- File: contract.pdf
- Pages: 12
- Extracted text length: 4,521 characters
- First page preview: This Agreement is entered into...
"pdf-processing" 사용 중입니다. Extract tables from quarterly_report.pdf
예상 결과:
- Found 3 tables on page 1
- Table 1: Revenue by Region (4 columns x 5 rows)
- Table 2: Quarterly Growth (2 columns x 4 rows)
- Tables saved to quarterly_report_tables.csv
"pdf-processing" 사용 중입니다. Merge invoice1.pdf and invoice2.pdf
예상 결과:
- Merged 2 PDF files
- Total pages: 8
- Output saved to merged_invoices.pdf
보안 감사
안전Documentation-only skill providing Python code examples for legitimate PDF processing. All 42 static findings are FALSE POSITIVES: scanner misidentified markdown code fences as shell backticks and PDF form field values as cryptographic algorithms. Prior audit in skill-report.json confirmed safe status with no findings.
위험 요인
⚙️ 외부 명령어 (28)
📁 파일 시스템 액세스 (5)
🌐 네트워크 접근 (1)
품질 점수
만들 수 있는 것
Extraer datos tabulares de informes
Extraer tablas de informes financieros y artículos de investigación para análisis en hojas de cálculo o bases de datos.
Automatizar el llenado de formularios
Rellenar formularios PDF con datos de hojas de cálculo o bases de datos para procesamiento por lotes.
Construir flujos de trabajo de documentos
Crear flujos de trabajo para procesar documentos PDF entrantes para almacenamiento, análisis o procesamiento adicional.
이 프롬프트를 사용해 보세요
Extract all text from myfile.pdf and save it to output.txt
Find and extract all tables from report.pdf and save them to a CSV file
Fill the fields in application_form.pdf with name=John Smith, email=john@email.com, address=123 Main St
Merge chapter1.pdf, chapter2.pdf, and chapter3.pdf into book.pdf
모범 사례
- Probar la extracción en archivos de muestra antes de procesar lotes grandes
- Validar visualmente que los datos extraídos coincidan con el PDF original
- Manejar excepciones de manera elegante para archivos corruptos o protegidos con contraseña
피하기
- Asumir que todos los PDFs contienen texto extraíble (las imágenes escaneadas necesitan OCR)
- Procesar documentos completos cuando solo se necesitan páginas específicas
- Omitir el manejo de errores para problemas de acceso a archivos o formato