📄

pdf

Risque faible 📁 Accès au système de fichiers⚡ Contient des scripts⚙️ Commandes externes

Python에서 PDF 파일 작업

Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI

PDF 파일은 추출과 조작에 복잡한 도구가 필요합니다. 이 스킬은 모든 PDF 작업을 위해 인기 있는 Python 라이브러리를 활용한 포괄적인 코드 예시를 제공합니다.

Prend en charge: Claude Codex Code(CC)
🥉 76 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf". Extract text from my document.pdf

Résultat attendu:

  • document.pdf에서 15페이지를 성공적으로 추출했습니다
  • 총 문자 수: 45,230 | 총 단어 수: 7,842
  • 1-3페이지에서 추출됨: 소개 및 개요 섹션

Utilisation de "pdf". Fill this invoice template with customer data

Résultat attendu:

  • 템플릿에서 채워진 송장 50개를 생성했습니다
  • customers.csv에서 데이터를 가져옴
  • 출력은 /invoices/ 디렉터리에 저장됨

Utilisation de "pdf". Merge these quarterly reports into one document

Résultat attendu:

  • 4개의 PDF 파일을 quarterly_report.pdf로 병합했습니다
  • 모든 페이지에 페이지 번호를 추가했습니다
  • 전체에 일관된 헤더를 적용했습니다

Audit de sécurité

Risque faible
v6 • 1/16/2026

The static analyzer flagged 377 potential issues across 13 files. After evaluation, the majority are false positives: markdown documentation formatting (backticks in code blocks), legitimate cryptographic implementations (AES-256), and common PDF processing operations. One documented concern exists in example code using eval() for CSV parsing, with an explicit warning comment. The skill contains standard PDF manipulation capabilities with no confirmed malicious intent.

13
Fichiers analysés
5,124
Lignes analysées
6
résultats
6
Total des audits
Problèmes à risque moyen (1)
eval() usage in example CSV parsing code
eval() used in example code for CSV parsing
Problèmes à risque faible (2)
Dynamic import for optional dependency checking
Dynamic __import__ for dependency checking
File I/O operations for PDF processing
File I/O operations for PDF processing

Facteurs de risque

📁 Accès au système de fichiers (2)
⚡ Contient des scripts (1)
⚙️ Commandes externes (2)

Score de qualité

82
Architecture
100
Maintenabilité
85
Contenu
21
Communauté
81
Sécurité
87
Conformité aux spécifications

Ce que vous pouvez construire

PDF 문서 처리

Python 애플리케이션에서 데이터를 추출하고 문서 워크플로를 자동화

송장 데이터 추출

재무 문서에서 표와 수치를 추출해 분석

문서 작업 자동화

보고서 생성, 양식 작성, 문서 컬렉션 정리

Essayez ces prompts

텍스트 추출
pypdf 또는 pdfplumber를 사용해 PDF 파일에서 모든 텍스트를 추출하세요
양식 작성
주어진 데이터 값으로 PDF 양식 필드를 프로그램적으로 채우세요
PDF 생성
표, 이미지, 서식 있는 텍스트가 포함된 전문적인 PDF 보고서를 생성하세요
OCR 스캔
스캔된 PDF에 OCR을 수행해 검색 가능한 텍스트를 추출하세요

Bonnes pratiques

  • 처리 전에 PDF 파일을 검증하고 암호화 오류를 처리
  • 작업별로 적절한 라이브러리 사용 (표는 pdfplumber, 생성은 reportlab)
  • 메모리 관리를 위해 가비지 컬렉션과 함께 대용량 PDF를 청크로 처리

Éviter

  • 비밀번호 확인 없이 암호화된 PDF를 처리하려는 시도
  • OCR 없이 스캔 문서에 기본 텍스트 추출을 사용하는 것
  • 여러 PDF 파일 처리 시 오류 처리를 생략

Foire aux questions

기본적인 PDF 작업에 어떤 Python 라이브러리를 사용해야 하나요?
병합, 분할, 회전 같은 간단한 작업에는 pypdf를 사용하세요. 텍스트 및 표 추출에는 pdfplumber를 사용하세요.
스캔된 PDF에서 표를 어떻게 추출하나요?
먼저 pytesseract로 OCR을 수행한 다음, OCR 출력에서 표 구조를 추출하기 위해 pdfplumber를 사용하세요.
PDF를 처음부터 만들 수 있나요?
네, reportlab 라이브러리를 사용하면 텍스트, 이미지, 표, 서식 있는 콘텐츠로 PDF를 프로그램적으로 생성할 수 있습니다.
비밀번호로 보호된 PDF는 어떻게 처리하나요?
pypdf PdfReader를 user_password 파라미터와 함께 사용하세요. 처리 전에 암호화 여부를 확인하세요.
PDF를 어떤 형식으로 변환할 수 있나요?
pdf2image를 사용해 PDF 페이지를 이미지(PNG, JPEG)로 변환하세요. 텍스트를 일반 텍스트 또는 구조화된 형식으로 추출하세요.
PDF에서 메타데이터를 어떻게 추출하나요?
pypdf PdfReader를 사용해 작성자, 제목, 생성 날짜, 사용자 정의 키워드를 포함한 문서 메타데이터에 접근하세요.