📄

pdf

Name: pdf
Author: AutumnsGrove

낮은 위험 📁 파일 시스템 액세스⚡ 스크립트 포함⚙️ 외부 명령어

Python에서 PDF 파일 작업

또한 다음에서 사용할 수 있습니다: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

PDF 파일은 추출과 조작에 복잡한 도구가 필요합니다. 이 스킬은 모든 PDF 작업을 위해 인기 있는 Python 라이브러리를 활용한 포괄적인 코드 예시를 제공합니다.

지원: Claude Codex Code(CC)

🥉 76 브론즈

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"pdf" 사용 중입니다. Extract text from my document.pdf

예상 결과:

document.pdf에서 15페이지를 성공적으로 추출했습니다
총 문자 수: 45,230 | 총 단어 수: 7,842
1-3페이지에서 추출됨: 소개 및 개요 섹션

"pdf" 사용 중입니다. Fill this invoice template with customer data

예상 결과:

템플릿에서 채워진 송장 50개를 생성했습니다
customers.csv에서 데이터를 가져옴
출력은 /invoices/ 디렉터리에 저장됨

"pdf" 사용 중입니다. Merge these quarterly reports into one document

예상 결과:

4개의 PDF 파일을 quarterly_report.pdf로 병합했습니다
모든 페이지에 페이지 번호를 추가했습니다
전체에 일관된 헤더를 적용했습니다

보안 감사

낮은 위험

v6 • 1/16/2026

The static analyzer flagged 377 potential issues across 13 files. After evaluation, the majority are false positives: markdown documentation formatting (backticks in code blocks), legitimate cryptographic implementations (AES-256), and common PDF processing operations. One documented concern exists in example code using eval() for CSV parsing, with an explicit warning comment. The skill contains standard PDF manipulation capabilities with no confirmed malicious intent.

스캔된 파일

5,124

분석된 줄 수

발견 사항

총 감사 수

중간 위험 문제 (1)

examples/invoice-generator.md:273

eval() usage in example CSV parsing code

eval() used in example code for CSV parsing

낮은 위험 문제 (2)

references/best-practices.md:380

Dynamic import for optional dependency checking

Dynamic __import__ for dependency checking

scripts/pdf_helper.py:743

File I/O operations for PDF processing

위험 요인

📁 파일 시스템 액세스 (2)

scripts/pdf_helper.py:743 SKILL.md:177

⚡ 스크립트 포함 (1)

examples/invoice-generator.md:273

⚙️ 외부 명령어 (2)

README.md:13-15 SKILL.md:32-34

감사자: claude 감사 이력 보기 →

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

보안

사양 준수

만들 수 있는 것

PDF 문서 처리

Python 애플리케이션에서 데이터를 추출하고 문서 워크플로를 자동화

송장 데이터 추출

재무 문서에서 표와 수치를 추출해 분석

문서 작업 자동화

보고서 생성, 양식 작성, 문서 컬렉션 정리

이 프롬프트를 사용해 보세요

텍스트 추출

pypdf 또는 pdfplumber를 사용해 PDF 파일에서 모든 텍스트를 추출하세요

양식 작성

주어진 데이터 값으로 PDF 양식 필드를 프로그램적으로 채우세요

PDF 생성

표, 이미지, 서식 있는 텍스트가 포함된 전문적인 PDF 보고서를 생성하세요

OCR 스캔

스캔된 PDF에 OCR을 수행해 검색 가능한 텍스트를 추출하세요

모범 사례

처리 전에 PDF 파일을 검증하고 암호화 오류를 처리
작업별로 적절한 라이브러리 사용 (표는 pdfplumber, 생성은 reportlab)
메모리 관리를 위해 가비지 컬렉션과 함께 대용량 PDF를 청크로 처리

피하기

비밀번호 확인 없이 암호화된 PDF를 처리하려는 시도
OCR 없이 스캔 문서에 기본 텍스트 추출을 사용하는 것
여러 PDF 파일 처리 시 오류 처리를 생략

자주 묻는 질문

기본적인 PDF 작업에 어떤 Python 라이브러리를 사용해야 하나요?

병합, 분할, 회전 같은 간단한 작업에는 pypdf를 사용하세요. 텍스트 및 표 추출에는 pdfplumber를 사용하세요.

스캔된 PDF에서 표를 어떻게 추출하나요?

먼저 pytesseract로 OCR을 수행한 다음, OCR 출력에서 표 구조를 추출하기 위해 pdfplumber를 사용하세요.

PDF를 처음부터 만들 수 있나요?

네, reportlab 라이브러리를 사용하면 텍스트, 이미지, 표, 서식 있는 콘텐츠로 PDF를 프로그램적으로 생성할 수 있습니다.

비밀번호로 보호된 PDF는 어떻게 처리하나요?

pypdf PdfReader를 user_password 파라미터와 함께 사용하세요. 처리 전에 암호화 여부를 확인하세요.

PDF를 어떤 형식으로 변환할 수 있나요?

pdf2image를 사용해 PDF 페이지를 이미지(PNG, JPEG)로 변환하세요. 텍스트를 일반 텍스트 또는 구조화된 형식으로 추출하세요.

PDF에서 메타데이터를 어떻게 추출하나요?

pypdf PdfReader를 사용해 작성자, 제목, 생성 날짜, 사용자 정의 키워드를 포함한 문서 메타데이터에 접근하세요.

개발자 세부 정보

작성자

AutumnsGrove

라이선스

MIT

리포지토리

https://github.com/AutumnsGrove/ClaudeSkills/tree/master/pdf

참조

master

파일 구조

📁 examples/

📄 invoice-generator.md

📄 report-automation.md

📁 references/

📄 best-practices.md

📄 library-installation.md

📄 metadata-security-ocr.md

📄 pdf-creation.md

📄 pdf-operations.md

📄 table-extraction.md

📄 text-extraction.md

📁 scripts/

📄 pdf_helper.py

📄 README.md

📄 SKILL.md