📦

pdf

Name: pdf
Author: ZhanlinCui

낮은 위험 📁 파일 시스템 액세스⚙️ 외부 명령어

PDF 문서를 프로그래밍 방식으로 조작하고 양식을 작성합니다

또한 다음에서 사용할 수 있습니다: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

PDF 처리 작업에는 추출, 조작 및 양식 작성을 위한 전문 도구가 필요합니다. 이 스킬은 Python 라이브러리와 커맨드라인 도구를 사용하여 포괄적인 PDF 처리 기능을 제공합니다.

지원: Claude Codex Code(CC)

🥉 75 브론즈

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"pdf" 사용 중입니다. document.pdf 에서 텍스트 추출

예상 결과:

5 페이지에서 2,450 자를 성공적으로 추출했습니다. 식별된 주요 섹션: 요약, 재무 데이터, 결론.

"pdf" 사용 중입니다. file1.pdf, file2.pdf, file3.pdf 병합

예상 결과:

file1.pdf(3 페이지), file2.pdf(7 페이지), file3.pdf(5 페이지) 를 결합하여 merged.pdf(총 15 페이지) 를 생성했습니다.

"pdf" 사용 중입니다. field_values.json 으로 form.pdf 작성

예상 결과:

2 페이지에 걸쳐 12 개의 양식 필드를 작성했습니다. 유효성이 검증된 필드 값으로 form_filled.pdf 에 저장되었습니다.

보안 감사

낮은 위험

v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

스캔된 파일

1,878

분석된 줄 수

발견 사항

총 감사 수

중간 위험 문제 (1)

forms.md:4 reference.md:11 SKILL.md:15

External Command Execution Patterns

Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.

낮은 위험 문제 (2)

scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

Filesystem Write Operations

Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.

scripts/extract_form_field_info.py:32 scripts/extract_form_field_info.py:81

Hardcoded Documentation URLs

Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.

위험 요인

📁 파일 시스템 액세스 (4)

reference.md:59 scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

⚙️ 외부 명령어 (5)

forms.md:4 reference.md:11 SKILL.md:15 scripts/check_bounding_boxes.py:6 scripts/extract_form_field_info.py:11

감사자: claude

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

보안

사양 준수

만들 수 있는 것

PDF 리포트에서 데이터 추출

데이터 분석을 위해 재무 또는 과학 PDF 리포트에서 텍스트 내용과 표를 자동으로 추출

PDF 신청서 양식 작성

사용자가 제공한 데이터와 유효성 검사를 통해 작성 가능한 PDF 양식을 프로그래밍 방식으로 완료

배치 PDF 문서 처리

자동화된 워크플로우에서 여러 PDF 문서를 병합, 분할, 회전 및 워터마크 처리

이 프롬프트를 사용해 보세요

PDF 에서 텍스트 추출

첨부된 PDF 문서에서 모든 텍스트 콘텐츠를 추출하고 주요 정보를 요약하세요.

여러 PDF 병합

이 PDF 파일들을 cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf 순서로 단일 문서로 결합하세요.

사용자 데이터로 PDF 양식 작성

이 신청서를 작성해야 합니다. 먼저 필드 정보를 추출한 다음, 각 필드를 채울 값을 제공하겠습니다.

표 추출하여 Excel 로 변환

이 재무 리포트 PDF 에서 모든 표를 추출하여 각 표마다 별도의 시트로 Excel 스프레드시트로 저장하세요.

모범 사례

오류를 방지하기 위해 양식 작성 전에 항상 PDF 양식 필드 값을 유효성 검사하세요.
OCR 을 위해 PDF 를 이미지로 변환할 때 고해상도 설정 (300+ DPI) 을 사용하세요.
작성 불가능한 PDF 에 주석을 추가할 때 경계 상자 교차를 확인하세요.

피하기

작성 불가능한 양식을 작성할 때 경계 상자의 시각적 검증을 건너뛰지 마세요.
먼저 복호화하지 않고 암호로 보호된 PDF 를 처리하지 마세요.
모든 PDF 에 추출 가능한 텍스트가 있다고 가정하지 마세요 - 스캔된 PDF 는 OCR 이 필요합니다.

자주 묻는 질문

어떤 Python 라이브러리가 설치되어 있어야 하나요?

핵심 라이브러리: pypdf, pdfplumber, reportlab. 선택 사항: OCR 용 pytesseract, PDF 를 이미지로 변환용 pdf2image. 설치: pip install pypdf pdfplumber reportlab

텍스트가 없는 스캔된 PDF 는 어떻게 처리하나요?

스캔된 PDF 는 OCR 처리가 필요합니다. pytesseract 워크플로우를 사용하세요: pdf2image 로 PDF 페이지를 이미지로 변환한 후, pytesseract.image_to_string() 를 적용하여 텍스트를 추출합니다.

이 스킬로 작성 불가능한 PDF 양식을 작성할 수 있나요?

예, 계산된 위치에 텍스트 주석을 추가하면 됩니다. 이 과정은 PDF 를 이미지로 변환하고, 시각적으로 필드 위치를 식별하고, 경계 상자를 생성하고, 주석을 추가하는 것을 포함합니다.

어떤 커맨드라인 도구를 사용할 수 있나요?

poppler-utils(pdftotext, pdfimages, pdftoppm), 병합/분할용 qpdf, 고급 작업용 pdftk. 시스템 패키지 관리자를 통해 poppler-utils 와 qpdf 를 설치하세요.

PDF 에서 표를 어떻게 추출하나요?

pdfplumber 의 extract_tables() 메서드를 사용하세요. 복잡한 표의 경우, 더 나은 감지를 위해 vertical_strategy 및 horizontal_strategy 매개변수로 table_settings 를 구성하세요.

암호화된 PDF 를 처리할 수 있나요?

예, 암호가 있다면 가능합니다. pypdf 의 decrypt() 메서드나 qpdf --password 옵션을 사용하세요. 암호 없이는 암호화된 PDF 를 처리할 수 없습니다.

개발자 세부 정보

작성자

ZhanlinCui

라이선스

Proprietary. LICENSE.txt has complete terms

리포지토리

https://github.com/ZhanlinCui/Ultimate-Agent-Skills-Collection/tree/main/pdf

참조

main

파일 구조

📁 scripts/

📄 check_bounding_boxes_test.py

📄 check_bounding_boxes.py

📄 check_fillable_fields.py

📄 convert_pdf_to_images.py

📄 create_validation_image.py

📄 extract_form_field_info.py

📄 fill_fillable_fields.py

📄 fill_pdf_form_with_annotations.py

📄 forms.md

📄 reference.md

📄 SKILL.md