pdf

Name: pdf
Author: davila7

안전 📁 파일 시스템 액세스⚡ 스크립트 포함

PDF 문서 효율적으로 처리

또한 다음에서 사용할 수 있습니다: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,AutumnsGrove,DYAI2025,K-Dense-AI,Cam10001110101,ComposioHQ

수동 PDF 처리는 시간이 많이 들고 오류가 발생하기 쉽습니다. 이 기술은 Python 라이브러리를 사용하여 텍스트 추출, 문서 병합, 양식 채우기 및 파일 변환에 대한 프로그래밍 방식의 접근을 제공합니다.

지원: Claude Codex Code(CC)

🥉 76 브론즈

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"pdf" 사용 중입니다. quarterly_report.pdf에서 텍스트 추출

예상 결과:

24페이지에서 텍스트를 성공적으로 추출함
quarterly_report.txt에 저장 (45,678자)
5, 12, 18-20페이지에서 8개의 테이블 발견

"pdf" 사용 중입니다. contract1.pdf, contract2.pdf, appendix.pdf 병합

예상 결과:

3개 문서를 combined_contract.pdf로 병합함
총 페이지 수: 47
모든 책갈피 및 링크 보존됨

"pdf" 사용 중입니다. applicant.json의 데이터로 application_form.pdf 채우기

예상 결과:

12개 양식 필드 채움
application_filled.pdf에 저장
모든 필드 값 검증 성공

보안 감사

안전

v5 • 1/17/2026

All 228 static findings are FALSE POSITIVES. The skill contains legitimate PDF processing documentation and Python scripts. Findings are caused by markdown code formatting (backticks), PDF annotation syntax misidentified as crypto, and standard file I/O for document processing.

스캔된 파일

2,230

분석된 줄 수

발견 사항

총 감사 수

위험 요인

📁 파일 시스템 액세스 (2)

scripts/fill_fillable_fields.py:13-14 scripts/extract_form_field_info.py:141

⚡ 스크립트 포함 (2)

scripts/check_fillable_fields.py:1-13 scripts/fill_fillable_fields.py:1-115

감사자: claude 감사 이력 보기 →

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

100

사양 준수

만들 수 있는 것

테이블 데이터 추출

연구 논문 및 보고서에서 구조화된 테이블을 추출하여 분석을 위해 스프레드시트로 이동합니다.

양식 채우기 자동화

JSON 구성에서 데이터를 매핑하여 채울 수 있는 PDF 양식을 일괄 처리합니다.

사건 문서 정리

법률 문서를 병합하고 분할하고, 주요 텍스트 발췌를 추출하며, 표준화된 보고서를 생성합니다.

이 프롬프트를 사용해 보세요

텍스트 추출

{filename.pdf}에서 모든 텍스트를 추출하여 {output.txt}에 저장

문서 병합

{file1.pdf}, {file2.pdf}, {file3.pdf}를 {combined.pdf}라는 단일 문서로 병합

양식 채우기

{form.pdf}의 PDF 양식을 {values.json}의 필드 값을 사용하여 채우기. 결과를 {filled.pdf}로 저장

테이블 추출

{document.pdf}에서 모든 테이블을 추출하여 각 테이블이 별도 시트에 있는 Excel 스프레드시트에 저장

모범 사례

채우기 전에 check_fillable_fields.py를 실행하여 PDF 양식 필드가 존재하는지 확인
채울 수 없는 양식의 경우 바운딩 박스 정확도를 확인하기 위해 검증 이미지 사용
대규모 문서 세트를 일괄 처리하기 전에 작은 파일 하위 집합으로 먼저 테스트

피하기

먼저 암호화를 확인하지 않고 암호로 보호된 PDF 처리
채울 수 없는 양식 주석을 채울 때 검증 단계 건너뛰기
OCR 없이 모든 스캔된 PDF가 추출 가능한 텍스트를 포함한다고 가정

자주 묻는 질문

이 기술로 스캔된 PDF를 처리할 수 있나요?

스캔된 PDF에는 OCR이 필요합니다. 먼저 pytesseract를 사용하여 이미지를 텍스트로 변환하세요.

어떤 PDF 양식 유형이 지원되나요?

채울 수 있는 PDF 양식의 텍스트 필드, 체크박스, 라디오 그룹 및 선택 필드를 지원합니다.

채울 수 없는 PDF 양식은 어떻게 채우나요?

이미지로 변환하고, 바운딩 박스와 함께 fields.json을 만든 후 fill_pdf_form_with_annotations.py를 사용하세요.

PDF를 처리할 때 내 데이터가 안전한가요?

네. 모든 처리가 로컬에서 수행됩니다. 외부 서버로 데이터가 전송되지 않습니다.

내 주석이 PDF 뷰어에 표시되지 않는 이유는 무엇인가요?

일부 뷰어에서는 주석을 표시해야 하거나 특정 플래그로 저장된 파일이 필요할 수 있습니다.

Adobe Acrobat과 비교하면 어떻게 되나요?

이 기술은 자동화를 위한 프로그래밍 제어를 제공합니다. 일회성 수동 작업의 경우 Adobe가 더 간단할 수 있습니다.

개발자 세부 정보

작성자

davila7

라이선스

Proprietary. LICENSE.txt has complete terms

리포지토리

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/document-skills/pdf

참조

main

파일 구조

📁 scripts/

📄 check_bounding_boxes_test.py

📄 check_bounding_boxes.py

📄 check_fillable_fields.py

📄 convert_pdf_to_images.py

📄 create_validation_image.py

📄 extract_form_field_info.py

📄 fill_fillable_fields.py

📄 fill_pdf_form_with_annotations.py

📄 forms.md

📄 LICENSE.txt

📄 reference.md

📄 SKILL.md