P

pdf

Sûr 📁 Accès au système de fichiers⚡ Contient des scripts

PDF 문서 효율적으로 처리

Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,Azeem-2,anthropics,92Bilal26,ArtemisAI,AutumnsGrove

수동 PDF 처리는 시간이 많이 들고 오류가 발생하기 쉽습니다. 이 기술은 Python 라이브러리를 사용하여 텍스트 추출, 문서 병합, 양식 채우기 및 파일 변환에 대한 프로그래밍 방식의 접근을 제공합니다.

Prend en charge: Claude Codex Code(CC)
🥉 76 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf". quarterly_report.pdf에서 텍스트 추출

Résultat attendu:

  • 24페이지에서 텍스트를 성공적으로 추출함
  • quarterly_report.txt에 저장 (45,678자)
  • 5, 12, 18-20페이지에서 8개의 테이블 발견

Utilisation de "pdf". contract1.pdf, contract2.pdf, appendix.pdf 병합

Résultat attendu:

  • 3개 문서를 combined_contract.pdf로 병합함
  • 총 페이지 수: 47
  • 모든 책갈피 및 링크 보존됨

Utilisation de "pdf". applicant.json의 데이터로 application_form.pdf 채우기

Résultat attendu:

  • 12개 양식 필드 채움
  • application_filled.pdf에 저장
  • 모든 필드 값 검증 성공

Audit de sécurité

Sûr
v5 • 1/17/2026

All 228 static findings are FALSE POSITIVES. The skill contains legitimate PDF processing documentation and Python scripts. Findings are caused by markdown code formatting (backticks), PDF annotation syntax misidentified as crypto, and standard file I/O for document processing.

13
Fichiers analysés
2,230
Lignes analysées
2
résultats
5
Total des audits

Score de qualité

59
Architecture
100
Maintenabilité
85
Contenu
22
Communauté
100
Sécurité
100
Conformité aux spécifications

Ce que vous pouvez construire

테이블 데이터 추출

연구 논문 및 보고서에서 구조화된 테이블을 추출하여 분석을 위해 스프레드시트로 이동합니다.

양식 채우기 자동화

JSON 구성에서 데이터를 매핑하여 채울 수 있는 PDF 양식을 일괄 처리합니다.

사건 문서 정리

법률 문서를 병합하고 분할하고, 주요 텍스트 발췌를 추출하며, 표준화된 보고서를 생성합니다.

Essayez ces prompts

텍스트 추출
{filename.pdf}에서 모든 텍스트를 추출하여 {output.txt}에 저장
문서 병합
{file1.pdf}, {file2.pdf}, {file3.pdf}를 {combined.pdf}라는 단일 문서로 병합
양식 채우기
{form.pdf}의 PDF 양식을 {values.json}의 필드 값을 사용하여 채우기. 결과를 {filled.pdf}로 저장
테이블 추출
{document.pdf}에서 모든 테이블을 추출하여 각 테이블이 별도 시트에 있는 Excel 스프레드시트에 저장

Bonnes pratiques

  • 채우기 전에 check_fillable_fields.py를 실행하여 PDF 양식 필드가 존재하는지 확인
  • 채울 수 없는 양식의 경우 바운딩 박스 정확도를 확인하기 위해 검증 이미지 사용
  • 대규모 문서 세트를 일괄 처리하기 전에 작은 파일 하위 집합으로 먼저 테스트

Éviter

  • 먼저 암호화를 확인하지 않고 암호로 보호된 PDF 처리
  • 채울 수 없는 양식 주석을 채울 때 검증 단계 건너뛰기
  • OCR 없이 모든 스캔된 PDF가 추출 가능한 텍스트를 포함한다고 가정

Foire aux questions

이 기술로 스캔된 PDF를 처리할 수 있나요?
스캔된 PDF에는 OCR이 필요합니다. 먼저 pytesseract를 사용하여 이미지를 텍스트로 변환하세요.
어떤 PDF 양식 유형이 지원되나요?
채울 수 있는 PDF 양식의 텍스트 필드, 체크박스, 라디오 그룹 및 선택 필드를 지원합니다.
채울 수 없는 PDF 양식은 어떻게 채우나요?
이미지로 변환하고, 바운딩 박스와 함께 fields.json을 만든 후 fill_pdf_form_with_annotations.py를 사용하세요.
PDF를 처리할 때 내 데이터가 안전한가요?
네. 모든 처리가 로컬에서 수행됩니다. 외부 서버로 데이터가 전송되지 않습니다.
내 주석이 PDF 뷰어에 표시되지 않는 이유는 무엇인가요?
일부 뷰어에서는 주석을 표시해야 하거나 특정 플래그로 저장된 파일이 필요할 수 있습니다.
Adobe Acrobat과 비교하면 어떻게 되나요?
이 기술은 자동화를 위한 프로그래밍 제어를 제공합니다. 일회성 수동 작업의 경우 Adobe가 더 간단할 수 있습니다.