📄

pdf

Risque faible 📁 Accès au système de fichiers⚡ Contient des scripts⚙️ Commandes externes

العمل مع ملفات PDF في Python

Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI

تتطلب ملفات PDF أدوات معقدة للاستخراج والتلاعب. توفر هذه المهارة أمثلة شاملة باستخدام مكتبات Python الشائعة لجميع عمليات PDF.

Prend en charge: Claude Codex Code(CC)
🥉 76 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf". استخراج النص من document.pdf

Résultat attendu:

  • تم استخراج 15 صفحة بنجاح من document.pdf
  • إجمالي الأحرف: 45,230 | إجمالي الكلمات: 7,842
  • مستخرج من الصفحات 1-3: مقدمة ونظرة عامة

Utilisation de "pdf". املأ قالب الفاتورة ببيانات العملاء

Résultat attendu:

  • تم إنشاء 50 فاتورة مملوءة من القالب
  • البيانات مستوردة من customers.csv
  • تم حفظ المخرجات في مجلد /invoices/

Utilisation de "pdf". دمج هذه التقارير الربع سنوية في مستند واحد

Résultat attendu:

  • تم دمج 4 ملفات PDF في quarterly_report.pdf
  • تم إضافة أرقام الصفحات لجميع الصفحات
  • تم تطبيق رؤوس متسقة في جميع أنحاء المستند

Audit de sécurité

Risque faible
v6 • 1/16/2026

The static analyzer flagged 377 potential issues across 13 files. After evaluation, the majority are false positives: markdown documentation formatting (backticks in code blocks), legitimate cryptographic implementations (AES-256), and common PDF processing operations. One documented concern exists in example code using eval() for CSV parsing, with an explicit warning comment. The skill contains standard PDF manipulation capabilities with no confirmed malicious intent.

13
Fichiers analysés
5,124
Lignes analysées
6
résultats
6
Total des audits
Problèmes à risque moyen (1)
eval() usage in example CSV parsing code
eval() used in example code for CSV parsing
Problèmes à risque faible (2)
Dynamic import for optional dependency checking
Dynamic __import__ for dependency checking
File I/O operations for PDF processing
File I/O operations for PDF processing

Facteurs de risque

📁 Accès au système de fichiers (2)
⚡ Contient des scripts (1)
⚙️ Commandes externes (2)

Score de qualité

82
Architecture
100
Maintenabilité
85
Contenu
21
Communauté
81
Sécurité
87
Conformité aux spécifications

Ce que vous pouvez construire

معالجة مستندات PDF

استخراج البيانات وأتمتة مهام المستندات في تطبيقات Python

استخراج بيانات الفواتير

استخراج الجداول والأرقام من المستندات المالية للتحليل

أتمتة مهام المستندات

إنشاء التقارير وملء النماذج وتنظيم مجموعات المستندات

Essayez ces prompts

استخراج النص
استخراج جميع النص من ملف PDF باستخدام pypdf أو pdfplumber
ملء النماذج
ملء حقول نموذج PDF برمجياً باستخدام قيم البيانات المحددة
إنشاء PDF
إنشاء تقرير PDF احترافي مع الجداول والصور والنص المنسق
مسح ضوئي OCR
تنفيذ OCR على PDF ممسوح ضوئياً لاستخراج نص قابل للبحث

Bonnes pratiques

  • تحقق من صحة ملفات PDF قبل المعالجة وتعامل مع أخطاء التشفير
  • استخدم المكتبة المناسبة لكل مهمة (pdfplumber للجداول، reportlab للإنشاء)
  • معالجة ملفات PDF الكبيرة على دفعات مع إدارة الذاكرة

Éviter

  • محاولة معالجة ملفات PDF المشفرة دون التحقق من وجود كلمات مرور
  • استخدام استخراج النص الأساسي على المستندات الممسوحة ضوئياً بدون OCR
  • تجاهل معالجة الأخطاء عند معالجة ملفات PDF متعددة

Foire aux questions

ما مكتبة Python التي يجب أن أستخدمها لعمليات PDF الأساسية؟
استخدم pypdf للمهام البسيطة مثل الدمج والتقسيم والتدوير. استخدم pdfplumber لاستخراج النص والجداول.
كيف يمكنني استخراج الجداول من ملفات PDF الممسوحة ضوئياً؟
قم أولاً بتنفيذ OCR باستخدام pytesseract، ثم استخدم pdfplumber لاستخراج بنية الجدول من مخرجات OCR.
هل يمكنني إنشاء PDF من الصفر؟
نعم، استخدم مكتبة reportlab لإنشاء PDF برمجياً مع النص والصور والجداول والمحتوى المنسق.
كيف أتعامل مع ملفات PDF المحمية بكلمة مرور؟
استخدم pypdf PdfReader مع معامل user_password. تحقق من وجود التشفير قبل المعالجة.
إلى أي صيغ يمكنني تحويل PDF؟
استخدم pdf2image لتحويل صفحات PDF إلى صور (PNG, JPEG). استخرج النص إلى نص عادي أو صيغ منظمة.
كيف أستخرج البيانات الوصفية من PDF؟
استخدم pypdf PdfReader للوصول إلى بيانات الوثيقة بما في ذلك المؤلف والعنوان وتاريخ الإنشاء والكلمات المفتاحية المخصصة.