العمل مع ملفات PDF في Python
Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI
تتطلب ملفات PDF أدوات معقدة للاستخراج والتلاعب. توفر هذه المهارة أمثلة شاملة باستخدام مكتبات Python الشائعة لجميع عمليات PDF.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "pdf". استخراج النص من document.pdf
Résultat attendu:
- تم استخراج 15 صفحة بنجاح من document.pdf
- إجمالي الأحرف: 45,230 | إجمالي الكلمات: 7,842
- مستخرج من الصفحات 1-3: مقدمة ونظرة عامة
Utilisation de "pdf". املأ قالب الفاتورة ببيانات العملاء
Résultat attendu:
- تم إنشاء 50 فاتورة مملوءة من القالب
- البيانات مستوردة من customers.csv
- تم حفظ المخرجات في مجلد /invoices/
Utilisation de "pdf". دمج هذه التقارير الربع سنوية في مستند واحد
Résultat attendu:
- تم دمج 4 ملفات PDF في quarterly_report.pdf
- تم إضافة أرقام الصفحات لجميع الصفحات
- تم تطبيق رؤوس متسقة في جميع أنحاء المستند
Audit de sécurité
Risque faibleThe static analyzer flagged 377 potential issues across 13 files. After evaluation, the majority are false positives: markdown documentation formatting (backticks in code blocks), legitimate cryptographic implementations (AES-256), and common PDF processing operations. One documented concern exists in example code using eval() for CSV parsing, with an explicit warning comment. The skill contains standard PDF manipulation capabilities with no confirmed malicious intent.
Problèmes à risque moyen (1)
Problèmes à risque faible (2)
Facteurs de risque
📁 Accès au système de fichiers (2)
⚡ Contient des scripts (1)
⚙️ Commandes externes (2)
Score de qualité
Ce que vous pouvez construire
معالجة مستندات PDF
استخراج البيانات وأتمتة مهام المستندات في تطبيقات Python
استخراج بيانات الفواتير
استخراج الجداول والأرقام من المستندات المالية للتحليل
أتمتة مهام المستندات
إنشاء التقارير وملء النماذج وتنظيم مجموعات المستندات
Essayez ces prompts
استخراج جميع النص من ملف PDF باستخدام pypdf أو pdfplumber
ملء حقول نموذج PDF برمجياً باستخدام قيم البيانات المحددة
إنشاء تقرير PDF احترافي مع الجداول والصور والنص المنسق
تنفيذ OCR على PDF ممسوح ضوئياً لاستخراج نص قابل للبحث
Bonnes pratiques
- تحقق من صحة ملفات PDF قبل المعالجة وتعامل مع أخطاء التشفير
- استخدم المكتبة المناسبة لكل مهمة (pdfplumber للجداول، reportlab للإنشاء)
- معالجة ملفات PDF الكبيرة على دفعات مع إدارة الذاكرة
Éviter
- محاولة معالجة ملفات PDF المشفرة دون التحقق من وجود كلمات مرور
- استخدام استخراج النص الأساسي على المستندات الممسوحة ضوئياً بدون OCR
- تجاهل معالجة الأخطاء عند معالجة ملفات PDF متعددة