📄

pdf

Name: pdf
Author: AutumnsGrove

مخاطر منخفضة 📁 الوصول إلى نظام الملفات⚡ يحتوي على سكربتات⚙️ الأوامر الخارجية

العمل مع ملفات PDF في Python

متاح أيضًا من: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

تتطلب ملفات PDF أدوات معقدة للاستخراج والتلاعب. توفر هذه المهارة أمثلة شاملة باستخدام مكتبات Python الشائعة لجميع عمليات PDF.

يدعم: Claude Codex Code(CC)

🥉 76 برونزي

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "pdf". استخراج النص من document.pdf

النتيجة المتوقعة:

تم استخراج 15 صفحة بنجاح من document.pdf
إجمالي الأحرف: 45,230 | إجمالي الكلمات: 7,842
مستخرج من الصفحات 1-3: مقدمة ونظرة عامة

استخدام "pdf". املأ قالب الفاتورة ببيانات العملاء

النتيجة المتوقعة:

تم إنشاء 50 فاتورة مملوءة من القالب
البيانات مستوردة من customers.csv
تم حفظ المخرجات في مجلد /invoices/

استخدام "pdf". دمج هذه التقارير الربع سنوية في مستند واحد

النتيجة المتوقعة:

تم دمج 4 ملفات PDF في quarterly_report.pdf
تم إضافة أرقام الصفحات لجميع الصفحات
تم تطبيق رؤوس متسقة في جميع أنحاء المستند

التدقيق الأمني

مخاطر منخفضة

v6 • 1/16/2026

The static analyzer flagged 377 potential issues across 13 files. After evaluation, the majority are false positives: markdown documentation formatting (backticks in code blocks), legitimate cryptographic implementations (AES-256), and common PDF processing operations. One documented concern exists in example code using eval() for CSV parsing, with an explicit warning comment. The skill contains standard PDF manipulation capabilities with no confirmed malicious intent.

الملفات التي تم فحصها

5,124

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

مشكلات متوسطة المخاطر (1)

examples/invoice-generator.md:273

eval() usage in example CSV parsing code

eval() used in example code for CSV parsing

مشكلات منخفضة المخاطر (2)

references/best-practices.md:380

Dynamic import for optional dependency checking

Dynamic __import__ for dependency checking

scripts/pdf_helper.py:743

File I/O operations for PDF processing

عوامل الخطر

📁 الوصول إلى نظام الملفات (2)

scripts/pdf_helper.py:743 SKILL.md:177

⚡ يحتوي على سكربتات (1)

examples/invoice-generator.md:273

⚙️ الأوامر الخارجية (2)

README.md:13-15 SKILL.md:32-34

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

معالجة مستندات PDF

استخراج البيانات وأتمتة مهام المستندات في تطبيقات Python

استخراج بيانات الفواتير

استخراج الجداول والأرقام من المستندات المالية للتحليل

أتمتة مهام المستندات

إنشاء التقارير وملء النماذج وتنظيم مجموعات المستندات

جرّب هذه الموجهات

استخراج النص

استخراج جميع النص من ملف PDF باستخدام pypdf أو pdfplumber

ملء النماذج

ملء حقول نموذج PDF برمجياً باستخدام قيم البيانات المحددة

إنشاء PDF

إنشاء تقرير PDF احترافي مع الجداول والصور والنص المنسق

مسح ضوئي OCR

تنفيذ OCR على PDF ممسوح ضوئياً لاستخراج نص قابل للبحث

أفضل الممارسات

تحقق من صحة ملفات PDF قبل المعالجة وتعامل مع أخطاء التشفير
استخدم المكتبة المناسبة لكل مهمة (pdfplumber للجداول، reportlab للإنشاء)
معالجة ملفات PDF الكبيرة على دفعات مع إدارة الذاكرة

تجنب

محاولة معالجة ملفات PDF المشفرة دون التحقق من وجود كلمات مرور
استخدام استخراج النص الأساسي على المستندات الممسوحة ضوئياً بدون OCR
تجاهل معالجة الأخطاء عند معالجة ملفات PDF متعددة

الأسئلة المتكررة

ما مكتبة Python التي يجب أن أستخدمها لعمليات PDF الأساسية؟

استخدم pypdf للمهام البسيطة مثل الدمج والتقسيم والتدوير. استخدم pdfplumber لاستخراج النص والجداول.

كيف يمكنني استخراج الجداول من ملفات PDF الممسوحة ضوئياً؟

قم أولاً بتنفيذ OCR باستخدام pytesseract، ثم استخدم pdfplumber لاستخراج بنية الجدول من مخرجات OCR.

هل يمكنني إنشاء PDF من الصفر؟

نعم، استخدم مكتبة reportlab لإنشاء PDF برمجياً مع النص والصور والجداول والمحتوى المنسق.

كيف أتعامل مع ملفات PDF المحمية بكلمة مرور؟

استخدم pypdf PdfReader مع معامل user_password. تحقق من وجود التشفير قبل المعالجة.

إلى أي صيغ يمكنني تحويل PDF؟

استخدم pdf2image لتحويل صفحات PDF إلى صور (PNG, JPEG). استخرج النص إلى نص عادي أو صيغ منظمة.

كيف أستخرج البيانات الوصفية من PDF؟

استخدم pypdf PdfReader للوصول إلى بيانات الوثيقة بما في ذلك المؤلف والعنوان وتاريخ الإنشاء والكلمات المفتاحية المخصصة.

تفاصيل المطور

المؤلف

AutumnsGrove

الترخيص

MIT

المستودع

https://github.com/AutumnsGrove/ClaudeSkills/tree/master/pdf

مرجع

master

بنية الملفات

📁 examples/

📄 invoice-generator.md

📄 report-automation.md

📁 references/

📄 best-practices.md

📄 library-installation.md

📄 metadata-security-ocr.md

📄 pdf-creation.md

📄 pdf-operations.md

📄 table-extraction.md

📄 text-extraction.md

📁 scripts/

📄 pdf_helper.py

📄 README.md

📄 SKILL.md