المهارات PDF Processing
📄

PDF Processing

آمن

استخراج ومعالجة مستندات PDF

استخراج البيانات من ملفات PDF يدوياً أمر ممل وعرضة للأخطاء. توفر هذه المهارة أنماطاً برمجية لاستخراج النصوص والجداول ونماذج البيانات من ملفات PDF باستخدام مكتبات بايثون.

يدعم: Claude Codex Code(CC)
⚠️ 68 ضعيف
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "PDF Processing". استخرج كل النص من quarterly_report.pdf واحفظه في quarterly_report.txt

النتيجة المتوقعة:

  • ✓ تم استخراج النص بنجاح من جميع الصفحات الـ 24
  • ✓ تم الحفظ في quarterly_report.txt (45678 حرفاً)
  • ملاحظة: صفحتان تحتويان على صور بدون نص قابل للتحديد

التدقيق الأمني

آمن
v3 • 1/10/2026

Pure documentation skill containing PDF processing examples. No executable code, network calls, or sensitive operations. All code samples use standard Python libraries (pdfplumber, pypdf) for their stated purpose of PDF manipulation.

2
الملفات التي تم فحصها
307
الأسطر التي تم تحليلها
0
النتائج
3
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
81
المحتوى
32
المجتمع
100
الأمان
70
الامتثال للمواصفات

ماذا يمكنك بناءه

استخراج بيانات الجداول

سحب البيانات الجدولية من تقارير PDF إلى تنسيقات CSV أو جداول بيانات للتحليل.

أتمتة ملء النماذج

ملء نماذج PDF ببيانات من قواعد البيانات أو جداول البيانات برمجياً.

بناء مهام سير عمل PDF

إنشاء خطوط أنابيب لدمج وتقسيم ومعالجة مستندات PDF في التطبيقات.

جرّب هذه الموجهات

استخراج النص
Extract all text from the PDF document located at [file_path] and save it to [output_file].
استخراج الجداول
Find and extract all tables from [pdf_file] and save them as a CSV file.
ملء النموذج
Fill the PDF form at [form_path] with these values: [field_values]. Save as [output_path].
دمج ملفات PDF
Merge these PDF files [file_list] into a single document called [output_name].

أفضل الممارسات

  • تحقق من صحة ملفات PDF قبل المعالجة لتجنب الأخطاء في المستندات التالفة
  • اعمل على نسخ من الملفات الأصلية لمنع فقدان البيانات العرضي
  • تعامل مع الاستثناءات بشكل جيد للصفحات التي لا تحتوي على نص قابل للاستخراج

تجنب

  • معالجة ملفات PDF بالكامل عند الحاجة إلى صفحات محددة فقط
  • تخطي معالجة الأخطاء لملفات PDF الكبيرة أو المعقدة
  • ملء النماذج دون تحليل بنية حقول النموذج أولاً

الأسئلة المتكررة

ما مكتبات PDF التي تدعمها هذه المهارة؟
pdfplumber لاستخراج النص والجداول، pypdf للمعالجة، pdf2image للتحويل، pytesseract لـ OCR.
ما حدود الحجم لمعالجة PDF؟
المعالجة محدودة بذاكرة النظام المتاحة. قد تتطلب الملفات الكبيرة جداً معالجة متقطعة.
هل يمكن لهذه المهارة التكامل مع أدوات أخرى؟
نعم. استخدم سكريبتات بايثون في Claude أو Codex أو Claude Code لربط معالجة PDF مع مهام سير عمل أخرى.
هل بياناتي آمنة أثناء المعالجة؟
نعم. تحدث جميع المعالجة محلياً. لا يتم إرسال البيانات إلى خوادم خارجية. يتم قراءة الملفات فقط عند تحديدك للمسارات.
لماذا لا يظهر نص في ملف PDF الممسوح ضوئياً؟
تحتوي ملفات PDF الممسوحة ضوئياً على صور، وليس نصاً قابلاً للتحديد. استخدم pytesseract مع تمكين OCR لاستخراج النصوص من الممسوحات الضوئية.
كيف تختلف هذه الأداة عن أدوات PDF عبر الإنترنت؟
تعمل هذه المهارة محلياً في بيئة بايثون الخاصة بك. لا توجد عمليات رفع للملفات، لا مخاوف تتعلق بالخصوصية، تعمل بدون اتصال.

تفاصيل المطور

المؤلف

Joseph OBrien

الترخيص

MIT

مرجع

main

بنية الملفات

📄 FORMS.md

📄 SKILL.md