PDF Processing
استخراج ومعالجة مستندات PDF
استخراج البيانات من ملفات PDF يدوياً أمر ممل وعرضة للأخطاء. توفر هذه المهارة أنماطاً برمجية لاستخراج النصوص والجداول ونماذج البيانات من ملفات PDF باستخدام مكتبات بايثون.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "PDF Processing". استخرج كل النص من quarterly_report.pdf واحفظه في quarterly_report.txt
النتيجة المتوقعة:
- ✓ تم استخراج النص بنجاح من جميع الصفحات الـ 24
- ✓ تم الحفظ في quarterly_report.txt (45678 حرفاً)
- ملاحظة: صفحتان تحتويان على صور بدون نص قابل للتحديد
التدقيق الأمني
آمنPure documentation skill containing PDF processing examples. No executable code, network calls, or sensitive operations. All code samples use standard Python libraries (pdfplumber, pypdf) for their stated purpose of PDF manipulation.
درجة الجودة
ماذا يمكنك بناءه
استخراج بيانات الجداول
سحب البيانات الجدولية من تقارير PDF إلى تنسيقات CSV أو جداول بيانات للتحليل.
أتمتة ملء النماذج
ملء نماذج PDF ببيانات من قواعد البيانات أو جداول البيانات برمجياً.
بناء مهام سير عمل PDF
إنشاء خطوط أنابيب لدمج وتقسيم ومعالجة مستندات PDF في التطبيقات.
جرّب هذه الموجهات
Extract all text from the PDF document located at [file_path] and save it to [output_file].
Find and extract all tables from [pdf_file] and save them as a CSV file.
Fill the PDF form at [form_path] with these values: [field_values]. Save as [output_path].
Merge these PDF files [file_list] into a single document called [output_name].
أفضل الممارسات
- تحقق من صحة ملفات PDF قبل المعالجة لتجنب الأخطاء في المستندات التالفة
- اعمل على نسخ من الملفات الأصلية لمنع فقدان البيانات العرضي
- تعامل مع الاستثناءات بشكل جيد للصفحات التي لا تحتوي على نص قابل للاستخراج
تجنب
- معالجة ملفات PDF بالكامل عند الحاجة إلى صفحات محددة فقط
- تخطي معالجة الأخطاء لملفات PDF الكبيرة أو المعقدة
- ملء النماذج دون تحليل بنية حقول النموذج أولاً