📦

pdf

Name: pdf
Author: ZhanlinCui

مخاطر منخفضة 📁 الوصول إلى نظام الملفات⚙️ الأوامر الخارجية

معالجة مستندات PDF وتعبئة النماذج برمجياً

متاح أيضًا من: ArtemisAI,sickn33,Azeem-2,92Bilal26,92Bilal26,anthropics,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ

تتطلب مهام معالجة PDF أدوات متخصصة للاستخراج والمعالجة وتعبئة النماذج. توفر هذه المهارة قدرات شاملة للتعامل مع PDF باستخدام مكتبات Python وأدوات سطر الأوامر.

يدعم: Claude Codex Code(CC)

🥉 75 برونزي

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "pdf". استخراج النص من document.pdf

النتيجة المتوقعة:

تم استخراج 2450 حرفاً بنجاح من 5 صفحات. تم تحديد الأقسام الرئيسية: الملخص التنفيذي، البيانات المالية، الاستنتاجات.

استخدام "pdf". دمج file1.pdf, file2.pdf, file3.pdf

النتيجة المتوقعة:

تم إنشاء merged.pdf (15 صفحة إجمالاً) تجمع: file1.pdf (3 صفحات)، file2.pdf (7 صفحات)، file3.pdf (5 صفحات)

استخدام "pdf". تعبئة form.pdf بملف field_values.json

النتيجة المتوقعة:

تم تعبئة 12 حقل نموذج عبر صفحتين. تم حفظ الإخراج في form_filled.pdf مع قيم حقول تم التحقق منها.

التدقيق الأمني

مخاطر منخفضة

v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

الملفات التي تم فحصها

1,878

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

مشكلات متوسطة المخاطر (1)

forms.md:4 reference.md:11 SKILL.md:15

External Command Execution Patterns

Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.

مشكلات منخفضة المخاطر (2)

scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

Filesystem Write Operations

Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.

scripts/extract_form_field_info.py:32 scripts/extract_form_field_info.py:81

Hardcoded Documentation URLs

Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.

عوامل الخطر

📁 الوصول إلى نظام الملفات (4)

reference.md:59 scripts/extract_form_field_info.py:143 scripts/fill_fillable_fields.py:55 scripts/fill_pdf_form_with_annotations.py:93

⚙️ الأوامر الخارجية (5)

forms.md:4 reference.md:11 SKILL.md:15 scripts/check_bounding_boxes.py:6 scripts/extract_form_field_info.py:11

تم تدقيقه بواسطة: claude

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

استخراج البيانات من تقارير PDF

استخراج النص والجداول تلقائياً من تقارير PDF المالية أو العلمية لتحليل البيانات

تعبئة نماذج طلبات PDF

تعبئة نماذج PDF القابلة للتعبئة برمجياً ببيانات المستخدم مع التحقق من صحتها

معالجة دفعات مستندات PDF

دمج وتقسيم وتدوير وعلامات مائية لعدة مستندات PDF في سير عمل آلي

جرّب هذه الموجهات

استخراج النص من ملف PDF

استخرج جميع محتوى النص من مستند PDF المرفق يلخص المعلومات الرئيسية.

دمج عدة ملفات PDF

دمج ملفات PDF هذه في مستند واحد بالترتيب: cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf

تعبئة نموذج PDF ببيانات المستخدم

أحتاج إلى تعبئة نموذج الطلب هذا. استخرج معلومات الحقول أولاً، ثم سأقدم القيم لملء كل حقل.

استخراج الجداول وتحويلها إلى Excel

استخرج جميع الجداول من تقرير PDF المالي واحفظها كجدول بيانات Excel مع أوراق منفصلة لكل جدول

أفضل الممارسات

قم دائماً بالتحقق من صحة قيم حقول نموذج PDF قبل التعبئة لمنع الأخطاء
استخدم إعدادات عالية الدقة (300+ نقطة في البوصة) عند تحويل ملفات PDF إلى صور للتعرف البصري على الحروف
تحقق من تقاطعاتBounding Box عند إضافة التعليقات إلى ملفات PDF غير القابلة للتعبئة

تجنب

لا تتخطى التحقق البصري منBounding Boxes عند تعبئة النماذج غير القابلة للتعبئة
تجنب معالجة ملفات PDF المحمية بكلمة مرور دون فك تشفيرها أولاً
لا تفترض أن جميع ملفات PDF تحتوي على نص قابل للاستخراج - تتطلب ملفات PDF الممسوحة ضوئياً التعرف البصري على الحروف

الأسئلة المتكررة

ما مكتبات Python التي أحتاجها مثبتة؟

المكتبات الأساسية: pypdf, pdfplumber, reportlab. اختياري: pytesseract للتعرف البصري على الحروف، pdf2image لتحويل PDF إلى صورة. تثبيت مع: pip install pypdf pdfplumber reportlab

كيف أتعامل مع ملفات PDF الممسوحة ضوئياً بدون نص؟

تحتاج ملفات PDF الممسوحة ضوئياً إلى معالجة التعرف البصري على الحروف. استخدم سير عمل pytesseract: تحويل صفحات PDF إلى صور باستخدام pdf2image، ثم تطبيق pytesseract.image_to_string() لاستخراج النص.

هل يمكن لهذه المهارة تعبئة نماذج PDF غير القابلة للتعبئة؟

نعم، عن طريق إضافة تعليقات نصية في المواقع المحسوبة. تتضمن العملية تحويل PDF إلى صور، وتحديد مواقع الحقول بصرياً، وإنشاءBounding Boxes، وإضافة التعليقات.

ما أدوات سطر الأوامر المتاحة؟

poppler-utils (pdftotext, pdfimages, pdftoppm)، qpdf للدمج/التقسيم، و pdftk للعمليات المتقدمة. تثبيت poppler-utils و qpdf عبر مدير حزم النظام.

كيف أستخرج الجداول من ملفات PDF؟

استخدم طريقة extract_tables() من pdfplumber. للجداول المعقدة، قم بتكوين table_settings مع معلمات vertical_strategy و horizontal_strategy لكشف أفضل.

هل يمكنني معالجة ملفات PDF المشفرة؟

نعم، إذا كانت لديك كلمة المرور. استخدم طريقة decrypt() من pypdf أو خيار qpdf --password. بدون كلمة المرور، لا يمكن معالجة ملفات PDF المشفرة.