📦

pdf

Risque faible 📁 Accès au système de fichiers⚙️ Commandes externes

معالجة مستندات PDF وتعبئة النماذج برمجياً

Également disponible depuis: DYAI2025,sickn33,Cam10001110101,92Bilal26,ComposioHQ,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI,AutumnsGrove

تتطلب مهام معالجة PDF أدوات متخصصة للاستخراج والمعالجة وتعبئة النماذج. توفر هذه المهارة قدرات شاملة للتعامل مع PDF باستخدام مكتبات Python وأدوات سطر الأوامر.

Prend en charge: Claude Codex Code(CC)
🥉 75 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pdf". استخراج النص من document.pdf

Résultat attendu:

تم استخراج 2450 حرفاً بنجاح من 5 صفحات. تم تحديد الأقسام الرئيسية: الملخص التنفيذي، البيانات المالية، الاستنتاجات.

Utilisation de "pdf". دمج file1.pdf, file2.pdf, file3.pdf

Résultat attendu:

تم إنشاء merged.pdf (15 صفحة إجمالاً) تجمع: file1.pdf (3 صفحات)، file2.pdf (7 صفحات)، file3.pdf (5 صفحات)

Utilisation de "pdf". تعبئة form.pdf بملف field_values.json

Résultat attendu:

تم تعبئة 12 حقل نموذج عبر صفحتين. تم حفظ الإخراج في form_filled.pdf مع قيم حقول تم التحقق منها.

Audit de sécurité

Risque faible
v1 • 2/24/2026

Static analysis flagged 217 potential issues, but most are false positives from markdown documentation files. External command detections are code examples in backticks (markdown formatting), not actual shell execution. Filesystem operations in Python scripts are legitimate PDF/JSON processing with user-provided paths. No confirmed malicious patterns detected.

11
Fichiers analysés
1,878
Lignes analysées
5
résultats
1
Total des audits
Problèmes à risque moyen (1)
External Command Execution Patterns
Static analysis detected shell command patterns in documentation files. These are markdown code examples demonstrating command-line tool usage (qpdf, pdftotext, pdfimages), not actual executable code. All commands are intended for user reference only.
Problèmes à risque faible (2)
Filesystem Write Operations
Python scripts perform file write operations for PDF output and JSON data. All file paths are provided as command-line arguments by the user, with no hardcoded paths or unauthorized file access.
Hardcoded Documentation URLs
Scripts contain hardcoded URLs pointing to PDF specification documentation (Adobe, WestHealth). These are reference links for developers, not network exfiltration endpoints.
Audité par: claude

Score de qualité

59
Architecture
100
Maintenabilité
87
Contenu
45
Communauté
81
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

استخراج البيانات من تقارير PDF

استخراج النص والجداول تلقائياً من تقارير PDF المالية أو العلمية لتحليل البيانات

تعبئة نماذج طلبات PDF

تعبئة نماذج PDF القابلة للتعبئة برمجياً ببيانات المستخدم مع التحقق من صحتها

معالجة دفعات مستندات PDF

دمج وتقسيم وتدوير وعلامات مائية لعدة مستندات PDF في سير عمل آلي

Essayez ces prompts

استخراج النص من ملف PDF
استخرج جميع محتوى النص من مستند PDF المرفق يلخص المعلومات الرئيسية.
دمج عدة ملفات PDF
دمج ملفات PDF هذه في مستند واحد بالترتيب: cover.pdf, chapter1.pdf, chapter2.pdf, appendix.pdf
تعبئة نموذج PDF ببيانات المستخدم
أحتاج إلى تعبئة نموذج الطلب هذا. استخرج معلومات الحقول أولاً، ثم سأقدم القيم لملء كل حقل.
استخراج الجداول وتحويلها إلى Excel
استخرج جميع الجداول من تقرير PDF المالي واحفظها كجدول بيانات Excel مع أوراق منفصلة لكل جدول

Bonnes pratiques

  • قم دائماً بالتحقق من صحة قيم حقول نموذج PDF قبل التعبئة لمنع الأخطاء
  • استخدم إعدادات عالية الدقة (300+ نقطة في البوصة) عند تحويل ملفات PDF إلى صور للتعرف البصري على الحروف
  • تحقق من تقاطعاتBounding Box عند إضافة التعليقات إلى ملفات PDF غير القابلة للتعبئة

Éviter

  • لا تتخطى التحقق البصري منBounding Boxes عند تعبئة النماذج غير القابلة للتعبئة
  • تجنب معالجة ملفات PDF المحمية بكلمة مرور دون فك تشفيرها أولاً
  • لا تفترض أن جميع ملفات PDF تحتوي على نص قابل للاستخراج - تتطلب ملفات PDF الممسوحة ضوئياً التعرف البصري على الحروف

Foire aux questions

ما مكتبات Python التي أحتاجها مثبتة؟
المكتبات الأساسية: pypdf, pdfplumber, reportlab. اختياري: pytesseract للتعرف البصري على الحروف، pdf2image لتحويل PDF إلى صورة. تثبيت مع: pip install pypdf pdfplumber reportlab
كيف أتعامل مع ملفات PDF الممسوحة ضوئياً بدون نص؟
تحتاج ملفات PDF الممسوحة ضوئياً إلى معالجة التعرف البصري على الحروف. استخدم سير عمل pytesseract: تحويل صفحات PDF إلى صور باستخدام pdf2image، ثم تطبيق pytesseract.image_to_string() لاستخراج النص.
هل يمكن لهذه المهارة تعبئة نماذج PDF غير القابلة للتعبئة؟
نعم، عن طريق إضافة تعليقات نصية في المواقع المحسوبة. تتضمن العملية تحويل PDF إلى صور، وتحديد مواقع الحقول بصرياً، وإنشاءBounding Boxes، وإضافة التعليقات.
ما أدوات سطر الأوامر المتاحة؟
poppler-utils (pdftotext, pdfimages, pdftoppm)، qpdf للدمج/التقسيم، و pdftk للعمليات المتقدمة. تثبيت poppler-utils و qpdf عبر مدير حزم النظام.
كيف أستخرج الجداول من ملفات PDF؟
استخدم طريقة extract_tables() من pdfplumber. للجداول المعقدة، قم بتكوين table_settings مع معلمات vertical_strategy و horizontal_strategy لكشف أفضل.
هل يمكنني معالجة ملفات PDF المشفرة؟
نعم، إذا كانت لديك كلمة المرور. استخدم طريقة decrypt() من pypdf أو خيار qpdf --password. بدون كلمة المرور، لا يمكن معالجة ملفات PDF المشفرة.