📄

pdf

آمن ⚙️ الأوامر الخارجية📁 الوصول إلى نظام الملفات🌐 الوصول إلى الشبكة

Эффективная обработка PDF-документов

متاح أيضًا من: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,davila7,anthropics,92Bilal26,ArtemisAI,AutumnsGrove

Нужно извлекать данные из PDF, заполнять формы или создавать документы. Этот навык предоставляет комплексные инструменты для работы с PDF: извлечение текста и таблиц, объединение документов и программное заполнение форм.

يدعم: Claude Codex Code(CC)
🥉 74 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "pdf". Extract all tables from report.pdf and save to Excel

النتيجة المتوقعة:

  • Found 3 tables in report.pdf
  • Table 1 (page 2): Financial Summary - saved to Sheet1
  • Table 2 (page 5): Monthly Breakdown - saved to Sheet2
  • Table 3 (page 8): Year-over-Year Comparison - saved to Sheet3
  • Output saved to report_tables.xlsx

استخدام "pdf". Merge contract1.pdf and contract2.pdf into combined.pdf

النتيجة المتوقعة:

  • Successfully merged 2 PDF files
  • Combined document has 12 total pages
  • Output saved to combined.pdf

التدقيق الأمني

آمن
v5 • 1/16/2026

All 227 static findings are FALSE POSITIVES. The scanner incorrectly flagged code examples within markdown documentation files (SKILL.md, forms.md, reference.md) as executable security threats. The actual Python scripts use standard PDF libraries (pypdf, pdfplumber, reportlab) for legitimate document processing. No command injection, no data exfiltration, no C2 communication. The skill performs exactly what it claims: PDF text extraction, form filling, merging, splitting, and document creation.

13
الملفات التي تم فحصها
2,147
الأسطر التي تم تحليلها
3
النتائج
5
إجمالي عمليات التدقيق

عوامل الخطر

⚙️ الأوامر الخارجية (3)
📁 الوصول إلى نظام الملفات (2)
🌐 الوصول إلى الشبكة (1)
تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

59
الهندسة المعمارية
100
قابلية الصيانة
85
المحتوى
20
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

Извлечение табличных данных

Извлечение таблиц и структурированных данных из PDF-отчётов для анализа в электронных таблицах или базах данных

Автоматизация заполнения форм

Программное заполнение PDF-форм данными из других источников без ручного ввода

Объединение документов

Объединение нескольких PDF-файлов в один документ или разделение больших PDF на части

جرّب هذه الموجهات

Извлечение текста
Извлеките весь текст из PDF-документа по адресу [file_path] и сохраните его в [output_file]. Используйте pdfplumber для лучших результатов извлечения текста.
Извлечение таблиц
Извлеките все таблицы из [file_path] и сохраните их в файл Excel. Каждая таблица должна быть на отдельном листе.
Объединение PDF
Объедините следующие PDF в один документ: [list of files]. Сохраните результат как [output_file].
Заполнение формы
Заполните PDF-форму по адресу [file_path] следующими значениями полей: [field_values]. Сохраните заполненную форму как [output_file].

أفضل الممارسات

  • Проверяйте поля формы PDF перед заполнением, чтобы убедиться в правильности идентификаторов полей и допустимых значений
  • Сначала конвертируйте PDF в изображения при анализе незаполняемых форм для визуального макета
  • Используйте проверку ограничивающих рамок для предотвращения перекрывающихся аннотаций в полях формы

تجنب

  • Попытка заполнить формы без предварительной проверки наличия заполняемых полей в PDF
  • Жёсткое задание размеров шрифта без учёта размеров ограничивающей рамки записи
  • Пропуск проверки изображения при работе с незаполняемыми PDF-формами

الأسئلة المتكررة

Какие библиотеки Python требуются?
Основные библиотеки: pypdf, pdfplumber, reportlab. Для изображений: pdf2image, Pillow. Для OCR: pytesseract.
Можно ли заполнять заполняемые PDF-формы?
Да. Сначала используйте check_fillable_fields.py, затем extract_form_field_info.py для получения данных полей, затем fill_fillable_fields.py для заполнения.
Как заполнить незаполняемый PDF?
Конвертируйте в изображения с помощью convert_pdf_to_images.py, проанализируйте визуальный макет, создайте fields.json с ограничивающими рамками, проверьте с помощью check_bounding_boxes.py, затем используйте fill_pdf_form_with_annotations.py.
Безопасны ли мои данные?
Да. Вся обработка выполняется локально. Файлы читаются и записываются только по указанным путям. Сетевые запросы не выполняются.
Почему значения моей формы не отображаются?
Установите need_appearances_writer в True для некоторых просмотрщиков PDF. Также убедитесь, что идентификаторы полей совпадают точно и значения допустимы для типа поля.
Чем это отличается от онлайн-инструментов PDF?
Это работает локально без передачи данных с вашей системы. Это позволяет автоматизировать и пакетно обрабатывать с точным контролем над выводом.

تفاصيل المطور

المؤلف

Azeem-2

الترخيص

Proprietary. LICENSE.txt has complete terms

مرجع

master