📦

pdf

مخاطر منخفضة ⚙️ الأوامر الخارجية🌐 الوصول إلى الشبكة📁 الوصول إلى نظام الملفات

Обработка и манипуляция PDF-документами

متاح أيضًا من: DYAI2025,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,davila7,Azeem-2,anthropics,92Bilal26,ArtemisAI,AutumnsGrove

Работа с PDF-формами, извлечение текста и таблиц, объединение или разделение документов и программное создание новых PDF-файлов. Этот навык устраняет необходимость ручного редактирования PDF, автоматизируя заполнение форм, извлечение данных и задачи по сборке документов.

يدعم: Claude Codex Code(CC)
🥉 73 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "pdf". Извлечь поля формы из application.pdf

النتيجة المتوقعة:

  • Прочитано 12 полей из application.pdf
  • Информация о полях записана в fields.json:
  • - name (текстовое поле, страница 1)
  • - email (текстовое поле, страница 1)
  • - age (текстовое поле, страница 1)
  • - citizen_checkbox (флажок, страница 2)
  • - signature (текстовое поле, страница 3)

استخدام "pdf". Заполнить форму данными из field_values.json

النتيجة المتوقعة:

  • Загружено 12 значений полей из field_values.json
  • Проверка идентификаторов полей против PDF-формы...
  • Все поля успешно проверены
  • Запись заполненной формы в output.pdf
  • Завершено: 12 полей заполнено

التدقيق الأمني

مخاطر منخفضة
v1 • 2/24/2026

Static analysis detected 219 patterns across 12 files, but all are false positives. The 'external_commands' are markdown documentation code blocks, not executable code. 'Weak cryptographic algorithm' warnings are from test files using MD5 for non-security test data generation. 'C2 keywords' and 'system reconnaissance' are CLI argument parsing and legitimate system calls. The skill performs legitimate PDF processing using Python libraries (pypdf, pdfplumber, reportlab). Low risk due to filesystem operations and external tool dependencies (poppler-utils, qpdf) that require user-provided file paths.

12
الملفات التي تم فحصها
1,909
الأسطر التي تم تحليلها
5
النتائج
1
إجمالي عمليات التدقيق
مشكلات منخفضة المخاطر (2)
Filesystem Write Operations
Scripts write output PDF and JSON files to disk. User controls file paths via CLI arguments, minimizing risk.
External Tool Dependencies
Documentation references external CLI tools (qpdf, pdftotext, pdfimages) that execute shell commands. These are documented usage patterns, not embedded malicious code.

عوامل الخطر

تم تدقيقه بواسطة: claude

درجة الجودة

59
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
22
المجتمع
86
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

Автоматизированная обработка форм

Извлечение определений полей из заполняемых PDF-форм, сопоставление данных пользователя с полями и создание заполненных форм без ручного ввода.

Извлечение данных из документов

Извлечение структурированного текста и таблиц из PDF-отчетов, счетов или документов для анализа и преобразования в другие форматы.

Сборка и генерация PDF

Объединение нескольких PDF, разделение больших документов, добавление водяных знаков или программное создание новых PDF из шаблонов.

جرّب هذه الموجهات

Извлечение полей формы PDF
У меня есть заполняемая PDF-форма по адресу [path]. Извлеките всю информацию о полях формы, включая имена, типы и расположение полей. Сохраните результат в JSON-файл, чтобы я мог сопоставить значения с каждым полем.
Заполнение PDF-формы данными
Заполните PDF-форму по адресу [input.pdf] используя значения из [field_values.json]. Форма содержит поля для имени, адреса и флажков. Проверьте правильность сопоставления всех полей перед созданием выходного файла.
Извлечение таблиц из PDF-отчета
Извлеките все таблицы из этого финансового отчета PDF. Преобразуйте каждую таблицу в pandas DataFrame и сохраните их в файл Excel на отдельных листах. По возможности сохраните заголовки столбцов и типы данных.
Добавление текстовых аннотаций к не заполняемой форме
Эта PDF-форма не имеет заполняемых полей. Проанализируйте каждую страницу, чтобы определить, где следует ввести текст. Создайте ограничивающие рамки для меток и областей ввода, сгенерируйте изображения для проверки и добавьте текстовые аннотации в правильные позиции.

أفضل الممارسات

  • Всегда визуально проверяйте ограничивающие рамки перед добавлением аннотаций к не заполняемым формам
  • Тестируйте операции с PDF на копии перед обработкой оригинальных документов
  • Указывайте явные размеры шрифта при добавлении текстовых аннотаций для правильного отображения

تجنب

  • Не пропускайте этапы проверки при работе с не заполняемыми формами
  • Избегайте использования путей по умолчанию; всегда указывайте явные расположения входных и выходных файлов
  • Не предполагайте, что все PDF имеют заполняемые поля; проверяйте перед попыткой заполнения формы

الأسئلة المتكررة

Какие библиотеки Python требуются для этого навыка?
Навык использует pypdf для основных операций с PDF, pdfplumber для извлечения текста и таблиц и reportlab для создания PDF. Установите с помощью: pip install pypdf pdfplumber reportlab
Может ли этот навык заполнять отсканированные PDF-формы?
Да, но требуется этап визуального анализа. Навык преобразует страницы PDF в изображения, определяет расположение полей с ограничивающими рамками, проверяет позиции, затем добавляет текстовые аннотации в правильные координаты.
Как обрабатывать PDF без заполняемых полей?
Следуйте рабочему процессу для не заполняемых форм: преобразуйте в изображения, создайте fields.json с ограничивающими рамками для меток и ввода, сгенерируйте изображения для проверки позиций, затем добавьте аннотации с помощью скрипта заполнения.
Какие внешние инструменты нужны для командной строки?
Для CLI-операций установите poppler-utils (предоставляет pdftotext, pdfimages) и qpdf. На Ubuntu: apt install poppler-utils qpdf. На macOS: brew install poppler qpdf
Может ли этот навык извлекать таблицы из PDF?
Да, используя pdfplumber. Навык может извлекать таблицы как структурированные данные и преобразовывать их в pandas DataFrame или файлы Excel для дальнейшего анализа.
Как обрабатываются значения флажков и переключателей?
Для заполняемых форм навык извлекает отмеченные/неотмеченные значения из PDF. Для флажков используйте checked_value для их отметки. Для групп переключателей выберите одно из значений radio_options.