Эффективная обработка PDF-документов
متاح أيضًا من: DYAI2025,sickn33,Cam10001110101,92Bilal26,ZhanlinCui,ComposioHQ,K-Dense-AI,Azeem-2,anthropics,92Bilal26,ArtemisAI,AutumnsGrove
Ручная обработка PDF занимает много времени и подвержена ошибкам. Этот навык обеспечивает программный доступ для извлечения текста, объединения документов, заполнения форм и конвертации файлов с использованием библиотек Python.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "pdf". Extract text from quarterly_report.pdf
النتيجة المتوقعة:
- Successfully extracted text from 24 pages
- Saved to quarterly_report.txt (45,678 characters)
- Found 8 tables on pages 5, 12, 18-20
استخدام "pdf". Merge contract1.pdf, contract2.pdf, and appendix.pdf
النتيجة المتوقعة:
- Merged 3 documents into combined_contract.pdf
- Total pages: 47
- All bookmarks and links preserved
استخدام "pdf". Fill application_form.pdf with data from applicant.json
النتيجة المتوقعة:
- Filled 12 form fields
- Saved to application_filled.pdf
- Validated all field values successfully
التدقيق الأمني
آمنAll 228 static findings are FALSE POSITIVES. The skill contains legitimate PDF processing documentation and Python scripts. Findings are caused by markdown code formatting (backticks), PDF annotation syntax misidentified as crypto, and standard file I/O for document processing.
عوامل الخطر
📁 الوصول إلى نظام الملفات (2)
⚡ يحتوي على سكربتات (2)
درجة الجودة
ماذا يمكنك بناءه
Извлечение данных таблиц
Извлечение структурированных таблиц из исследовательских работ и отчетов в электронные таблицы для анализа.
Автоматизация заполнения форм
Пакетная обработка заполняемых PDF-форм путем сопоставления данных из конфигураций JSON.
Организация документов дела
Объединение и разделение юридических документов, извлечение ключевых текстовых фрагментов и создание стандартизированных отчетов.
جرّب هذه الموجهات
Extract all text from {filename.pdf} and save it to {output.txt}Merge {file1.pdf}, {file2.pdf}, and {file3.pdf} into a single document named {combined.pdf}Fill the PDF form at {form.pdf} using the field values in {values.json}. Save the result as {filled.pdf}Extract all tables from {document.pdf} and save them to an Excel spreadsheet with each table on a separate sheetأفضل الممارسات
- Проверяйте наличие полей формы PDF перед заполнением, запустив check_fillable_fields.py
- Используйте проверочные изображения для подтверждения точности ограничивающих рамок для незаполняемых форм
- Тестируйте на небольшом наборе файлов перед пакетной обработкой больших наборов документов
تجنب
- Обработка защищенных паролем PDF без предварительной проверки шифрования
- Пропуск этапов проверки при заполнении незаполняемых аннотаций форм
- Предположение, что все отсканированные PDF содержат извлекаемый текст без OCR
الأسئلة المتكررة
Может ли этот навык обрабатывать отсканированные PDF?
Какие типы PDF-форм поддерживаются?
Как заполнить незаполняемые PDF-формы?
Безопасна ли обработка PDF для моих данных?
Почему мои аннотации не видны в средстве просмотра PDF?
Чем это отличается от Adobe Acrobat?
تفاصيل المطور
بنية الملفات