Обработка и манипуляция PDF-документами
Также доступно от: ArtemisAI,Azeem-2,92Bilal26,92Bilal26,anthropics,ZhanlinCui,AutumnsGrove,DYAI2025,K-Dense-AI,davila7,Cam10001110101,ComposioHQ
Работа с PDF-формами, извлечение текста и таблиц, объединение или разделение документов и программное создание новых PDF-файлов. Этот навык устраняет необходимость ручного редактирования PDF, автоматизируя заполнение форм, извлечение данных и задачи по сборке документов.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «pdf». Извлечь поля формы из application.pdf
Ожидаемый результат:
- Прочитано 12 полей из application.pdf
- Информация о полях записана в fields.json:
- - name (текстовое поле, страница 1)
- - email (текстовое поле, страница 1)
- - age (текстовое поле, страница 1)
- - citizen_checkbox (флажок, страница 2)
- - signature (текстовое поле, страница 3)
Использование «pdf». Заполнить форму данными из field_values.json
Ожидаемый результат:
- Загружено 12 значений полей из field_values.json
- Проверка идентификаторов полей против PDF-формы...
- Все поля успешно проверены
- Запись заполненной формы в output.pdf
- Завершено: 12 полей заполнено
Аудит безопасности
Низкий рискStatic analysis detected 219 patterns across 12 files, but all are false positives. The 'external_commands' are markdown documentation code blocks, not executable code. 'Weak cryptographic algorithm' warnings are from test files using MD5 for non-security test data generation. 'C2 keywords' and 'system reconnaissance' are CLI argument parsing and legitimate system calls. The skill performs legitimate PDF processing using Python libraries (pypdf, pdfplumber, reportlab). Low risk due to filesystem operations and external tool dependencies (poppler-utils, qpdf) that require user-provided file paths.
Проблемы низкого риска (2)
Факторы риска
⚙️ Внешние команды (4)
🌐 Доступ к сети (1)
📁 Доступ к файловой системе (4)
Оценка качества
Что вы можете построить
Автоматизированная обработка форм
Извлечение определений полей из заполняемых PDF-форм, сопоставление данных пользователя с полями и создание заполненных форм без ручного ввода.
Извлечение данных из документов
Извлечение структурированного текста и таблиц из PDF-отчетов, счетов или документов для анализа и преобразования в другие форматы.
Сборка и генерация PDF
Объединение нескольких PDF, разделение больших документов, добавление водяных знаков или программное создание новых PDF из шаблонов.
Попробуйте эти промпты
У меня есть заполняемая PDF-форма по адресу [path]. Извлеките всю информацию о полях формы, включая имена, типы и расположение полей. Сохраните результат в JSON-файл, чтобы я мог сопоставить значения с каждым полем.
Заполните PDF-форму по адресу [input.pdf] используя значения из [field_values.json]. Форма содержит поля для имени, адреса и флажков. Проверьте правильность сопоставления всех полей перед созданием выходного файла.
Извлеките все таблицы из этого финансового отчета PDF. Преобразуйте каждую таблицу в pandas DataFrame и сохраните их в файл Excel на отдельных листах. По возможности сохраните заголовки столбцов и типы данных.
Эта PDF-форма не имеет заполняемых полей. Проанализируйте каждую страницу, чтобы определить, где следует ввести текст. Создайте ограничивающие рамки для меток и областей ввода, сгенерируйте изображения для проверки и добавьте текстовые аннотации в правильные позиции.
Лучшие практики
- Всегда визуально проверяйте ограничивающие рамки перед добавлением аннотаций к не заполняемым формам
- Тестируйте операции с PDF на копии перед обработкой оригинальных документов
- Указывайте явные размеры шрифта при добавлении текстовых аннотаций для правильного отображения
Избегать
- Не пропускайте этапы проверки при работе с не заполняемыми формами
- Избегайте использования путей по умолчанию; всегда указывайте явные расположения входных и выходных файлов
- Не предполагайте, что все PDF имеют заполняемые поля; проверяйте перед попыткой заполнения формы
Часто задаваемые вопросы
Какие библиотеки Python требуются для этого навыка?
Может ли этот навык заполнять отсканированные PDF-формы?
Как обрабатывать PDF без заполняемых полей?
Какие внешние инструменты нужны для командной строки?
Может ли этот навык извлекать таблицы из PDF?
Как обрабатываются значения флажков и переключателей?
Сведения для разработчиков
Автор
sickn33Лицензия
Proprietary. LICENSE.txt has complete terms
Репозиторий
https://github.com/sickn33/antigravity-awesome-skills/tree/main/web-app/public/skills/pdf-officialСсылка
main
Структура файлов