Инструментарий для обработки PDF
Подобранные

Инструментарий для обработки PDF

Полный PDF pipeline — извлекайте текст и таблицы, заполняйте формы, объединяйте и разделяйте документы, выполняйте OCR сканированных страниц и создавайте предпросмотры на уровне страниц.

3 навыки 3 установки
pdfdocument-processingocrformsextractionproductivity
Обновлено 4 дней назад

Установить

Выполните эту команду, чтобы установить все навыки в этом плагине:

npx skillstore add @pdf-processing-toolkit

CLI автоматически обнаруживает папки Codex и Claude Code и устанавливает в обе, когда они доступны.

Обзор

Руководство по использованию

Подробное руководство

## Обзор

Полный PDF pipeline — извлекайте текст и таблицы, заполняйте формы, объединяйте и разделяйте документы, выполняйте OCR сканированных страниц и создавайте предпросмотры на уровне страниц. Объединяет три взаимодополняющих навыка для общих, production-grade и глубоких PDF workflow извлечения.

## Быстрый старт

1. Установите: `npx skillstore add @pdf-processing-toolkit`
2. Извлеките текст из PDF: используйте **pdf-analyze**, чтобы получить текст, таблицы или metadata из любого документа
3. Обрабатывайте production workflows: используйте **pdf-processing-pro** для OCR, заполнения форм, batch processing и validation
4. Глубокая проверка страниц: используйте **pdf-page-extract**, чтобы извлекать текстовые spans по страницам, рендерить PNG previews и читать metadata страниц

## Ключевые команды

- **pdf-analyze** (21pounder): извлечение текстовых блоков, таблиц и metadata; создание PDFs; объединение/разделение документов; работа с полями форм — универсальные операции с PDF
- **pdf-processing-pro** (davila7): production-grade обработка PDF — OCR для сканированных документов, обнаружение и заполнение форм, batch processing для нескольких файлов, output validation
- **pdf-page-extract** (abejitsu): точность на уровне страниц — извлечение текста с данными position/span, рендеринг отдельных страниц как PNG images, получение количества страниц и размеров

## Советы

- Pipeline: используйте pdf-page-extract, чтобы рендерить страницы как изображения, затем передайте их в AI vision model для structured data extraction
- Batch large documents: pdf-processing-pro обрабатывает validation и error recovery в multi-file workflows
- Комбинируйте с ai-media-production-toolkit: создайте PDF report, затем отрендерьте его cover page как изображение для публикации

Навыки

3
📦

pdf-analyze

Высокий риск 38

Анализ и изменение PDF-документов

Рабочие процессы с PDF часто требуют нескольких библиотек и внимательной обработки форм. Этот навык дает Claude, Codex и Claude Code структурированные рекомендации для локального извлечения данных из PDF, конвертации, редактирования и заполнения форм.

📊 Офис и отчёты от 21pounder 📁⚙️
📦

pdf-processing-pro

Средний риск 77

Обработка PDF с формами, таблицами и OCR

Сложные PDF часто требуют анализа форм, извлечения таблиц, OCR и тщательной проверки. Этот навык предоставляет Claude, Codex и Claude Code практические рабочие процессы для локальных задач обработки PDF.

📊 Данные и аналитика от davila7 ⚙️📁🌐
📦

pdf-page-extract

Средний риск 73

Извлечение текстовых диапазонов и отрендеренных изображений из PDF

Извлеките подробные текстовые данные и визуальные элементы со страниц PDF. Этот навык захватывает метаданные шрифтов, позиции текста и отрендеренные изображения для обеспечения точных рабочих процессов генерации HTML на основе ИИ.

📊 Данные и аналитика от AbeJitsu ⚙️📁