스킬 firecrawl-build-scrape
🔍

firecrawl-build-scrape

안전

Извлечение контента с любой веб-страницы с помощью Firecrawl

Приложения часто содержат URL-адреса, но нуждаются в чистом содержимом страницы. Этот навык предоставляет простой способ интеграции веб-скрапинга Firecrawl для извлечения контента одной страницы в формате markdown, HTML или структурированных данных.

지원: Claude Codex Code(CC)
📊 71 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"firecrawl-build-scrape" 사용 중입니다. https://docs.example.com/getting-started

예상 결과:

Контент страницы извлечен в виде чистого markdown с сохранением заголовков, блоков кода и ссылок. Навигация и нижний колонтитул удалены по умолчанию.

"firecrawl-build-scrape" 사용 중입니다. https://news.example.com/article/123

예상 결과:

Основной текст статьи извлечен с заголовком, автором, датой публикации и основным содержимым. Боковая реклама и связанные статьи отфильтрованы.

보안 감사

안전
v1 • 4/30/2026

All static analysis findings are false positives. The detected patterns represent legitimate documentation formatting (markdown backticks, relative doc links) and intentional skill design (API key input for Firecrawl authentication). No security risks identified.

1
스캔된 파일
69
분석된 줄 수
0
발견 사항
1
총 감사 수
보안 문제를 찾지 못했습니다
감사자: claude

품질 점수

38
아키텍처
100
유지보수성
87
콘텐츠
31
커뮤니티
100
보안
91
사양 준수

만들 수 있는 것

Загрузка базы знаний

Загружать контент из страниц документации, блогов или статей в векторную базу данных для семантического поиска.

Автоматизация маркетинговых исследований

Извлекать цены, характеристики продуктов или информацию из журнала изменений с сайтов конкурентов или отраслевых сайтов.

Мониторинг качества контента

Отслеживать изменения контента на определенных страницах, извлекать метаданные или проверять структуру страницы.

이 프롬프트를 사용해 보세요

Базовое извлечение страницы
Use the firecrawl-build-scrape skill to extract the main content from {URL} as markdown.
Извлечение структурированных данных
Use firecrawl-build-scrape to get the page at {URL} and extract all heading and paragraph content as structured markdown.
Страница с JavaScript-рендерингом
Use firecrawl-build-scrape to extract content from {URL} using a wait of 5 seconds to handle JavaScript rendering.
Многоформатное извлечение
Use firecrawl-build-scrape to extract markdown content and links from {URL}, then format the results for a database schema.

모범 사례

  • Начинайте с формата markdown для потребления LLM, если не требуется определенное форматирование
  • Используйте фильтр onlyMainContent для страниц статей с шумом навигации
  • Перед написанием кода интеграции ознакомьтесь с официальной документацией на соответствующем языке

피하기

  • Не используйте scrape, когда нужно обнаружить URL-адреса; вместо этого используйте навык search
  • Не пропускайте опцию wait на страницах с интенсивным JavaScript без предварительного тестирования
  • Не запрашивайте несколько форматов, когда нужен только один; сохраняйте интеграцию узконаправленной

자주 묻는 질문

Когда следует использовать /scrape вместо /crawl?
Используйте scrape, когда у вас есть конкретный URL-адрес и нужен контент с одной страницы. Используйте crawl, когда нужно обнаружить и извлечь контент с нескольких страниц.
Какой формат следует запрашивать у API?
По умолчанию используйте markdown для потребления LLM или конвейера поиска. Используйте HTML для сохранения структуры или JSON для программного парсинга.
Как обрабатывать страницы, которые загружают контент с помощью JavaScript?
Добавьте опцию wait (5-10 секунд), чтобы позволить странице полностью отрисоваться перед извлечением.
Можно ли использовать этот навык с самостоятельно развернутым экземпляром Firecrawl?
Да, установите необязательный входной параметр FIRECRAWL_API_URL на адрес вашего самостоятельно развернутого экземпляра вместо сервиса по умолчанию.
Что если страница имеет аутентификацию или платный доступ?
Scrape не может обходить аутентификацию. Для контента с аутентификацией требуется извлечение на основе браузера с файлами cookie или токенами сессии.
Как извлечь только основной контент без навигации?
Используйте опцию onlyMainContent, чтобы отфильтровать навигацию, заголовки и нижние колонтитулы, сохраняя только основной контент страницы.

개발자 세부 정보

파일 구조

📄 SKILL.md