firecrawl-build-scrape
Извлечение контента с любой веб-страницы с помощью Firecrawl
Приложения часто содержат URL-адреса, но нуждаются в чистом содержимом страницы. Этот навык предоставляет простой способ интеграции веб-скрапинга Firecrawl для извлечения контента одной страницы в формате markdown, HTML или структурированных данных.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"firecrawl-build-scrape" 사용 중입니다. https://docs.example.com/getting-started
예상 결과:
Контент страницы извлечен в виде чистого markdown с сохранением заголовков, блоков кода и ссылок. Навигация и нижний колонтитул удалены по умолчанию.
"firecrawl-build-scrape" 사용 중입니다. https://news.example.com/article/123
예상 결과:
Основной текст статьи извлечен с заголовком, автором, датой публикации и основным содержимым. Боковая реклама и связанные статьи отфильтрованы.
보안 감사
안전All static analysis findings are false positives. The detected patterns represent legitimate documentation formatting (markdown backticks, relative doc links) and intentional skill design (API key input for Firecrawl authentication). No security risks identified.
품질 점수
만들 수 있는 것
Загрузка базы знаний
Загружать контент из страниц документации, блогов или статей в векторную базу данных для семантического поиска.
Автоматизация маркетинговых исследований
Извлекать цены, характеристики продуктов или информацию из журнала изменений с сайтов конкурентов или отраслевых сайтов.
Мониторинг качества контента
Отслеживать изменения контента на определенных страницах, извлекать метаданные или проверять структуру страницы.
이 프롬프트를 사용해 보세요
Use the firecrawl-build-scrape skill to extract the main content from {URL} as markdown.Use firecrawl-build-scrape to get the page at {URL} and extract all heading and paragraph content as structured markdown.Use firecrawl-build-scrape to extract content from {URL} using a wait of 5 seconds to handle JavaScript rendering.Use firecrawl-build-scrape to extract markdown content and links from {URL}, then format the results for a database schema.모범 사례
- Начинайте с формата markdown для потребления LLM, если не требуется определенное форматирование
- Используйте фильтр onlyMainContent для страниц статей с шумом навигации
- Перед написанием кода интеграции ознакомьтесь с официальной документацией на соответствующем языке
피하기
- Не используйте scrape, когда нужно обнаружить URL-адреса; вместо этого используйте навык search
- Не пропускайте опцию wait на страницах с интенсивным JavaScript без предварительного тестирования
- Не запрашивайте несколько форматов, когда нужен только один; сохраняйте интеграцию узконаправленной