enact/firecrawl
将网站抓取为markdown
网页抓取非常耗时,并且经常因为反爬虫措施而失败。此技能使用Firecrawl API将网站可靠地转换为干净的、适用于LLM的markdown格式,并支持结构化数据提取。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「enact/firecrawl」。 https://example.com/blog post
預期結果:
博客文章提取为干净的markdown格式,包含标题、段落和链接。
正在使用「enact/firecrawl」。 https://news.ycombinator.com with extract action
預期結果:
前5条新闻标题列表,包含URL和分数,以结构化格式呈现。
安全審計
低風險This is a legitimate web scraping tool that makes authenticated API calls to Firecrawl. Static analysis flagged expected patterns (network requests + environment variable access for API credentials) as suspicious, but these represent standard API client behavior. No malicious intent or dangerous code patterns were found.
風險因素
品質評分
你能建構什麼
研究和数据收集
从多个网络来源收集信息,用于研究项目、竞争对手分析或市场调研。将文档、文章和产品页面转换为干净的markdown,以便进行AI处理。
文档摄取
抓取和爬取技术文档网站,创建离线知识库。非常适合为AI助手构建上下文或归档文档。
内容聚合
从网站中提取结构化数据,如新闻标题、价格表、产品列表或事件日历。使用自然语言提示或JSON模式进行精确提取。
試試這些提示
Scrape the content from ${url} and return it as clean markdown.Crawl ${url} with a limit of ${limit} pages. Extract all content as markdown.Extract structured data from ${url} using this schema: ${schema}. Prompt: ${prompt}Search the web for "${query}" and return the top ${limit} results with full scraped content.最佳實務
- 使用前设置 FIRECRAWL_API_KEY 环境变量以向Firecrawl服务进行身份验证
- 对相似页面的结构化数据提取,使用带JSON模式的提取操作以获得一致的结果
- 在运行昂贵的爬取操作之前,先使用映射操作发现网站结构
避免
- 未经授权不得用于抓取个人或私人数据
- 避免过度爬取可能给目标网站造成压力 - 尊重速率限制和robots.txt
- 不要仅依赖截图进行数据提取 - markdown和结构化提取更可靠