firecrawl-scraper
使用 Firecrawl 抓取网站
使用 Firecrawl API 提取网站深层内容,包括文本、截图和 PDF 文档。非常适合构建数据集、监控竞争对手或自动化研究。
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“firecrawl-scraper”。 Scrape https://example.com/blog/article-1
预期结果:
成功提取文章内容。标题:'Getting Started with Firecrawl'。内容长度:2500 字。发现 3 张图片和 5 个内部链接。
正在使用“firecrawl-scraper”。 Take a screenshot of https://example.com
预期结果:
截图已保存到 [filename].png。页面加载成功,所有 JavaScript 已渲染。
安全审计
安全All four static findings are false positives. The skill is legitimate documentation for the Firecrawl API web scraping tool. No malicious code, command injection, or prompt injection detected. The skill simply provides installation instructions and usage guidance for the Firecrawl API.
质量评分
你能构建什么
研究数据收集
自动化从多个来源收集公开可用数据,用于研究项目、市场分析或竞争情报。
内容归档
捕获并归档网页内容,包括截图和 PDF 文档,用于文档记录、合规性或离线访问。
潜在客户开发
从商业目录和网站提取联系信息、公司详情和其他相关数据。
试试这些提示
Use the firecrawl-scraper skill to extract all text content from [URL]
Use firecrawl-scraper to take a screenshot of [URL] and save it
Use firecrawl-scraper to scrape content from these URLs: [list of URLs]. Extract the main content from each and provide a summary.
Use firecrawl-scraper to extract text from [PDF URL or upload]
最佳实践
- 使用前将 Firecrawl API 密钥配置为环境变量
- 在尝试批量操作之前先从单个 URL 提取开始
- 抓取时尊重网站服务条款和 robots.txt
- 在请求之间使用适当的延迟以避免速率限制
避免
- 不要在未经授权的情况下用于抓取登录墙背后的受保护内容
- 避免可能影响目标网站性能的激进爬取
- 不要用于绕过付费访问或订阅内容
- 避免在未经适当同意和遵守隐私法的情况下抓取个人数据