技能 firecrawl-scraper
📦

firecrawl-scraper

安全

使用 Firecrawl 抓取网站

使用 Firecrawl API 提取网站深层内容,包括文本、截图和 PDF 文档。非常适合构建数据集、监控竞争对手或自动化研究。

支持: Claude Codex Code(CC)
🥉 74 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“firecrawl-scraper”。 Scrape https://example.com/blog/article-1

预期结果:

成功提取文章内容。标题:'Getting Started with Firecrawl'。内容长度:2500 字。发现 3 张图片和 5 个内部链接。

正在使用“firecrawl-scraper”。 Take a screenshot of https://example.com

预期结果:

截图已保存到 [filename].png。页面加载成功,所有 JavaScript 已渲染。

安全审计

安全
v1 • 2/25/2026

All four static findings are false positives. The skill is legitimate documentation for the Firecrawl API web scraping tool. No malicious code, command injection, or prompt injection detected. The skill simply provides installation instructions and usage guidance for the Firecrawl API.

1
已扫描文件
40
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
85
内容
50
社区
100
安全
91
规范符合性

你能构建什么

研究数据收集

自动化从多个来源收集公开可用数据,用于研究项目、市场分析或竞争情报。

内容归档

捕获并归档网页内容,包括截图和 PDF 文档,用于文档记录、合规性或离线访问。

潜在客户开发

从商业目录和网站提取联系信息、公司详情和其他相关数据。

试试这些提示

基本页面抓取
Use the firecrawl-scraper skill to extract all text content from [URL]
截图捕获
Use firecrawl-scraper to take a screenshot of [URL] and save it
批量 URL 提取
Use firecrawl-scraper to scrape content from these URLs: [list of URLs]. Extract the main content from each and provide a summary.
PDF 文档解析
Use firecrawl-scraper to extract text from [PDF URL or upload]

最佳实践

  • 使用前将 Firecrawl API 密钥配置为环境变量
  • 在尝试批量操作之前先从单个 URL 提取开始
  • 抓取时尊重网站服务条款和 robots.txt
  • 在请求之间使用适当的延迟以避免速率限制

避免

  • 不要在未经授权的情况下用于抓取登录墙背后的受保护内容
  • 避免可能影响目标网站性能的激进爬取
  • 不要用于绕过付费访问或订阅内容
  • 避免在未经适当同意和遵守隐私法的情况下抓取个人数据

常见问题

使用此技能需要 API 密钥吗?
是的,您需要 Firecrawl API 密钥。请在 firecrawl.dev 注册以获取您的 API 密钥。
此技能可以绕过身份验证吗?
不,此技能无法访问需要登录墙或身份验证的内容。它只能抓取公开可访问的内容。
网页抓取合法吗?
这取决于网站和司法管辖区。请务必尊重 robots.txt 和服务条款。未经同意不要抓取个人数据。
我可以从网站抓取无限页面吗?
不,您应该设置合理的限制。配置爬取深度和页面限制以避免使目标网站过载。
Firecrawl 可以提取哪些格式?
Firecrawl 可以提取 Markdown、HTML、文本、截图(PNG/JPG),并解析 PDF 以获取文本内容。
如何处理速率限制?
在请求之间配置适当的延迟。查看 Firecrawl API 文档了解速率限制详情,考虑升级您的计划以获得更高的限制。

开发者详情

文件结构

📄 SKILL.md