技能 enact/firecrawl

🕸️

enact/firecrawl

Name: enact/firecrawl
Author: EnactProtocol

低风险 🌐 网络访问🔑 环境变量

将网站抓取为markdown

网页抓取非常耗时，并且经常因为反爬虫措施而失败。此技能使用Firecrawl API将网站可靠地转换为干净的、适用于LLM的markdown格式，并支持结构化数据提取。

支持: Claude Codex Code(CC)

⚠️ 66 差

下载技能 ZIP

在 Claude 中上传

前往设置 → 功能 → 技能 → 上传技能

开启并开始使用

测试它

正在使用“enact/firecrawl”。 https://example.com/blog post

预期结果:

博客文章提取为干净的markdown格式，包含标题、段落和链接。

正在使用“enact/firecrawl”。 https://news.ycombinator.com with extract action

预期结果:

前5条新闻标题列表，包含URL和分数，以结构化格式呈现。

安全审计

低风险

v1 • 1/23/2026

This is a legitimate web scraping tool that makes authenticated API calls to Firecrawl. Static analysis flagged expected patterns (network requests + environment variable access for API credentials) as suspicious, but these represent standard API client behavior. No malicious intent or dangerous code patterns were found.

已扫描文件

475

分析行数

发现项

审计总数

风险因素

🌐 网络访问 (9)

firecrawl.py:10 firecrawl.py:23-36 firecrawl.py:42-56 firecrawl.py:69-73 firecrawl.py:92-101 firecrawl.py:106-118 firecrawl.py:137-145 firecrawl.py:159-163 firecrawl.py:230-236

🔑 环境变量 (2)

firecrawl.py:13-18 firecrawl.py:195-199

审计者: claude

质量评分

架构

100

可维护性

内容

社区

安全

规范符合性

你能构建什么

研究和数据收集

从多个网络来源收集信息，用于研究项目、竞争对手分析或市场调研。将文档、文章和产品页面转换为干净的markdown，以便进行AI处理。

文档摄取

抓取和爬取技术文档网站，创建离线知识库。非常适合为AI助手构建上下文或归档文档。

内容聚合

从网站中提取结构化数据，如新闻标题、价格表、产品列表或事件日历。使用自然语言提示或JSON模式进行精确提取。

试试这些提示

基本页面抓取

Scrape the content from ${url} and return it as clean markdown.

爬取文档网站

Crawl ${url} with a limit of ${limit} pages. Extract all content as markdown.

提取结构化数据

Extract structured data from ${url} using this schema: ${schema}. Prompt: ${prompt}

网络搜索

Search the web for "${query}" and return the top ${limit} results with full scraped content.

最佳实践

使用前设置 FIRECRAWL_API_KEY 环境变量以向Firecrawl服务进行身份验证
对相似页面的结构化数据提取，使用带JSON模式的提取操作以获得一致的结果
在运行昂贵的爬取操作之前，先使用映射操作发现网站结构

避免

未经授权不得用于抓取个人或私人数据
避免过度爬取可能给目标网站造成压力 - 尊重速率限制和robots.txt
不要仅依赖截图进行数据提取 - markdown和结构化提取更可靠

常见问题

什么是 FIRECRAWL_API_KEY，我在哪里可以获得它？

FIRECRAWL_API_KEY 是您向Firecrawl服务进行身份验证的令牌。通过在 firecrawl.dev 注册并从仪表板复制您的API密钥来获取。

抓取、爬取、映射、搜索和提取操作之间有什么区别？

抓取操作从一个URL获取内容。爬取操作发现并抓取网站上的所有页面。映射操作列出URL而不提取内容。搜索操作查询网络并返回结果。提取操作使用AI提取结构化数据。

支持哪些输出格式？

抓取和爬取操作支持markdown、HTML、链接和截图格式。使用formats参数指定逗号分隔的输出类型。

我可以爬取多少页面？

爬取操作具有可配置的limit参数。Firecrawl API还根据您的订阅层级有速率限制。

我可以将数据提取为特定格式吗？

是的。使用带有JSON模式的提取操作来定义您想要的数据结构。AI将从页面内容中提取匹配的字段。

这适用于JavaScript密集型的单页应用吗？

是的。Firecrawl处理JavaScript渲染并可以从动态单页应用中提取内容，尽管处理时间可能比静态页面要长。

开发者详情

作者

EnactProtocol

许可证

MIT

仓库

https://github.com/EnactProtocol/enact/tree/main/examples/tools/firecrawl

引用

main

文件结构

📄 firecrawl.py

📄 SKILL.md