Habilidades enact/firecrawl

🕸️

enact/firecrawl

Name: enact/firecrawl
Author: EnactProtocol

Riesgo bajo 🌐 Acceso a red🔑 Variables de entorno

Extraer sitios web como markdown

El raspado web consume tiempo y frecuentemente falla debido a medidas anti-bot. Esta habilidad utiliza la API de Firecrawl para convertir sitios web de manera confiable en markdown limpio y listo para LLMs con extracción de datos estructurados.

Soporta: Claude Codex Code(CC)

⚠️ 66 Deficiente

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "enact/firecrawl". https://example.com/blog post

Resultado esperado:

Publicación de blog extraída con markdown limpio que incluye encabezados, párrafos y enlaces.

Usando "enact/firecrawl". https://news.ycombinator.com with extract action

Resultado esperado:

Lista de los 5 titulares de noticias principales con URLs y conteos de puntos en formato estructurado.

Auditoría de seguridad

Riesgo bajo

v1 • 1/23/2026

This is a legitimate web scraping tool that makes authenticated API calls to Firecrawl. Static analysis flagged expected patterns (network requests + environment variable access for API credentials) as suspicious, but these represent standard API client behavior. No malicious intent or dangerous code patterns were found.

Archivos escaneados

475

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

🌐 Acceso a red (9)

firecrawl.py:10 firecrawl.py:23-36 firecrawl.py:42-56 firecrawl.py:69-73 firecrawl.py:92-101 firecrawl.py:106-118 firecrawl.py:137-145 firecrawl.py:159-163 firecrawl.py:230-236

🔑 Variables de entorno (2)

firecrawl.py:13-18 firecrawl.py:195-199

Auditado por: claude

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Investigación y recolección de datos

Recopilar información de múltiples fuentes web para proyectos de investigación, análisis de competidores o investigación de mercado. Convertir documentación, artículos y páginas de productos en markdown limpio para procesamiento de IA.

Ingesta de documentación

Extraer y rastrear sitios de documentación técnica para crear bases de conocimiento sin conexión. Perfecto para construir contexto para asistentes de IA o archivar documentación.

Agregación de contenido

Extraer datos estructurados de sitios web como titulares de noticias, tablas de precios, listados de productos o calendarios de eventos. Usar prompts en lenguaje natural o esquemas JSON para extracción precisa.

Prueba estos prompts

Extracción básica de página

Scrape the content from ${url} and return it as clean markdown.

Rastrear sitio de documentación

Crawl ${url} with a limit of ${limit} pages. Extract all content as markdown.

Extraer datos estructurados

Extract structured data from ${url} using this schema: ${schema}. Prompt: ${prompt}

Búsqueda web

Search the web for "${query}" and return the top ${limit} results with full scraped content.

Mejores prácticas

Establece la variable de entorno FIRECRAWL_API_KEY antes de usar para autenticarte con el servicio Firecrawl
Usa la acción extract con esquemas JSON para extracción de datos estructurada y consistente de páginas similares
Comienza con la acción map para descubrir la estructura del sitio antes de ejecutar operaciones de rastreo costosas

Evitar

No uses para extraer datos personales o privados sin autorización
Evita el rastreo excesivo que pueda agotar los sitios objetivo - respeta los límites de tasa y robots.txt
No dependas solo de capturas de pantalla para extracción de datos - la extracción de markdown y estructurada es más confiable

Preguntas frecuentes

¿Qué es el FIRECRAWL_API_KEY y dónde lo obtengo?

El FIRECRAWL_API_KEY es tu token de autenticación para el servicio Firecrawl. Obténlo registrándote en firecrawl.dev y copiando tu clave de API desde el panel de control.

¿Cuál es la diferencia entre las acciones scrape, crawl, map, search y extract?

Scrape obtiene contenido de una URL. Crawl descubre y extrae todas las páginas de un sitio. Map lista URLs sin extraer contenido. Search consulta la web y devuelve resultados. Extract extrae datos estructurados usando IA.

¿Qué formatos de salida están soportados?

Las acciones scrape y crawl soportan formatos markdown, HTML, enlaces y capturas de pantalla. Usa el parámetro formats para especificar tipos de salida separados por comas.

¿Cuántas páginas puedo rastrear?

La acción crawl tiene un parámetro limit configurable. La API de Firecrawl también tiene límites de tasa según tu nivel de suscripción.

¿Puedo extraer datos en un formato específico?

Sí. Usa la acción extract con un esquema JSON para definir la estructura de datos que deseas. La IA extraerá campos coincidentes del contenido de la página.

¿Esto funciona en aplicaciones de página única con mucho JavaScript?

Sí. Firecrawl maneja la renderización de JavaScript y puede extraer contenido de SPAs dinámicos, aunque el procesamiento puede tomar más tiempo que las páginas estáticas.

Detalles del desarrollador

Autor

EnactProtocol

Licencia

MIT

Repositorio

https://github.com/EnactProtocol/enact/tree/main/examples/tools/firecrawl

Ref.

main

Estructura de archivos

📄 firecrawl.py

📄 SKILL.md