firecrawl-scraper
Raspar Sitios Web con Firecrawl
Extrae contenido profundo de sitios web incluyendo texto, capturas de pantalla y PDFs usando la API de Firecrawl. Perfecto para construir conjuntos de datos, monitorear competidores o automatizar investigación.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "firecrawl-scraper". Scrape https://example.com/blog/article-1
Resultado esperado:
Contenido del artículo extraído exitosamente. Título: 'Getting Started with Firecrawl'. Longitud del contenido: 2500 palabras. Se encontraron 3 imágenes y 5 enlaces internos.
Usando "firecrawl-scraper". Take a screenshot of https://example.com
Resultado esperado:
Captura de pantalla guardada en [filename].png. Página cargada exitosamente con todo JavaScript renderizado.
Auditoría de seguridad
SeguroAll four static findings are false positives. The skill is legitimate documentation for the Firecrawl API web scraping tool. No malicious code, command injection, or prompt injection detected. The skill simply provides installation instructions and usage guidance for the Firecrawl API.
Puntuación de calidad
Lo que puedes crear
Recolección de Datos de Investigación
Automatiza la recopilación de datos disponibles públicamente de múltiples fuentes para proyectos de investigación, análisis de mercado o inteligencia competitiva.
Archivado de Contenido
Captura y archiva contenido web incluyendo capturas de pantalla y PDFs para documentación, cumplimiento normativo o acceso sin conexión.
Generación de Leads
Extrae información de contacto, detalles de empresas y otros datos relevantes de directorios de negocios y sitios web.
Prueba estos prompts
Use the firecrawl-scraper skill to extract all text content from [URL]
Use firecrawl-scraper to take a screenshot of [URL] and save it
Use firecrawl-scraper to scrape content from these URLs: [list of URLs]. Extract the main content from each and provide a summary.
Use firecrawl-scraper to extract text from [PDF URL or upload]
Mejores prácticas
- Configura tu clave de API de Firecrawl como variable de entorno antes de usar
- Comienza con extracción de URL individual antes de intentar operaciones por lotes
- Respeta los términos de servicio del sitio web y robots.txt al raspar
- Usa retrasos apropiados entre solicitudes para evitar límites de tasa
Evitar
- No usar para raspar contenido protegido detrás de muros de inicio de sesión sin autorización
- Evitar rastreo agresivo que pueda afectar el rendimiento del sitio web objetivo
- No usar para bypassar acceso pago o contenido de suscripción
- Evitar raspar datos personales sin consentimiento adecuado y cumplimiento de leyes de privacidad
Preguntas frecuentes
¿Necesito una clave de API para usar esta habilidad?
¿Puede esta habilidad bypassar la autenticación?
¿Es legal el raspado web?
¿Puedo raspar páginas infinitas de un sitio web?
¿Qué formatos puede extraer Firecrawl?
¿Cómo manejo los límites de tasa?
Detalles del desarrollador
Autor
sickn33Licencia
MIT
Repositorio
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/firecrawl-scraperRef.
main
Estructura de archivos
📄 SKILL.md