Fähigkeiten firecrawl-build-scrape

🔍

firecrawl-build-scrape

Name: firecrawl-build-scrape
Author: firecrawl

Sicher

Inhalte von jeder Webseite mit Firecrawl extrahieren

Apps haben oft URLs, benötigen aber saubere Seiteninhalte. Diese Skill bietet einen unkomplizierten Weg, Firecrawl-Scraping für die Einzelseiten-Extraktion in Markdown, HTML oder strukturierte Daten zu integrieren.

Unterstützt: Claude Codex Code(CC)

📊 71 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "firecrawl-build-scrape". https://docs.example.com/getting-started

Erwartetes Ergebnis:

Seiteninhalt als sauberes Markdown mit erhaltener Formatierung von Überschriften, Code-Blöcken und Links extrahiert. Navigation und Footer standardmäßig entfernt.

Verwendung von "firecrawl-build-scrape". https://news.example.com/article/123

Erwartetes Ergebnis:

Hauptartikeltext mit Titel, Autor, Veröffentlichungsdatum und Hauptinhalt extrahiert. Sidebar-Anzeigen und zugehörige Artikel herausgefiltert.

Sicherheitsaudit

Sicher

v1 • 4/30/2026

All static analysis findings are false positives. The detected patterns represent legitimate documentation formatting (markdown backticks, relative doc links) and intentional skill design (API key input for Firecrawl authentication). No security risks identified.

Gescannte Dateien

Analysierte Zeilen

befunde

Gesamtzahl Audits

Keine Sicherheitsprobleme gefunden

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Wissensdatenbank-Aufnahme

Nehmen Sie Inhalte von Dokumentationsseiten, Blogbeiträgen oder Artikeln in eine Vektordatenbank für semantische Suche auf.

Marktforschungsautomatisierung

Extrahieren Sie Preise, Produktdetails oder Changelog-Informationen von Konkurrenz- oder Branchenwebsites.

Inhaltsqualitätsüberwachung

Überwachen Sie bestimmte Seiten auf Inhaltsänderungen, extrahieren Sie Metadaten oder validieren Sie die Seitenstruktur.

Probiere diese Prompts

Grundlegende Seitenextraktion

Verwenden Sie den Firecrawl-build-scrape Skill, um die Hauptinhalte von {URL} als Markdown zu extrahieren.

Strukturierte Datenextraktion

Verwenden Sie firecrawl-build-scrape, um die Seite unter {URL} abzurufen und alle Überschriften- und Absatzinhalte als strukturiertes Markdown zu extrahieren.

JavaScript-gerenderte Seite

Verwenden Sie firecrawl-build-scrape, um Inhalte von {URL} mit einem Wait von 5 Sekunden zu extrahieren, um JavaScript-Rendering zu behandeln.

Multi-Format-Extraktion

Verwenden Sie firecrawl-build-scrape, um Markdown-Inhalte und Links von {URL} zu extrahieren, und formatieren Sie die Ergebnisse dann für ein Datenbankschema.

Bewährte Verfahren

Beginnen Sie mit dem Markdown-Format für LLM-Verarbeitung, es sei denn, eine spezifische Formatierung ist erforderlich
Verwenden Sie den onlyMainContent-Filter für Artikelseiten mit Navigationsrauschen
Lesen Sie die offiziellen sprachspezifischen Dokumente, bevor Sie Integrationscode schreiben

Vermeiden

Verwenden Sie Scrape nicht, wenn Sie URLs entdecken müssen; verwenden Sie stattdessen den Search-Skill
Überspringen Sie die Wait-Option nicht auf JavaScript-lastigen Seiten, ohne vorher zu testen
Fordern Sie nicht mehrere Formate an, wenn nur eines benötigt wird; halten Sie die Integration schlank

Häufig gestellte Fragen

Wann sollte ich /scrape anstelle von /crawl verwenden?

Verwenden Sie Scrape, wenn Sie eine bestimmte URL haben und Inhalte von dieser einzelnen Seite benötigen. Verwenden Sie Crawl, wenn Sie mehrere Seiten entdecken und extrahieren müssen.

Welches Format sollte ich von der API anfordern?

Standardmäßig Markdown für LLM- oder Such-Pipeline-Verarbeitung verwenden. HTML für die Erhaltung der Struktur oder JSON für programmatische Analyse verwenden.

Wie behandle ich Seiten, die Inhalte mit JavaScript laden?

Fügen Sie eine Wait-Option (5-10 Sekunden) hinzu, um der Seite zu ermöglichen, vollständig zu rendern, bevor die Extraktion erfolgt.

Kann ich diesen Skill mit einer selbst gehosteten Firecrawl-Instanz verwenden?

Ja, setzen Sie die optionale FIRECRAWL_API_URL-Eingabe auf Ihren selbst gehosteten Endpunkt anstelle des standardmäßigen gehosteten Dienstes.

Was ist, wenn die Seite Authentifizierung oder Paywalls hat?

Scrape kann keine Authentifizierung umgehen. Für authentifizierte Inhalte benötigen Sie browserbasierte Extraktion mit Cookies oder Session-Tokens.

Wie extrahiere ich nur die Hauptinhalte ohne Navigation?

Verwenden Sie die Option onlyMainContent, um Navigation, Header und Footer herauszufiltern und nur die primären Seiteninhalte zu behalten.

Entwicklerdetails

Autor

firecrawl

Lizenz

ISC

Repository

https://github.com/firecrawl/skills/tree/main/skills/firecrawl-build-scrape/

Ref

main

Dateistruktur

📄 SKILL.md