Fähigkeiten firecrawl-build-scrape
🔍

firecrawl-build-scrape

Sicher

Inhalte von jeder Webseite mit Firecrawl extrahieren

Apps haben oft URLs, benötigen aber saubere Seiteninhalte. Diese Skill bietet einen unkomplizierten Weg, Firecrawl-Scraping für die Einzelseiten-Extraktion in Markdown, HTML oder strukturierte Daten zu integrieren.

Unterstützt: Claude Codex Code(CC)
🥉 74 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "firecrawl-build-scrape". https://docs.example.com/getting-started

Erwartetes Ergebnis:

Seiteninhalt als sauberes Markdown mit erhaltener Formatierung von Überschriften, Code-Blöcken und Links extrahiert. Navigation und Footer standardmäßig entfernt.

Verwendung von "firecrawl-build-scrape". https://news.example.com/article/123

Erwartetes Ergebnis:

Hauptartikeltext mit Titel, Autor, Veröffentlichungsdatum und Hauptinhalt extrahiert. Sidebar-Anzeigen und zugehörige Artikel herausgefiltert.

Sicherheitsaudit

Sicher
v1 • 4/30/2026

All static analysis findings are false positives. The detected patterns represent legitimate documentation formatting (markdown backticks, relative doc links) and intentional skill design (API key input for Firecrawl authentication). No security risks identified.

1
Gescannte Dateien
69
Analysierte Zeilen
0
befunde
1
Gesamtzahl Audits
Keine Sicherheitsprobleme gefunden
Auditiert von: claude

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
87
Inhalt
50
Community
100
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Wissensdatenbank-Aufnahme

Nehmen Sie Inhalte von Dokumentationsseiten, Blogbeiträgen oder Artikeln in eine Vektordatenbank für semantische Suche auf.

Marktforschungsautomatisierung

Extrahieren Sie Preise, Produktdetails oder Changelog-Informationen von Konkurrenz- oder Branchenwebsites.

Inhaltsqualitätsüberwachung

Überwachen Sie bestimmte Seiten auf Inhaltsänderungen, extrahieren Sie Metadaten oder validieren Sie die Seitenstruktur.

Probiere diese Prompts

Grundlegende Seitenextraktion
Verwenden Sie den Firecrawl-build-scrape Skill, um die Hauptinhalte von {URL} als Markdown zu extrahieren.
Strukturierte Datenextraktion
Verwenden Sie firecrawl-build-scrape, um die Seite unter {URL} abzurufen und alle Überschriften- und Absatzinhalte als strukturiertes Markdown zu extrahieren.
JavaScript-gerenderte Seite
Verwenden Sie firecrawl-build-scrape, um Inhalte von {URL} mit einem Wait von 5 Sekunden zu extrahieren, um JavaScript-Rendering zu behandeln.
Multi-Format-Extraktion
Verwenden Sie firecrawl-build-scrape, um Markdown-Inhalte und Links von {URL} zu extrahieren, und formatieren Sie die Ergebnisse dann für ein Datenbankschema.

Bewährte Verfahren

  • Beginnen Sie mit dem Markdown-Format für LLM-Verarbeitung, es sei denn, eine spezifische Formatierung ist erforderlich
  • Verwenden Sie den onlyMainContent-Filter für Artikelseiten mit Navigationsrauschen
  • Lesen Sie die offiziellen sprachspezifischen Dokumente, bevor Sie Integrationscode schreiben

Vermeiden

  • Verwenden Sie Scrape nicht, wenn Sie URLs entdecken müssen; verwenden Sie stattdessen den Search-Skill
  • Überspringen Sie die Wait-Option nicht auf JavaScript-lastigen Seiten, ohne vorher zu testen
  • Fordern Sie nicht mehrere Formate an, wenn nur eines benötigt wird; halten Sie die Integration schlank

Häufig gestellte Fragen

Wann sollte ich /scrape anstelle von /crawl verwenden?
Verwenden Sie Scrape, wenn Sie eine bestimmte URL haben und Inhalte von dieser einzelnen Seite benötigen. Verwenden Sie Crawl, wenn Sie mehrere Seiten entdecken und extrahieren müssen.
Welches Format sollte ich von der API anfordern?
Standardmäßig Markdown für LLM- oder Such-Pipeline-Verarbeitung verwenden. HTML für die Erhaltung der Struktur oder JSON für programmatische Analyse verwenden.
Wie behandle ich Seiten, die Inhalte mit JavaScript laden?
Fügen Sie eine Wait-Option (5-10 Sekunden) hinzu, um der Seite zu ermöglichen, vollständig zu rendern, bevor die Extraktion erfolgt.
Kann ich diesen Skill mit einer selbst gehosteten Firecrawl-Instanz verwenden?
Ja, setzen Sie die optionale FIRECRAWL_API_URL-Eingabe auf Ihren selbst gehosteten Endpunkt anstelle des standardmäßigen gehosteten Dienstes.
Was ist, wenn die Seite Authentifizierung oder Paywalls hat?
Scrape kann keine Authentifizierung umgehen. Für authentifizierte Inhalte benötigen Sie browserbasierte Extraktion mit Cookies oder Session-Tokens.
Wie extrahiere ich nur die Hauptinhalte ohne Navigation?
Verwenden Sie die Option onlyMainContent, um Navigation, Header und Footer herauszufiltern und nur die primären Seiteninhalte zu behalten.

Entwicklerdetails

Dateistruktur

📄 SKILL.md