firecrawl-build-scrape
Inhalte von jeder Webseite mit Firecrawl extrahieren
Apps haben oft URLs, benötigen aber saubere Seiteninhalte. Diese Skill bietet einen unkomplizierten Weg, Firecrawl-Scraping für die Einzelseiten-Extraktion in Markdown, HTML oder strukturierte Daten zu integrieren.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "firecrawl-build-scrape". https://docs.example.com/getting-started
Erwartetes Ergebnis:
Seiteninhalt als sauberes Markdown mit erhaltener Formatierung von Überschriften, Code-Blöcken und Links extrahiert. Navigation und Footer standardmäßig entfernt.
Verwendung von "firecrawl-build-scrape". https://news.example.com/article/123
Erwartetes Ergebnis:
Hauptartikeltext mit Titel, Autor, Veröffentlichungsdatum und Hauptinhalt extrahiert. Sidebar-Anzeigen und zugehörige Artikel herausgefiltert.
Sicherheitsaudit
SicherAll static analysis findings are false positives. The detected patterns represent legitimate documentation formatting (markdown backticks, relative doc links) and intentional skill design (API key input for Firecrawl authentication). No security risks identified.
Qualitätsbewertung
Was du bauen kannst
Wissensdatenbank-Aufnahme
Nehmen Sie Inhalte von Dokumentationsseiten, Blogbeiträgen oder Artikeln in eine Vektordatenbank für semantische Suche auf.
Marktforschungsautomatisierung
Extrahieren Sie Preise, Produktdetails oder Changelog-Informationen von Konkurrenz- oder Branchenwebsites.
Inhaltsqualitätsüberwachung
Überwachen Sie bestimmte Seiten auf Inhaltsänderungen, extrahieren Sie Metadaten oder validieren Sie die Seitenstruktur.
Probiere diese Prompts
Verwenden Sie den Firecrawl-build-scrape Skill, um die Hauptinhalte von {URL} als Markdown zu extrahieren.Verwenden Sie firecrawl-build-scrape, um die Seite unter {URL} abzurufen und alle Überschriften- und Absatzinhalte als strukturiertes Markdown zu extrahieren.Verwenden Sie firecrawl-build-scrape, um Inhalte von {URL} mit einem Wait von 5 Sekunden zu extrahieren, um JavaScript-Rendering zu behandeln.Verwenden Sie firecrawl-build-scrape, um Markdown-Inhalte und Links von {URL} zu extrahieren, und formatieren Sie die Ergebnisse dann für ein Datenbankschema.Bewährte Verfahren
- Beginnen Sie mit dem Markdown-Format für LLM-Verarbeitung, es sei denn, eine spezifische Formatierung ist erforderlich
- Verwenden Sie den onlyMainContent-Filter für Artikelseiten mit Navigationsrauschen
- Lesen Sie die offiziellen sprachspezifischen Dokumente, bevor Sie Integrationscode schreiben
Vermeiden
- Verwenden Sie Scrape nicht, wenn Sie URLs entdecken müssen; verwenden Sie stattdessen den Search-Skill
- Überspringen Sie die Wait-Option nicht auf JavaScript-lastigen Seiten, ohne vorher zu testen
- Fordern Sie nicht mehrere Formate an, wenn nur eines benötigt wird; halten Sie die Integration schlank