firecrawl-scraper
Firecrawl で Web サイトをスクレイピング
Firecrawl API を使用して、テキスト、スクリーンショット、PDF を含む Web サイトの深層コンテンツを抽出します。データセットの構築、競合他社の監視、研究の自動化に最適です。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「firecrawl-scraper」を使用しています。 Scrape https://example.com/blog/article-1
期待される結果:
記事コンテンツの抽出に成功しました。タイトル:'Getting Started with Firecrawl'。コンテンツ長:2500 語。3 つの画像と 5 つの内部リンクが見つかりました。
「firecrawl-scraper」を使用しています。 Take a screenshot of https://example.com
期待される結果:
スクリーンショットを [filename].png に保存しました。ページはすべての JavaScript をレンダリングして正常に読み込まれました。
セキュリティ監査
安全All four static findings are false positives. The skill is legitimate documentation for the Firecrawl API web scraping tool. No malicious code, command injection, or prompt injection detected. The skill simply provides installation instructions and usage guidance for the Firecrawl API.
品質スコア
作れるもの
研究データ収集
研究プロジェクト、市場分析、競合分析のために、複数のソースから公開されているデータの収集を自動化します。
コンテンツアーカイブ
ドキュメント化、コンプライアンス、オフラインアクセスのために、スクリーンショットや PDF を含む Web コンテンツをキャプチャしてアーカイブします。
リードジェネレーション
ビジネスディレクトリや Web サイトから連絡先情報、企業詳細、その他の関連データを抽出します。
これらのプロンプトを試す
Use the firecrawl-scraper skill to extract all text content from [URL]
Use firecrawl-scraper to take a screenshot of [URL] and save it
Use firecrawl-scraper to scrape content from these URLs: [list of URLs]. Extract the main content from each and provide a summary.
Use firecrawl-scraper to extract text from [PDF URL or upload]
ベストプラクティス
- 使用前に Firecrawl API キーを環境変数として設定します
- バッチ操作を試みる前に、単一 URL 抽出から始めます
- スクレイピング時に Web サイトの利用規約と robots.txt を尊重します
- レート制限を回避するために、リクエスト間に適切な遅延を使用します
回避
- 認証なしでログインの背後にある保護されたコンテンツのスクレイピングに使用しないでください
- 対象 Web サイトのパフォーマンスに影響を与える可能性のある積極的なクロールを避けてください
- 有料アクセスやサブスクリプションコンテンツをバイパスするために使用しないでください
- 適切な同意とプライバシー法への準拠なしに個人データをスクレイピングしないでください