كشط الويب يستغرق وقتاً طويلاً وعرضة للأخطاء عند القيام به يدوياً. تستخدم هذه المهارة استخراجاً ذكياً للمحتوى لسحب محتوى منظم ونظيف من أي عنوان URL في ثوانٍ. تتعامل مع الصفحات الديناميكية، وتزيل الضوضاء مثل الإعلانات والتنقل، وتُخرج بتنسيق markdown أو JSON أو نص عادي.
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「web-scrape」。 Scrape https://example.com/blog/post-title as markdown
預期結果:
- # How to Build a REST API
- **Source:** https://example.com/blog/post-title
- **Date:** January 10, 2025
- **Author:** Jane Developer
- ---
- REST APIs are the backbone of modern web applications...
- ## Getting Started
- First, install your preferred HTTP client...
安全審計
安全This skill is a prompt-based wrapper that uses MCP Playwright tools for browser automation. The supporting Node.js script (html_clean.js) performs safe HTML-to-markdown conversion using standard libraries (cheerio, turndown) with stdin/stdout I/O only. No network calls, file writes, command execution, or sensitive data access. Security guidelines explicitly prohibit dangerous behaviors like executing page JavaScript or handling authentication.
品質評分
你能建構什麼
جمع بيانات البحث
استخرج محتوى المقالات والوثائق والأوراق البحثية من مصادر متعددة إلى ملاحظات منظمة
التقاط وثائق API
احفظ وثائق API والمحتوى التقني للمرجع غير المتصل أو عمل التكامل
تجميع المحتوى
اجمع وقيّم المحتوى من مصادر ويب متعددة للتحليل أو الإلهام
試試這些提示
Scrape https://example.com/article and return the content as markdown
Extract product information from https://shop.example.com/product as JSON with title, price, and description
Scrape the documentation at https://docs.example.com/getting-started. Check if there are multiple pages and ask if you should continue
Navigate to https://example.com and take a full-page screenshot saved as example_page.png
最佳實務
- ابدأ بأبسط أمر كشط وأضف الخيارات مثل --scroll أو --screenshot فقط عند الحاجة
- راجع المحتوى المستخرج للتأكد من دقته، خاصة للصفحات المعقدة مع العناصر الديناميكية
- احترم شروط خدمة الموقع و robots.txt عند كشط المحتوى
避免
- لا تستخدم هذه المهارة لكشط المحتوى المحمي بتسجيل الدخول أو الاشتراك فقط بدون تفويض
- لا تحاول تجاوز CAPTCHA أو قيود الوصول -,这将失败并浪费资源
- لا تكشف البيانات عالية التردد أو في الوقت الفعلي بدون تحديد معدل مناسب