Compétences extract
📦

extract

Risque faible ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers🔑 Variables d’environnement

استخراج محتوى الويب من عناوين URL

يستخدم هذا المهارة واجهة برمجة تطبيقات Tavily لاستخراج محتوى نظيف بتنسيق Markdown أو نص عادي من عناوين URL محددة. مثالي للبحث واسترجاع التوثيق وتجميع المحتوى دون الحاجة إلى كتابة كود استخراج مخصص.

Prend en charge: Claude Codex Code(CC)
🥉 72 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "extract". استخرج المحتوى من https://example.com/about

Résultat attendu:

## About Example

Welcome to Example.com...

Our Mission

We strive to provide...

Utilisation de "extract". استخرج معلومات التسعير من https://example.com/pricing و https://example.com/plans

Résultat attendu:

## Pricing Information

### Basic Plan - $9/month
- Feature A
- Feature B

### Pro Plan - $29/month
- All Basic features
- Priority support...

Audit de sécurité

Risque faible
v1 • 2/18/2026

Static analysis detected 137 potential issues across external_commands, network, filesystem, and env_access categories. After semantic evaluation, all findings are FALSE POSITIVES - these patterns represent legitimate API extraction functionality. The skill uses standard shell commands (curl, jq) to communicate with Tavily's official API, accesses environment variables for API key authentication, and reads OAuth tokens from the standard MCP auth directory. No malicious behavior, data exfiltration, or command injection vulnerabilities were identified.

2
Fichiers analysés
369
Lignes analysées
8
résultats
1
Total des audits
Problèmes à risque faible (4)
Shell Command Execution Patterns
Static scanner flagged 62 instances of shell command execution (backticks, $() substitutions). These are FALSE POSITIVES - the skill uses standard Unix tools (curl, jq, base64) for legitimate API communication with Tavily's official service. No user input is injected into shell commands without validation.
Network Request Patterns
Static scanner flagged 33 network access instances including hardcoded URLs. These are FALSE POSITIVES - the skill is designed to make HTTPS API calls to Tavily's official endpoints (api.tavily.com, mcp.tavily.com). Network access is core functionality for web content extraction.
Environment Variable Access
Static scanner flagged 16 environment variable access instances for TAVILY_API_KEY. These are FALSE POSITIVES - the skill reads API keys from environment variables, which is the standard and secure method for providing credentials to API-based skills. The skill properly handles missing keys by initiating OAuth flow.
Filesystem Access for OAuth Tokens
Static scanner flagged filesystem access to ~/.mcp-auth/ directory. This is a FALSE POSITIVE - the skill reads OAuth tokens from the standard MCP authentication directory. This is expected behavior for OAuth-based authentication and poses no security risk.

Facteurs de risque

⚙️ Commandes externes (62)
🌐 Accès réseau (33)
📁 Accès au système de fichiers (17)
🔑 Variables d’environnement (16)
Audité par: claude

Score de qualité

45
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
82
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

جمع وثائق البحث

استخراج محتوى الوثائق من صفحات مرجع API متعددة لبناء قاعدة معرفة محلية

تحليل المنافسين

استخراج المحتوى من مواقع المنافسين وصفحات المدونات والمنشورات لتحليل السوق

تجميع المحتوى

سحب المقالات والمحتوى من مصادر أخبار أو مدونات متعددة إلى تنسيق Markdown واحد

Essayez ces prompts

استخراج عنوان URL الأساسي
استخرج المحتوى من هذا العنوان: https://example.com/article
استخراج عناوين URL متعددة
استخرج المحتوى من هذه العناوين: https://docs.example.com/api, https://docs.example.com/auth
استخراج مركز على الاستعلام
استخرج معلومات المصادقة من هذه العناوين: https://example.com/docs, https://example.com/api-reference. ركّز على مفاتيح API وOAuth.
استخراج متقدم للصفحات الديناميكية
استخرج كل المحتوى من هذه الصفحة الثقيلة باستخدام JavaScript باستخدام الاستخراج المتقدم: https://app.example.com/dashboard

Bonnes pratiques

  • استخدم معامل الاستعلام لتصفية المحتوى إلى ما تحتاجه بالضبط، خاصة عند الاستخراج من الصفحات الكبيرة
  • ابدأ بالاستخراج الأساسي واستخدم الوضع المتقدم فقط إذا كان المحتوى مفقودًا أو غير مكتمل
  • اجمع عناوين URL حسب الموضوع أو الفئة للحفاظ على النتائج منظمة وذات صلة

Éviter

  • استخراج أكثر من 20 عنوان URL في طلب واحد سيفشل
  • استخدام chunks_per_source بدون معامل الاستعلام سيُرجع خطأ
  • عد التحقق من حقل failed_results في الاستجابة قد يؤدي إلى فقدان حالات فشل الاستخراج

Foire aux questions

هل أحتاج إلى مفتاح Tavily API؟
نعم،你需要 Tavily API key 或 Tavily 账户进行 OAuth 身份验证。在 tavily.com 获取 API key 或注册账户。
一次可以提取多少个 URL?
يمكنك提取每个请求最多 20 个 URL。对于更大的批次,请分成多个请求。
基本提取和高级提取有什么区别?
基本提取更快,适用于静态 HTML 页面。高级提取处理 JavaScript 渲染的页面、复杂布局和结构化数据,但需要更长时间。
查询参数如何工作?
查询参数根据与搜索词的相关性对提取的内容块进行重新排序。请将其与 chunks_per_source 一起使用以获取最相关的部分。
为什么我收到 failed_results?
失败的提取结果发生在 URL 无法访问、被阻止或超时时。请查看响应中的 failed_results 数组以获取具体的错误信息。
我可以提取受密码保护的页面内容吗?
无法提取需要登录或公开访问之外的身份验证的页面内容。

Détails du développeur

Structure de fichiers

📁 scripts/

📄 extract.sh

📄 SKILL.md