المهارات fiftyone-embeddings-visualization

📊

fiftyone-embeddings-visualization

Name: fiftyone-embeddings-visualization
Author: AdonaiVera

آمن 🌐 الوصول إلى الشبكة⚙️ الأوامر الخارجية

以 2D 視覺化呈現資料集嵌入向量

理解複雜的圖像資料集需要看到樣本在嵌入空間中的關聯性。此技能引導您計算嵌入向量,並使用 UMAP 或 t-SNE 創建 2D 視覺化,揭示您 FiftyOne 資料集中的聚類、異常值和類別分佈。

يدعم: Claude Codex Code(CC)

📊 69 كافٍ

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "fiftyone-embeddings-visualization". Visualize my coco-subset dataset in 2D

النتيجة المتوقعة:

Computing CLIP embeddings for 500 samples...
Running UMAP dimensionality reduction...
✓ Visualization ready (brain_key: exploration)
→ Open http://localhost:5151/
→ Click the Embeddings panel icon
→ Select exploration from the dropdown
→ Use Color by to select ground_truth.label

استخدام "fiftyone-embeddings-visualization". Find outliers in my image classification dataset

النتيجة المتوقعة:

Computing uniqueness scores for all samples...
Found 50 most unique samples (outliers)
→ Open http://localhost:5151/
→ Go to Embeddings panel
→ Select outliers brain_key
→ Use sort field to view by uniqueness score

التدقيق الأمني

آمن

v5 • 1/16/2026

This is a pure documentation skill containing only instructions in SKILL.md format. The static scanner produced false positives by misinterpreting: (1) SHA256 hashes as weak cryptographic algorithms and C2 keywords, (2) markdown code block backticks as shell command execution, and (3) documentation URLs as hardcoded network endpoints. No executable code, scripts, network operations, or external command execution is present. This skill merely guides users on using legitimate FiftyOne MCP server tools.

الملفات التي تم فحصها

711

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

عوامل الخطر

🌐 الوصول إلى الشبكة (11)

skill-report.json:6 skill-report.json:128 SKILL.md:174 SKILL.md:289 SKILL.md:333 SKILL.md:372 SKILL.md:414 SKILL.md:454 SKILL.md:523 SKILL.md:524 SKILL.md:525

⚙️ الأوامر الخارجية (88)

SKILL.md:22 SKILL.md:30-32 SKILL.md:32-36 SKILL.md:36-38 SKILL.md:38-42 SKILL.md:42-48 SKILL.md:48-52 SKILL.md:52-63 SKILL.md:63-66 SKILL.md:66-68 SKILL.md:68-73 SKILL.md:73-79 SKILL.md:79-82 SKILL.md:82-92 SKILL.md:92-95 SKILL.md:95-101 SKILL.md:101-106 SKILL.md:106-110 SKILL.md:110-115 SKILL.md:115-126 SKILL.md:126-129 SKILL.md:129-130 SKILL.md:130-131 SKILL.md:131-132 SKILL.md:132 SKILL.md:132-133 SKILL.md:133 SKILL.md:133 SKILL.md:133-136 SKILL.md:136-137 SKILL.md:137-138 SKILL.md:138-139 SKILL.md:139-144 SKILL.md:144-165 SKILL.md:165-168 SKILL.md:168 SKILL.md:168-169 SKILL.md:169-170 SKILL.md:170-177 SKILL.md:177-179 SKILL.md:179 SKILL.md:179-182 SKILL.md:182-187 SKILL.md:187-196 SKILL.md:196-204 SKILL.md:204-215 SKILL.md:215-227 SKILL.md:227-237 SKILL.md:237-240 SKILL.md:240-242 SKILL.md:242-250 SKILL.md:250-251 SKILL.md:251-252 SKILL.md:252-253 SKILL.md:253-254 SKILL.md:254-258 SKILL.md:258 SKILL.md:258-262 SKILL.md:262-263 SKILL.md:263-264 SKILL.md:264-265 SKILL.md:265-271 SKILL.md:271-293 SKILL.md:293-297 SKILL.md:297-338 SKILL.md:338-342 SKILL.md:342-380 SKILL.md:380-384 SKILL.md:384-420 SKILL.md:420-424 SKILL.md:424-458 SKILL.md:458-464 SKILL.md:464-468 SKILL.md:468 SKILL.md:468-472 SKILL.md:472 SKILL.md:472-474 SKILL.md:474-475 SKILL.md:475-477 SKILL.md:477-478 SKILL.md:478 SKILL.md:478-479 SKILL.md:479 SKILL.md:479-484 SKILL.md:484-485 SKILL.md:485-498 SKILL.md:498 SKILL.md:498-502

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

100

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

探索訓練資料

在訓練前視覺化圖像資料集中的類別分佈並找出標籤錯誤的樣本。

分析模型預測

在嵌入空間中比較真實標籤與預測結果,以識別混淆模式。

尋找資料集異常值

檢測可能表明資料品質問題或罕見案例的異常或獨特樣本。

جرّب هذه الموجهات

基本視覺化

Set context to my dataset and launch the app. Compute CLIP embeddings and create a UMAP visualization. Then tell me how to view it in the FiftyOne App embeddings panel.

尋找異常值

My dataset has CLIP embeddings already. Compute a visualization and then find the 50 most unique (outlier) samples. Show me how to identify them in the embeddings panel.

比較類別

Generate a visualization for my classification dataset and color points by ground truth label. Describe what well-separated vs overlapping clusters indicate about class similarity.

出版品質圖表

Create a t-SNE visualization using DINOv2 embeddings for publication-quality plots. What are the advantages of t-SNE over UMAP for this use case?

أفضل الممارسات

使用 CLIP 嵌入向量進行語義相似性分析;僅使用 DINOv2 進行視覺相似性分析
從 UMAP 開始進行快速探索;切換至 t-SNE 以獲得出版品質的局部結構
計算獨特性分數以比視覺檢查更可靠地找出異常值

تجنب

跳過 launch_app() 呼叫 - brain 運算子需要 app executor
在執行 compute_visualization 之前忘記計算嵌入向量
在 compute_similarity 和 compute_visualization 之間使用錯誤的 brain_key

الأسئلة المتكررة

哪些模型生成最佳的嵌入向量?

CLIP 模型最適合語義相似性;DINOv2 僅擅長視覺相似性。

視覺化需要多長時間?

1,000 張圖像的嵌入向量計算約需 2 分鐘,UMAP 需 30 秒。10,000 張圖像約需 15 分鐘和 5 分鐘。

我可以為多個視覺化重複使用嵌入向量嗎?

可以,將嵌入向量儲存在命名欄位中,並在不同的 brain_key 操作中引用它。

我的資料會被發送到外部伺服器嗎?

不會,所有計算都使用 FiftyOne 和 scikit-learn 在本地進行。您的資料不會離開您的電腦。

為什麼我的視覺化很慢?

使用 UMAP 而非 t-SNE、使用更快的模型如 MobileNet-V2,或先使用 set_view(limit=1000) 處理子集。

UMAP 和 t-SNE 有什麼區別?

UMAP 更快且更好地保留全局結構;t-SNE 顯示更好的局部聚類細節但速度較慢。

تفاصيل المطور

المؤلف

AdonaiVera

الترخيص

Apache-2.0

المستودع

https://github.com/AdonaiVera/fiftyone-skills/tree/main/embeddings-visualization/skills/fiftyone-embeddings-visualization

مرجع

main

بنية الملفات

📄 SKILL.md