computer-vision-expert
بناء أنظمة الرؤية الحاسوبية باستخدام نماذج متقدمة
يتطلب بناء أنظمة الرؤية الحاسوبية الحديثة خبرة في عدة نماذج متقدمة. يوفر هذا الدليل إرشادات متخصصة حول YOLO26 وSAM 3 ونماذج اللغة المرئية لمهام الكشف والتجميع والتحليل المكاني.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "computer-vision-expert". 如何在边缘设备上设置YOLO26进行实时物体检测?
Résultat attendu:
对于YOLO26边缘部署,使用无需NMS的架构可简化导出。关键步骤:
1. **模型选择**:使用yolo26n用于nano(最快)或yolo26s用于small(更好的准确性)
2. **导出命令**:`yolo export model=yolo26s format=onnx`
3. **TensorRT优化**:转换为TensorRT FP16以在Jetson上实现2倍加速
4. **推理**:使用简化的推理API,无需NMS后处理
无需NMS的设计将延迟降低30%,相比传统YOLO架构。
Utilisation de "computer-vision-expert". 使用SAM 3进行特定物体的文本引导分割
Résultat attendu:
SAM 3的文本到掩码功能允许使用自然语言描述进行分割:
```python
from sam3 import SAM3Model
model = SAM3Model()
image = load_image('warehouse.jpg')
# 文本提示用于分割
masks = model.text_to_mask(image, prompt='the blue container')
```
这消除了手动点提示的需要。SAM 3通过在一个模型中统一检测、分割和跟踪,实现了比SAM 2高2倍的准确性。
Audit de sécurité
SûrAll static findings are false positives. The scanner detected 'SAM' as Windows SAM database (actually Segment Anything Model), backticks as shell execution (actually skill name formatting), and misidentified cryptographic patterns. This is a legitimate computer vision expert skill with no security concerns.
Problèmes à risque faible (3)
Facteurs de risque
⚙️ Commandes externes (4)
Score de qualité
Ce que vous pouvez construire
Industrial Quality Inspection
使用YOLO26构建自动视觉检测系统以快速检测缺陷,并使用SAM 3精确分割生产线上的产品异常。
Autonomous Robot Navigation
为移动机器人创建视觉管道,使用深度估计、视觉SLAM和实时物体检测,在动态环境中实现安全导航。
Document and Media Analysis
实施VLM驱动的系统,通过视觉基础定位和问答从图像、图表和视觉文档中提取结构化数据。
Essayez ces prompts
如何在边缘设备上设置YOLO26进行实时物体检测?我需要检测车辆和行人。
我需要使用SAM 3在此图像中分割所有“红色集装箱”的实例。如何使用文本到掩码功能?
帮助我构建使用Florence-2的管道来回答有关图像的问题。我想从产品照片中提取结构化数据。
优化YOLO26模型以部署在NVIDIA Jetson Orin上的最佳方法是什么?我需要在降低延迟的同时保持准确性。
Bonnes pratiques
- 在实时应用程序中使用YOLO26等无需NMS的架构以降低延迟
- 结合使用YOLO26进行快速候选提议,使用SAM 3进行精确掩码细化
- 使用描述性文本提示与SAM 3(例如,使用“5毫米螺栓”而不是“螺栓”)
Éviter
- 使用手动NMS后处理而不是无需NMS的架构
- 依赖仅点击分割而不是使用SAM 3的文本引导提示
- 使用不支持YOLO26简化模块结构的旧导出管道