computer-vision-expert
SOTA 모델로 컴퓨터 비전 시스템 구축하기
현대적인 컴퓨터 비전 시스템을 구축하려면 여러 SOTA 모델에 대한 전문 지식이 필요합니다. 이 스킬은 탐지, 세그먼테이션 및 공간 분석 작업을 위해 YOLO26, SAM 3 및 비전 언어 모델에 대한 전문가의 가이드를 제공합니다.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "computer-vision-expert". 엣지 디바이스에서 실시간 객체 탐지를 위해 YOLO26 을 어떻게 설정하나요?
Résultat attendu:
YOLO26 엣지 배포를 위해 NMS 후처리가 필요 없는 NMS-free 아키텍처를 사용하세요. 주요 단계:
1. **모델 선택**: nano (가장 빠름) 용 yolo26n 또는 small (더 나은 정확도) 용 yolo26s 사용
2. **내보내기 명령**: `yolo export model=yolo26s format=onnx`
3. **TensorRT 최적화**: Jetson 에서 2 배 속도 향상을 위해 TensorRT FP16 으로 변환
4. **추론**: NMS 후처리 없이 단순화된 추론 API 사용
NMS-free 설계는 전통적인 YOLO 아키텍처에 비해 지연 시간을 30% 줄입니다.
Utilisation de "computer-vision-expert". 특정 객체의 텍스트 가이드 세그먼테이션을 위한 SAM 3 사용
Résultat attendu:
SAM 3 의 텍스트 - 마스크 기능은 자연어를 사용한 세그먼테이션을 허용합니다:
```python
from sam3 import SAM3Model
model = SAM3Model()
image = load_image('warehouse.jpg')
# 세그먼테이션을 위한 텍스트 프롬프트
masks = model.text_to_mask(image, prompt='the blue container')
```
이것은 수동 포인트 프롬프트의 필요성을 제거합니다. SAM 3 는 탐지, 세그먼테이션 및 추적을 하나의 모델로 통합하여 SAM 2 대비 2 배 정확도를 달성합니다.
Audit de sécurité
SûrAll static findings are false positives. The scanner detected 'SAM' as Windows SAM database (actually Segment Anything Model), backticks as shell execution (actually skill name formatting), and misidentified cryptographic patterns. This is a legitimate computer vision expert skill with no security concerns.
Problèmes à risque faible (3)
Facteurs de risque
⚙️ Commandes externes (4)
Score de qualité
Ce que vous pouvez construire
산업 품질 검사
제조 라인에서 YOLO26 을 사용하여 빠른 결함 탐지와 SAM 3 를 사용하여 제품 이상 정밀 세그먼테이션을 수행하는 자동화 시각 검사 시스템을 구축합니다.
자율 로봇 항법
동적 환경에서 안전한 항법을 위해 깊이 추정, 시각 SLAM 및 실시간 객체 탐지를 사용하는 모바일 로봇용 비전 파이프라인을 제작합니다.
문서 및 미디어 분석
시각적 그라운딩 및 질문 응답을 통해 이미지, 다이어그램 및 시각적 문서에서 구조화된 데이터를 추출하는 VLM 기반 시스템을 구현합니다.
Essayez ces prompts
엣지 디바이스에서 실시간 객체 탐지를 위해 YOLO26 을 어떻게 설정하나요? 차량과 보행자를 탐지해야 합니다.
SAM 3 를 사용하여 이미지에서 '빨간 컨테이너'의 모든 인스턴스를 세그먼테이션해야 합니다. 텍스트 - 마스크 기능을 어떻게 사용하나요?
NVIDIA Jetson Orin 에 YOLO26 모델을 배포하기 위한 최적의 접근 방식은 무엇인가요? 정확도를 유지하면서 지연 시간을 줄여야 합니다.
Bonnes pratiques
- 실시간 애플리케이션에서 더 낮은 지연 시간을 위해 YOLO26 과 같은 NMS-free 아키텍처 사용
- 빠른 후보 제안에는 YOLO26 을, 정밀 마스크 정제에는 SAM 3 와 결합 사용
- SAM 3 와 함께 설명적인 텍스트 프롬프트 사용 (예: '볼트' 대신 '5mm 볼트')
Éviter
- NMS-free 아키텍처 대신 수동 NMS 후처리 사용
- SAM 3 의 텍스트 가이드 프롬프트 대신 클릭 전용 세그먼테이션에 의존
- YOLO26 단순화된 모듈 구조를 지원하지 않는 레거시 내보내기 파이프라인 사용