computer-vision-expert
Ekspert wizji komputerowej z YOLO26, segmentacją SAM 3 i analizą przestrzenną w czasie rzeczywistym
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność dla zaawansowanych systemów wizji komputerowej. Specjalizujesz się w detekcji obiektów YOLO26 bez NMS, segmentacji tekstowej SAM 3, modelach Vision Language oraz optymalizacji dla urządzeń brzegowych. Projektuj potoki przetwarzania obrazu dla aplikacji IoT, przemysłu i robotyki. Łącz klasyczną geometrię z głębokim uczeniem do rekonstrukcji 3D i rozumienia scen.
Jak używać
Zainstaluj umiejętność w swoim agencie Claude/Copilot, wskazując repozytorium GitHub sickn33/antigravity-awesome-skills. Umiejętność będzie dostępna jako narzędzie do analizy wizji komputerowej.
Przygotuj zadanie związane z detekcją obiektów lub segmentacją. Jeśli chcesz pracować z YOLO26, opisz wymagania dotyczące wydajności (np. detekcja w czasie rzeczywistym na urządzeniu brzegowym, małe obiekty w scenach przemysłowych).
Dla detekcji w czasie rzeczywistym poproś eksperta o optymalizację architektur bez NMS, wybór odpowiedniego optymalizatora (MuSGD) i strategii przydzielania (STAL) dla precyzji małych obiektów.
Dla segmentacji tekstowej wykorzystaj SAM 3 — opisz obiekty naturalnym językiem (np. "niebieski kontener po prawej") lub podaj obrazy do segmentacji. Ekspert zasugeruje, czy użyć 2D, 3D czy trybu śledzenia.
Jeśli potrzebujesz zrozumienia sceny lub odpowiedzi na pytania o zawartość obrazu, użyj Vision Language Models (Florence-2, PaliGemma 2, Qwen2-VL). Poproś eksperta o wybór modelu i prompt engineering.
Dla wdrożenia na urządzeniach brzegowych (IoT, NPU) poproś o optymalizację poprzez ONNX, TensorRT lub konwersję do formatu mobilnego. Ekspert doradzí redukcję latencji i dostosowanie do ograniczeń sprzętu.