segment-anything-model

Name: segment-anything-model
Author: davila7

autor: davila7

Segmentuj dowolne obiekty na zdjęciach bez uczenia modelu – zero-shot segmentacja obrazów

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor: davila7
Kategoria: Bezpieczeństwo

Repozytorium GitHub

O skillu

Segment Anything Model to uniwersalny model do segmentacji obrazów, który rozpoznaje i wyodrębnia obiekty na dowolnych zdjęciach bez konieczności trenowania. Zamiast tradycyjnych metod wymagających danych treningowych dla każdej domeny, SAM pracuje z punktami, ramkami lub maskami jako wskazówkami – lub automatycznie generuje maski wszystkich obiektów na raz. Idealny do budowania narzędzi do adnotacji, przygotowywania danych treningowych dla innych modeli wizji komputerowej, pracy z obrazami medycznymi, satelitarnymi czy specjalistycznymi. Model dostępny w trzech rozmiarach – od szybkiego ViT-B po precyzyjny ViT-H.

Jak używać

Zainstaluj Segment Anything Model z repozytorium GitHub poleceniem pip install git+https://github.com/facebookresearch/segment-anything.git. Opcjonalnie dodaj biblioteki pomocnicze: pip install opencv-python pycocotools matplotlib, lub jeśli wolisz pracować przez transformers, zainstaluj pip install transformers.
Pobierz wstępnie wytrenowany model (checkpoint). Dostępne są trzy wersje: ViT-B dla szybkości, ViT-L dla równowagi, lub ViT-H dla najwyższej precyzji. Wybór zależy od Twoich wymagań wydajności i dokładności.
Przygotuj obraz, który chcesz segmentować. SAM działa z dowolnymi formatami obrazów – zdjęciami naturalnymi, medycznymi, satelitarnymi czy innymi domenami specjalistycznymi.
Wybierz sposób wskazania obiektów do segmentacji: użyj punktów (klikając na obiekty), narysuj ramkę wokół obiektu, lub podaj wcześniejszą maskę jako wskazówkę. Alternatywnie pozwól modelowi automatycznie wygenerować maski wszystkich obiektów na obrazie bez dodatkowych wskazówek.
Uruchom model na przygotowanym obrazie i otrzymaj maski segmentacyjne dla wybranych lub wszystkich obiektów. Wyniki możesz wizualizować, eksportować do formatów COCO lub wykorzystać w kolejnych etapach przetwarzania.
Jeśli planujesz wdrożenie na urządzeniach brzegowych lub w przeglądarce, wyeksportuj model do formatu ONNX, który zapewnia kompatybilność i optymalizację dla różnych platform.

Podobne skille

python-expert

autor: Shubhamsaboo

Ekspert Pythona – czysty kod, optymalizacja i best practices

Bezpieczeństwo

2777

architect-review

autor: sickn33

Recenzje architektury oprogramowania przez doświadczonego architekta

Bezpieczeństwo

2773

software-security

autor: project-codeguard

Bezpieczny kod od początku — umiejętność dla agentów AI integrująca się z Project CodeGuard

Bezpieczeństwo

1678

feishu-docs

autor: openclaw

Zarządzaj dokumentami Feishu przez API — twórz, edytuj, usuwaj i udostępniaj zawartość programowo.

Bezpieczeństwo

1574

academic-researcher

autor: Shubhamsaboo

Asystent do analiz naukowych, przeglądów literatury i pisania prac badawczych

Bezpieczeństwo

1260

skill-writer

autor: pytorch

Twórz umiejętności agenta Claude z przewodnikiem po strukturze i najlepszych praktykach

Bezpieczeństwo

15116