single-cell-clustering-and-batch-correction-with-omicverse
Klasteryzacja komórek i korekcja batch'y w analizie genomiki jednokomórkowej
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność Claude'a do przewodniczenia przepływem pracy omicverse dla danych jednokomórkowych. Obejmuje kontrolę jakości, preprocessing, wybór genów, klasteryzację wieloma metodami (Leiden, Louvain, scICE, GMM), modelowanie tematyczne, cNMF oraz harmonizację batch'y (Harmony, scVI, BBKNN, Combat). Pracuje z obiektami AnnData i wspiera zarówno analizę pojedynczych batch'y, jak i integrację wielobatch'owej.
Jak używać
Zainstaluj omicverse i wymagane biblioteki (scanpy, scvelo dla danych demo). Zaimportuj omicverse jako ov, scanpy jako sc i zastosuj ov.plot_set() do ustawienia stylizacji wykresów.
Wczytaj dane jako obiekt AnnData — użyj scv.datasets.dentategyrus() do demonstracji lub ov.read() do załadowania plików .h5ad. Jeśli analizujesz wiele batch'y, ustaw identyfikatory w adata.obs['batch'] dla każdej kohorty.
Uruchom kontrolę jakości za pomocą ov.pp.qc() z progami dla procentu mitochondrialnego, liczby UMI i liczby wykrytych genów. Funkcja automatycznie odfiltruje komórki niskiej jakości i wyświetli statystyki per batch. Zapisz przefiltrowany obiekt jako punkt kontrolny.
Przeprowadź preprocessing i selekcję genów — wywołaj ov.pp.preprocess() z wyborem trybu (shiftlog lub pearson), ustaw liczbę genów wysoce zmiennych (np. 3000) i opcjonalnie wskaż batch_key do normalizacji wewnątrzbatch'owej. Przypisz adata.raw = adata przed subsettingiem do wybranych genów.
Wybierz metodę klasteryzacji (Leiden, Louvain, scICE lub GMM) i uruchom ją przez odpowiednią funkcję ov.pp — wynik zostanie zapisany w adata.obs['leiden'] lub innym kluczu. Wizualizuj wyniki za pomocą sc.pl.umap() lub sc.pl.tsne().
Dla danych wielobatch'owych zastosuj korekcję batch'y — wybierz Harmony, scVI, BBKNN lub Combat i uruchom przez omicverse. Opcjonalnie dodaj modelowanie tematyczne (topic modeling) lub cNMF do odkrycia wzorców biologicznych w klastrach.