Toolverse
Wszystkie skille

bulktrajblend-trajectory-interpolation

autor: Starlitnightly

Uzupełniaj luki w trajektoriach rozwojowych komórek, łącząc dane single-cell z bulk RNA-seq

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Data Science
Wyświetlenia
2

O skillu

BulkTrajBlend to umiejętność do interpolacji trajektorii rozwojowych w danych scRNA-seq. Generujesz brakujące stany komórek na podstawie dopasowanych próbek bulk RNA-seq, trenując modele beta-VAE i GNN. Narzędzie dekonwolwuje próbki bulk, identyfikuje wspólnoty komórek i wypełnia przerwy w sekwencjach rozwojowych. Idealne dla badaczy zajmujących się bioinformatyką, którzy pracują z danymi jednokomórkowych i masowych sekwencji RNA.

Jak używać

  1. Zainstaluj biblioteki wymagane: omicverse, scanpy, scvelo oraz funkcje pomocnicze. Zaimportuj omicverse jako ov i uruchom ov.plot_set() do konfiguracji wizualizacji. Załaduj referencyjne dane scRNA-seq (np. za pomocą scv.datasets.dentategyrus()) oraz surowe liczniki bulk RNA-seq, a następnie harmonizuj identyfikatory genów funkcją ov.bulk.Matrix_ID_mapping().

  2. Utwórz instancję BulkTrajBlend, przekazując dane bulk, dane single-cell oraz parametry grupowania. Określ bulk_group jako listę kolumn odpowiadających próbkom bulk (np. ['dg_d_1','dg_d_2','dg_d_3']) i wskaż klucz zawierający typy komórek (celltype_key='clusters'). Upewnij się, że dane bulk są w postaci surowych liczników, nie znormalizowanych.

  3. Skonfiguruj model beta-VAE, wywołując vae_configure() z parametrem cell_target_num określającym oczekiwaną liczbę komórek na klaster. Jeśli pominiesz ten argument, system automatycznie oszacuje wartości na podstawie metody TAPE.

  4. Wytrenuj model beta-VAE, podając parametry takie jak batch_size (np. 512), learning_rate (1e-4), hidden_size (256) i epoch_num (3500). Określ ścieżki zapisu dla modelu VAE i wygenerowanych komórek. Trening można wznowić, ładując wcześniej zapisany model funkcją vae_load().

  5. Wygeneruj brakujące stany komórek z próbek bulk, używając wytrenowanego modelu. Upewnij się, że używasz spójnych ziaren losowych, aby wyniki były powtarzalne.

  6. Interpoluj trajektorie, łącząc wygenerowane komórki z istniejącymi danymi scRNA-seq. Model GNN identyfikuje wspólnoty komórek i wypełnia przerwy w sekwencjach rozwojowych, tworząc pełną trajektorię.

Podobne skille