Toolverse
Wszystkie skille

bulk-rna-seq-differential-expression-with-omicverse

autor: Starlitnightly

Analiza różnicowej ekspresji genów z omicverse – od normalizacji DESeq2 po wzbogacenie szlaków

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Kategoria
Backend
Wyświetlenia
2

O skillu

Umożliwia Ci przeprowadzenie pełnego przepływu analizy różnicowej ekspresji genów (DEG) dla danych RNA-seq w omicverse. Skill automatyzuje mapowanie identyfikatorów genów, normalizację DESeq2, testowanie statystyczne, tworzenie wykresów wulkanu i analizę wzbogacenia szlaków metabolicznych. Idealny, gdy dysponujesz macierzą liczności genów (np. z featureCounts) i chcesz zidentyfikować geny istotnie różnie wyrażone między grupami próbek.

Jak używać

  1. Zainstaluj omicverse i wymagane zależności (scanpy, matplotlib) w swoim środowisku Python. Skill zakłada, że masz już przygotowaną surową macierz liczności genów na poziomie genów, np. z narzędzia featureCounts.

  2. Pobierz pliki mapowania identyfikatorów genów za pomocą ov.utils.download_geneid_annotation_pair() i umieść je w folderze genesets/. Skill obsługuje prebudowane genomy (T2T-CHM13, GRCh38, GRCh37, GRCm39, danRer7, danRer11) lub możesz wygenerować własne mapowanie z pliku GTF.

  3. Wczytaj surową macierz liczności jako plik rozdzielany tabulatorami (np. wyjście featureCounts) za pomocą ov.pd.read_csv() z parametrami sep='\t', header=1, index_col=0. Wyczyść nazwy kolumn, usuwając przyrostki .bam z identyfikatorów próbek.

  4. Zmapuj identyfikatory genów na symbole genów, uruchamiając ov.bulk.Matrix_ID_mapping() z przygotowanym plikiem mapowania. Następnie utwórz obiekt DEG za pomocą ov.bulk.pyDEG() i usuń duplikaty symboli genów, zachowując wersję o najwyższej ekspresji.

  5. Znormalizuj dane, wykonując dds.normalize(), aby obliczyć współczynniki wielkości DESeq2 i skorygować różnice w wielkości bibliotek. Następnie uruchom testowanie statystyczne różnicowej ekspresji między grupami próbek.

  6. Wygeneruj wizualizacje (wykresy wulkanu) i przeprowadź analizę wzbogacenia szlaków metabolicznych, aby zidentyfikować procesy biologiczne związane z różnie wyrażonymi genami.

Podobne skille