gsea-enrichment-analysis
Analiza wzbogacenia zestawów genów z prawidłowym formatowaniem danych w OmicVerse
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umiejętność do analizy wzbogacenia genów (GSEA) i ścieżek biologicznych w OmicVerse. Nauczysz się, jak poprawnie załadować bazy danych szlaków i uruchomić analizę wzbogacenia, unikając typowych błędów formatowania. Skill zawiera szczegółowe wskazówki dotyczące konwersji plików gensetów do formatu słownika, który wymaga funkcja geneset_enrichment(), oraz instrukcje pobierania baz danych szlaków biologicznych takich jak GO Biological Process.
Jak używać
Pobierz bazę danych szlaków biologicznych, uruchamiając ov.utils.download_pathway_database(). Ta funkcja pobiera dostępne zestawy genów, takie jak GO Biological Process 2021 lub KEGG, do lokalnego katalogu genesets/.
Załaduj plik gensetów do formatu słownika za pomocą ov.utils.geneset_prepare(), podając ścieżkę do pliku (np. 'genesets/GO_Biological_Process_2021.txt' lub plik .gmt) oraz organizm ('Human' lub 'Mouse'). Ta funkcja konwertuje plik tekstowy na słownik, który jest wymagany przez funkcję analizy.
Przygotuj listę genów różnicowo ekspresjonowanych (DEG), którą chcesz analizować. Lista powinna zawierać symbole genów, które będą porównane z zestawami genów z bazy danych.
Uruchom analizę wzbogacenia za pomocą ov.bulk.geneset_enrichment(), przekazując listę genów, słownik szlaków (nie ścieżkę pliku), typ wartości p ('auto' lub inny), oraz organizm. Funkcja zwróci wyniki wzbogacenia z wartościami p i statystykami dla każdego zestawu genów.
Pamiętaj, że geneset_enrichment() wymaga słownika, a nie ścieżki do pliku — błędem jest przekazanie stringa z nazwą pliku zamiast wyniku z geneset_prepare().