pydeseq2
Analiza ekspresji genów z danych RNA-seq — identyfikuj różnice między warunkami eksperymentalnymi
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
PyDESeq2 to narzędzie do analizy różnicowej ekspresji genów w danych RNA-seq. Pozwala porównywać ekspresję genów między warunkami eksperymentalnymi (np. leczony vs kontrola), obsługuje projekty wieloczynnikowe z korektą błędu wielokrotnego testowania i testy Walda. Integruje się z bibliotekami pandas i AnnData, umożliwiając pełne przepływy pracy od załadowania danych do interpretacji wyników, w tym generowanie wykresów wulkanu i MA.
Jak używać
Przygotuj dane wejściowe: załaduj plik CSV z liczbami odczytów genów (wiersze to geny, kolumny to próbki) oraz plik metadanych zawierający informacje o warunkach eksperymentalnych dla każdej próbki.
Filtruj geny o niskiej liczbie odczytów, aby usunąć szum. Zatrzymaj tylko geny, które mają co najmniej 10 odczytów łącznie we wszystkich próbkach.
Zainicjalizuj obiekt DeseqDataSet, przekazując macierz liczb, metadane i formułę projektową (np. ~condition dla porównania dwóch warunków). Uruchom metodę deseq2() aby dopasować model statystyczny.
Wykonaj testy statystyczne za pomocą DeseqStats, określając kontrast — które grupy chcesz porównać (np. "treated" vs "control"). Metoda summary() wyświetli podsumowanie wyników.
Wyodrębnij wyniki jako tabelę DataFrame i filtruj geny istotne statystycznie, zazwyczaj używając progu skorygowanej wartości p (padj < 0,05). Liczba znalezionych genów różnicowo wyrażonych wskaże siłę efektu eksperymentu.