Toolverse
Wszystkie skille

pydeseq2

autor: davila7

Analiza ekspresji genów z danych RNA-seq — identyfikuj różnice między warunkami eksperymentalnymi

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
davila7
Kategoria
Backend

O skillu

PyDESeq2 to narzędzie do analizy różnicowej ekspresji genów w danych RNA-seq. Pozwala porównywać ekspresję genów między warunkami eksperymentalnymi (np. leczony vs kontrola), obsługuje projekty wieloczynnikowe z korektą błędu wielokrotnego testowania i testy Walda. Integruje się z bibliotekami pandas i AnnData, umożliwiając pełne przepływy pracy od załadowania danych do interpretacji wyników, w tym generowanie wykresów wulkanu i MA.

Jak używać

  1. Przygotuj dane wejściowe: załaduj plik CSV z liczbami odczytów genów (wiersze to geny, kolumny to próbki) oraz plik metadanych zawierający informacje o warunkach eksperymentalnych dla każdej próbki.

  2. Filtruj geny o niskiej liczbie odczytów, aby usunąć szum. Zatrzymaj tylko geny, które mają co najmniej 10 odczytów łącznie we wszystkich próbkach.

  3. Zainicjalizuj obiekt DeseqDataSet, przekazując macierz liczb, metadane i formułę projektową (np. ~condition dla porównania dwóch warunków). Uruchom metodę deseq2() aby dopasować model statystyczny.

  4. Wykonaj testy statystyczne za pomocą DeseqStats, określając kontrast — które grupy chcesz porównać (np. "treated" vs "control"). Metoda summary() wyświetli podsumowanie wyników.

  5. Wyodrębnij wyniki jako tabelę DataFrame i filtruj geny istotne statystycznie, zazwyczaj używając progu skorygowanej wartości p (padj < 0,05). Liczba znalezionych genów różnicowo wyrażonych wskaże siłę efektu eksperymentu.

Podobne skille