single-cell-rna-qc
Automatyczna kontrola jakości danych sekwencjonowania RNA pojedynczych komórek zgodnie ze standardami scverse.
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Umożliwia szybką ocenę jakości danych sekwencjonowania RNA pojedynczych komórek (formaty .h5ad i .h5) z wykorzystaniem filtrowania opartego na MAD i wizualizacji. Narzędzie automatycznie wykrywa format pliku, usuwa komórki niskiej jakości oraz generuje metryki i wykresy diagnostyczne. Idealne do eksploracyjnej analizy, przetwarzania wsadowego wielu zestawów danych i pracy z wytycznymi scverse/scanpy. Obsługuje pliki z 10X Genomics Cell Ranger oraz dane z przepływów pracy Python.
Jak używać
Upewnij się, że masz zainstalowane wymagane biblioteki: anndata, scanpy, scipy, matplotlib, seaborn i numpy. Jeśli ich brakuje, zainstaluj je za pomocą pip.
Przygotuj plik wejściowy w formacie .h5ad (AnnData) lub .h5 (10X Genomics Cell Ranger). Plik powinien zawierać surowe dane sekwencjonowania RNA pojedynczych komórek.
Uruchom skrypt QC z linii poleceń, podając ścieżkę do pliku: python3 scripts/qc_analysis.py input.h5ad. Dla plików 10X Genomics użyj: python3 scripts/qc_analysis.py raw_feature_bc_matrix.h5.
Opcjonalnie dostosuj progi filtrowania za pomocą parametrów --mad-counts, --mad-genes i --mad-mt, aby zmienić czułość detekcji komórek niskiej jakości. Możesz też wskazać katalog wyjściowy parametrem --output-dir.
Poczekaj na zakończenie analizy. Skrypt automatycznie wykryje format pliku, załaduje dane, zastosuje filtrowanie MAD i wygeneruje wizualizacje diagnostyczne.
Sprawdź wyniki w katalogu wyjściowym — otrzymasz metryki jakości, wykresy oraz przefiltrowany zbiór danych gotowy do dalszych analiz.