bioservices
Dostęp do 40+ baz danych bioinformatycznych z jednego interfejsu Pythona
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
BioServices to narzędzie dla badaczy, które łączy ponad 40 serwisów bioinformatycznych w jeden spójny interfejs. Wyszukuj sekwencje białek w UniProt, analizuj szlaki metaboliczne w KEGG, przeszukuj bazy związków chemicznych (ChEMBL, PubChem) i mapuj identyfikatory między bazami danych. Obsługuje zarówno protokoły REST, jak i SOAP/WSDL, umożliwiając integrację danych z wielu źródeł w jednym przepływie pracy. Idealne do badań genomicznych, analizy białek, wyszukiwania podobieństwa sekwencji i eksploracji ontologii genów.
Jak używać
Zainstaluj pakiet BioServices za pomocą pip: pip install bioservices. Upewnij się, że masz zainstalowanego Pythona w wersji 3.6 lub nowszej.
Zaimportuj moduł UniProt i utwórz instancję: from bioservices import UniProt, następnie u = UniProt(verbose=False). Parametr verbose=False wyłącza szczegółowe komunikaty debugowania.
Wyszukaj białko po nazwie lub identyfikatorze, na przykład results = u.search("ZAP70_HUMAN", frmt="tab", columns="id,genes,organism"). Wynik zwróci tabelę z identyfikatorami, genami i organizmami.
Pobierz sekwencję białka w formacie FASTA: sequence = u.retrieve("P43403", "fasta"). Zastąp "P43403" identyfikatorem UniProt interesującego Cię białka.
Mapuj identyfikatory między bazami danych, aby znaleźć odpowiadające sobie rekordy: kegg_ids = u.mapping(fr="UniProtKB_AC-ID", to="KEGG", query="P43403"). To połączy identyfikator UniProt z odpowiadającym mu identyfikatorem w bazie KEGG.
Dla bardziej zaawansowanych analiz, takich jak wyszukiwanie podobieństwa sekwencji czy analiza szlaków metabolicznych, zapoznaj się z dokumentacją poszczególnych modułów (KEGG, Reactome, ChEMBL), które działają analogicznie do UniProt.