Toolverse
Wszystkie skille

datamol

autor: davila7

Uproszczona warstwa nad RDKit do analizy molekularnej w odkrywaniu leków

Instalacja

Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.

Instalacja

Szybkie info

Autor
davila7
Kategoria
Data Science
Wyświetlenia
1

O skillu

Datamol to biblioteka Pythona, która upraszcza pracę z molekułami chemicznymi. Zamiast posługiwać się skomplikowanym RDKit bezpośrednio, używasz intuicyjnego interfejsu z sensownymi ustawieniami domyślnymi. Parsowanie SMILES, standaryzacja struktur, obliczanie deskryptorów, generowanie odcisków palców, klasteryzacja i tworzenie konformerów 3D — wszystko działa out-of-the-box. Zwraca natywne obiekty rdkit.Chem.Mol, więc pełna kompatybilność z ekosystemem RDKit. Obsługuje też przetwarzanie równoległe i dostęp do magazynów chmurowych.

Jak używać

  1. Zainstaluj datamol za pomocą menedżera pakietów: uruchom w terminalu uv pip install datamol. Po instalacji zaimportuj bibliotekę w swoim skrypcie Pythona: import datamol as dm.

  2. Konwertuj łańcuchy SMILES na obiekty molekularne. Użyj dm.to_mol("CCO") aby sparsować pojedynczą cząsteczkę (tutaj etanol). Jeśli SMILES jest nieprawidłowy, funkcja zwraca None — zawsze sprawdzaj wynik przed dalszą pracą.

  3. Przetwarzaj listy cząsteczek pętlą: mols = [dm.to_mol(smi) for smi in smiles_list]. W ten sposób szybko konwertujesz wiele SMILES na obiekty molekularne gotowe do analizy.

  4. Konwertuj molekuły z powrotem do różnych formatów tekstowych. Użyj dm.to_smiles(mol) dla kanonicznego SMILES, dm.to_smiles(mol, isomeric=True) jeśli chcesz zachować stereochemię, lub dm.to_inchi(mol) i dm.to_inchikey(mol) dla formatów InChI.

  5. Stosuj zaawansowane operacje takie jak standaryzacja struktur, obliczanie deskryptorów, generowanie odcisków palców czy klasteryzacja — wszystkie funkcje dostępne w module dm. Zwracane obiekty to natywne RDKit, więc możesz je dalej przetwarzać standardowymi narzędziami RDKit jeśli potrzebujesz pełnej kontroli.

Podobne skille