datamol
Uproszczona warstwa nad RDKit do analizy molekularnej w odkrywaniu leków
Instalacja
Wybierz klienta i sklonuj repozytorium do odpowiedniego katalogu skilli.
Instalacja
O skillu
Datamol to biblioteka Pythona, która upraszcza pracę z molekułami chemicznymi. Zamiast posługiwać się skomplikowanym RDKit bezpośrednio, używasz intuicyjnego interfejsu z sensownymi ustawieniami domyślnymi. Parsowanie SMILES, standaryzacja struktur, obliczanie deskryptorów, generowanie odcisków palców, klasteryzacja i tworzenie konformerów 3D — wszystko działa out-of-the-box. Zwraca natywne obiekty rdkit.Chem.Mol, więc pełna kompatybilność z ekosystemem RDKit. Obsługuje też przetwarzanie równoległe i dostęp do magazynów chmurowych.
Jak używać
Zainstaluj datamol za pomocą menedżera pakietów: uruchom w terminalu
uv pip install datamol. Po instalacji zaimportuj bibliotekę w swoim skrypcie Pythona:import datamol as dm.Konwertuj łańcuchy SMILES na obiekty molekularne. Użyj
dm.to_mol("CCO")aby sparsować pojedynczą cząsteczkę (tutaj etanol). Jeśli SMILES jest nieprawidłowy, funkcja zwraca None — zawsze sprawdzaj wynik przed dalszą pracą.Przetwarzaj listy cząsteczek pętlą:
mols = [dm.to_mol(smi) for smi in smiles_list]. W ten sposób szybko konwertujesz wiele SMILES na obiekty molekularne gotowe do analizy.Konwertuj molekuły z powrotem do różnych formatów tekstowych. Użyj
dm.to_smiles(mol)dla kanonicznego SMILES,dm.to_smiles(mol, isomeric=True)jeśli chcesz zachować stereochemię, lubdm.to_inchi(mol)idm.to_inchikey(mol)dla formatów InChI.Stosuj zaawansowane operacje takie jak standaryzacja struktur, obliczanie deskryptorów, generowanie odcisków palców czy klasteryzacja — wszystkie funkcje dostępne w module dm. Zwracane obiekty to natywne RDKit, więc możesz je dalej przetwarzać standardowymi narzędziami RDKit jeśli potrzebujesz pełnej kontroli.