Zespół opracowuje nową generację sztucznych sieci neuronowych zdolnych do przewidywania właściwości związków organicznych

Anonim

Naukowcy z Rosji, Estonii i Wielkiej Brytanii stworzyli nową metodę przewidywania czynnika biokoncentracji (BCF) cząsteczek organicznych. Wykorzystując klasyczne modele interakcji fizykochemicznych między rozpuszczalnikiem i substancją rozpuszczoną oraz zaawansowanymi metodami uczenia maszynowego, nowe podejście umożliwia przewidywanie złożonych właściwości substancji w oparciu o minimalny zestaw danych wejściowych. Wyniki badania opublikowano w Journal of Physics: Condensed Matter.

Jedną z najważniejszych cech substancji organicznych, BCF określa, ile substancji jest skoncentrowane w tkance w stosunku do ilości tej substancji w środowisku w warunkach równowagi. BCF jest szeroko stosowany w ocenie bezpieczeństwa różnych związków chemicznych i może być mierzony w praktyce. Na przykład można umieścić badaną substancję chemiczną w akwarium, poczekać do osiągnięcia równowagi, a następnie zmierzyć jej stężenie zarówno w rybach, jak i w wodzie. Ale co, jeśli chcesz oszacować BCF na podstawie samych obliczeń?

Jednym ze sposobów osiągnięcia tego jest wygenerowanie zestawu parametrów cząsteczki (deskryptorów) i zbudowanie modelu matematycznego opartego na tych danych wejściowych. Model może okazać się dość dokładny, ale może być trudny do interpretacji ze względu na dużą liczbę parametrów. Co gorsza, model może nie działać prawidłowo w przypadku związków różniących się znacznie od tych w zestawie treningowym.

Druga metoda opiera się na cząsteczkowej teorii cieczy, która opisuje zachowanie się substancji w roztworach. Jednak biokoncentracja jest złożonym parametrem, który zależy od wielu czynników, więc trudno jest przewidzieć, stosując bezpośrednio teorię fizykochemiczną.

Naukowcy ze Skoltech, Uniwersytetu w Tartu (Estonia) i Uniwersytetu Strathclyde (Wielka Brytania), pod kierunkiem profesora Skoltecha Maxima Fedorowa, opracowali hybrydową metodę prognozowania BCF, która składa się z dwóch kroków: najpierw naukowcy wykonują obliczenia fizykochemiczne, aby uzyskać 3 -D gęstość wodoru i tlenu wokół badanej cząsteczki, a następnie zastosować splotowe sieci neuronowe 3-D - technologia skutecznie stosowana w rozpoznawaniu obrazów. To podejście pokazuje, że złożone właściwości substancji organicznych można opisać nawet przy niewielkiej ilości danych wejściowych.

"Nasza metoda znacznie ułatwi przewidywanie wpływu danej substancji na środowisko, ale najważniejsze jest to, że opracowaliśmy uniwersalną metodę opisywania cząsteczki w taki sposób, że jej obraz 3D można przenieść na 3-D splotowa sieć neuronowa W dłuższej perspektywie nasza metoda pomoże przewidzieć właściwości różnych "egzotycznych" cząsteczek i nowych związków, w których istniejące metody relacji struktura-właściwości nie działają "- powiedział pierwszy autor i dr Skoltech.. uczeń Sergey Sosnin.

menu
menu