Tilbake til søkeresultatene

FRINATEK-Fri prosj.st. mat.,naturv.,tek

Machine Learning Molecular Legos for Catalyst Discovery within Large Chemical Spaces

Alternativ tittel: Maskinlært oppdagelse av nye katalysatorer ved identifisering av molekylære legoklosser for utforskning av store kjemiske rom

Tildelt: kr 11,9 mill.

Katalyse er en teknologi som er essensiell for å løse mange av de viktigste utfordringene samfunnet står overfor i dette århundret. Eksempler her er hydrogenproduksjon fra vann og sollys, resirkulering av CO2 til verdifulle produkter, og grønn produksjon av kjemikalier. Katalysatorer fremskynder disse prosessene, og reduserer både energien som kreves og avfallet som genereres. Antallet kjemiske forbindelser som potensielt kan katalysere kjemiske reaksjoner av interesse er enormt, men bare noen få vil være aktive, selektive og robuste nok for de høye nivåene som kreves i industrielle applikasjoner. catLEGOS prosjektet vil, ved å kombinere kvantemekanikk med kunstig intelligens, takle problemet med å finne optimale katalysatorer på en ny måte. I catLEGOS vil vi generere store og komplekse datasett ved hjelp av kvantemekaniske beregninger. Disse dataene vil så bli brukt til å bygge prediktive modeller med maskinlæringsmetoder. Metodene som skal brukes omfatter dype nevrale nettverk, som er inspirert av den biologiske strukturen i nervevevet, og Gaussiske prosesser, som utnytter sannsynlighetsteori. De nevrale nettverkene vil muliggjøre rask og nøyaktig screening av potensielle katalysatorer og identifisere molekylfragmentene (LEGOS) disse er sammensatt av. Mulige kombinasjoner av disse grunnleggende fragmentene, til helt nye katalysatorer, vil deretter bli undersøkt med Gaussiske maskinlæringsprosesser. catLEGOS vil utvikle nye matematiske representasjoner for benyttelse av maskinlæring i katalyse, med fokus på katalysatorenes fysiske og kjemiske betydning. Disse representasjonene vil benyttes til å forklare modellens prediksjoner, og den nye innsikten vil danne grunnlaget for rasjonelle designmodeller til utvikling av nye katalysatorer. For å nå våre mål vil catLEGOS følge en tverrfaglig tilnærming som kombinerer beregningskjemi med elementer fra statistikk og informatikk.

In a recent study, we showed that Gaussian processes (GP) can be trained with DFT data for predicting the energy barrier of fundamental reactions in homogeneous catalysis (Balcells et al., Chem. Sci., 2020, 11, 4584). The key advantage of these models is that they achieve high accuracy (MAE of ca. 1 kcal/mol) with small training datasets. The catLEGOS project will take this approach to the next level by developing a recommender system for catalysis based on deep neural networks (DNNRc). The DNNRc will enable catalyst discovery by defining the chemical subspaces explored by the GP, which are otherwise arbitrary. The subspaces will be built with active metal and ligand fragments (molecular Legos) provided by the DNNRc. The catLEGOS project will also expand the tmQM dataset (Balcells et al., J. Chem. Inf. Model., 2020, 60, 6135), adding thermodynamics parameters for ~100k transition metal complexes, and the mNBOg graph, a novel multilayer graph representation based on natural bond orbital analysis. Both deliverables will be used in the development of the DNNRc and GP models, which will be tested in the discovery of catalysts for the water oxidation and CO2 reduction reactions.

Budsjettformål:

FRINATEK-Fri prosj.st. mat.,naturv.,tek