Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

EuroHPC-prosjekt MAELSTROM, MAchinE Learning for Scalable meTeoROlogy and cliMate

Alternativ tittel: EuroHPC-prosjekt <MAELSTROM, MAchinE Learning for Scalable meTeoROlogy and cliMate>

Tildelt: kr 1,8 mill.

MAELSTROM er et europeisk prosjekt for utnyttelse av maskinlæring (ML) på store data innen værvarsling og klima. Varsler skal forbedres gjennom optimalisering av tungregningsarkitektur og utvikling av software for å håndtere de store datamengdene. MAELSTROM kombinerer ekspertise innen ML, tungregning og værvarsling fra en rekke institusjoner i Europa: Meteorologisk Institutt, European Centre for Medium-Range Weather Forecasts, Jülich Supercomputing Center, 4cast GmBh & Co KG, E4 Computer Engineering SpA, ETH Zürich og University of Luxembourg. Dette tverrfaglige teamet representerer værvarslingssentre, tungregning og forskningsmiljøer innen ML. MAELSTROM vil levere en rekke benchmark-datasett (på omtrent 10 terabyte) for en rekke anvendelser innen vær og klima. Disse inkluderer prosessering av observasjoner, assimilering av observasjoner inn i værvarslingsmodeller, korreksjon av værvarslingsprognoser og andre skreddersydde varselprodukter. Datasettene vil gi forskningsmiljøer innen ML muligheten til å utvikle, teste og validere nye metoder på relevante og realistiske datasett. Tilbydere innen tungregning vil kunne bruke datasettene for benchmarking av ytelsen til ny hardware og endringer i system design. Meteorologisk institutt har i det første året av prosjektet bidratt med et nytt benchmark-datasett med værvarsler for de nordiske landene. Datasettet er gjort åpent tilgjengelig via prosjektets hjemmeside: https://www.maelstrom-eurohpc.eu/. Samme sted er det også publisert en rapport som beskriver dataene sammen med en oppskrift for hvordan man kan sette opp en enkel ML modell. Det betyr at det nå er mulig for alle å teste om man klarer å lage en ML modell som er bedre enn dagens temperaturvarsler på Yr. Foreløpig dekker datasettet bare en liten region i Norden slik at det skal være mulig å teste ML modeller f.eks på egen PC. Neste steg i prosjektet er å skalere dette opp til hele Norden og sammen med de andre internasjonale partnerne utvikle og trene ML modeller på tungregningsinfrastruktur. Målet er at ML løsningen som utvikles vil bli brukt til å forbedre dagens Yr varsler.

To develop Europe’s computer architecture of the future, MAELSTROM will co-design bespoke compute system designs for optimal application performance and energy efficiency, a software framework to optimise usability and training efficiency for machine learning at scale, and large-scale machine learning applications for the domain of weather and climate science. The MAELSTROM compute system designs will benchmark the applications across a range of computing systems regarding energy consumption, time-to-solution, numerical precision and solution accuracy. Customised compute systems will be designed that are optimised for application needs to strengthen Europe’s high-performance computing portfolio and to pull recent hardware developments, driven by general machine learning applications, toward needs of weather and climate applications. The MAELSTROM software framework will enable scientists to apply and compare machine learning tools and libraries efficiently across a wide range of computer systems. A user interface will link application developers with compute system designers, and automated benchmarking and error detection of machine learning solutions will be performed during the development phase. Tools will be published as open source. The MAELSTROM machine learning applications will cover all important components of the workflow of weather and climate predictions including the processing of observations, the assimilation of observations to generate initial and reference conditions, model simulations, as well as post-processing of model data and the development of forecast products. For each application, benchmark datasets with up to 10 terabytes of data will be published online for training and machine learning tool-developments at the scale of the fastest supercomputers in the world. MAELSTROM machine learning solutions will serve as blueprint for a wide range of machine learning applications on supercomputers in the future.

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon