Tilbake til søkeresultatene

IKTFORSKNING-IKTFORSKNING

ML4ITS - Machine Learning for Irregular Time Series

Alternativ tittel: ML4ITS - Maskinlæring for Uregelmessige Tidsserier

Tildelt: kr 15,9 mill.

Tidsseriedata finnes overalt i dagens samfunn. Fra sensormålinger i mobiltelefoner og industrielle systemer til finansielle indikatorer, helsedata, miljøobservasjoner og klimamålinger – mange aspekter av hverdagen vår registreres som data som utvikler seg over tid. Å forstå og analysere slike data er avgjørende for teknologisk utvikling, kunnskapsbaserte beslutninger og for å bygge mer effektive og bærekraftige systemer. Virkelige tidsserier følger imidlertid sjelden enkle mønstre. Mange datasett er irregulære: observasjoner kan være ujevnt fordelt i tid, ufullstendige eller påvirket av støy og usikkerhet. Manglende data kan oppstå når sensorer svikter, når menneskelig registrering er ufullstendig, eller når fenomenet vi studerer kun kan observeres ved bestemte tidspunkter. Samtidig kan bruk av rimelige sensorer gi større datadekning, men også mer støy i målingene. Slike utfordringer gjør at tradisjonelle analysemetoder ofte ikke er tilstrekkelige, og skaper behov for nye maskinlæringsmetoder som er spesielt utviklet for irregulære data. Prosjektet Machine Learning for Irregular Time Series (ML4ITS) adresserer disse utfordringene gjennom utvikling av avanserte datadrevne metoder som kan håndtere komplekse og ufullstendige tidsserier. Prosjektet fokuserer særlig på følgende oppgaver: - Prediksjon (forecasting): å forutsi framtidige verdier basert på historiske og nåværende observasjoner for å støtte planlegging og beslutningstaking. - Representasjonslæring: å identifisere meningsfulle mønstre og kompakte representasjoner som gjør det mulig å lære fra begrensede eller heterogene data. - Imputasjon og støyreduksjon: å rekonstruere pålitelige signaler når data mangler eller er påvirket av støy. - Anomalideteksjon og feilprediksjon: å oppdage uvanlig atferd eller tidlige tegn på kritiske systemtilstander. - Generering av syntetiske data: å lage realistiske kunstige datasett som bevarer statistiske egenskaper samtidig som personvern ivaretas. Syntetiske data åpner særlig for nye muligheter innen ansvarlig datadeling. Sensitive datasett – for eksempel fra helse, mobilitet eller personlige enheter – kan være vanskelig å dele på grunn av personvernhensyn. Ved å generere syntetiske versjoner som fanger opp essensielle mønstre uten å avsløre individuell informasjon, bidrar prosjektet til tryggere samarbeid og raskere innovasjon. I tillegg til metodisk utvikling fremmer ML4ITS reproducerbar forskning og utvikler åpen kildekode som kan komme både forskningsmiljøer, industri og offentlig sektor til gode. Ved å koble grunnleggende forskning med praktiske anvendelser styrker prosjektet Norges og Europas kompetanse innen pålitelig og robust kunstig intelligens. ML4ITS er et samarbeid mellom SINTEF Digital og tre fagmiljøer ved NTNU: Institutt for datateknologi og informatikk, Institutt for matematiske fag og Institutt for elektroniske systemer.
The ML4ITS project has advanced machine learning methodologies designed specifically for irregular time series data, addressing challenges that frequently arise in real-world applications but remain difficult for traditional approaches. The project outcomes include methodological innovation, technological contributions, and broader scientific, industrial, and societal impacts. From a scientific perspective, ML4ITS has contributed to the development of robust modelling approaches capable of handling irregular sampling, missing observations, and noisy measurements. The project has advanced several key research directions, including forecasting under uncertainty, representation learning from incomplete data, anomaly detection and failure prediction, and generative modelling for time series. Together, these developments improve the reliability and applicability of machine learning systems operating in realistic data environments. The interdisciplinary collaboration between computer science, mathematics, and electronic systems has strengthened methodological innovation and fostered new cross-disciplinary research synergies. Generative modelling has been an important component of the project, supporting both synthetic data generation and improved understanding of data distributions and variability. By learning underlying structures in irregular time series, generative approaches enable the creation of realistic artificial datasets, support data augmentation in data-scarce scenarios, and facilitate simulation-based experimentation. These capabilities contribute to privacy-preserving data sharing, reproducibility, and more robust evaluation of machine learning models. Technologically, ML4ITS has promoted reproducible research practices and contributed to open-source tools and frameworks that make advanced irregular time series methods more accessible to researchers and industry practitioners. Standardized evaluation procedures and transparent workflows help reduce barriers to adoption and improve comparability across studies. The potential industrial impact spans multiple sectors that rely on time-dependent data, including energy systems, mobility, healthcare, environmental monitoring, finance, and smart infrastructure. Improved modelling of irregular time series enables earlier anomaly detection, more reliable forecasting, and enhanced decision-support systems, contributing to increased efficiency, safety, and sustainability. Generative modelling further enables scenario exploration and safer development of AI systems through synthetic data and simulation. From a societal perspective, the project contributes to trustworthy and responsible artificial intelligence by addressing challenges related to uncertainty, imperfect data quality, and privacy-preserving data usage. These advances support the development of AI systems that are more robust, transparent, and aligned with ethical and regulatory requirements.
Time series data are ubiquitous. The broad diffusion and adoption of Internet of Things, and major advances in sensor technology are examples of why such data have become pervasive. These technologies have applications in several domains, such as healthcare, finance, meteorology and transportation, for solving related tasks on time series. Deep Neural Networks have recently been used to create models that improve on the state of the art for some of these tasks. In some scenarios obtaining a training set that matches the feature space and predicted data distribution characteristics of the test set can be time consuming, difficult and expensive. Thus, there is a need for focusing on modern AI techniques that can extract value from small and irregular data. These considerations can also contribute to conform with the increasing need to address the sustainability and privacy aspects of ML and AI. The goal of this project is to overcome the issue of limited available or labelled data in the time series domain, where the heterogeneity of the data, e.g. non-stationarity, multi-resolution, irregular sampling, poses a further challenge. ML4ITS's main objective is to advance the state-of-the-art in time series analysis for 'irregular' time series data (see explicit definition of 'irregular time series' in the proposal). We plan to achieve these goals and tackling the 'robustness' challenge,  by developing novel A) Transfer Learning and B) Unsupervised learning and Data Augmentation methods. These techniques have hardly been explored in the time series domain. We relies on a multidisciplinary study combining different perspectives from the three main scientific communities involved in time series analysis. As a result, the consortium has been composed with this complementarity in mind including researchers across these different fields (IES, MATH, IDI).

Publikasjoner hentet fra Cristin og NVA

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

IKTFORSKNING-IKTFORSKNING