IKTPLUSS-IKT og digital innovasjon

Tidsrekker finnes overalt. Eksempler på tidsrekker mennesker støter på ofte er: data samlet inn fra sensorer i mobiltelefoner eller fabrikker, regnskapstall og klimaindikatorer. For å gjøre teknologiske fremskritt og å ta gode beslutninger er det essensielt å ha gode metoder for å analysere tidsrekker. En utfordring man ofte møter når man analyserer tidsrekker er at de er uregelmessige. Uregelmessige tidsrekker har egenskaper som gjør dem vanskelige å bruke til beslutningsstøtte. Uregelmessigheter kan f.eks. være: manglende data (dvs. at tidsrekken mangler verdi på noen tidspunkt), mye støy (f.eks. vil billige sensorer ofte ha mye mer støy i enn tilsvarende høykvalitetssensorer) eller man kan ha lite data til å lære mønstre fra. Machine Learning for Irregular Time Series (ML4ITS) har som formål å løse noen av de fundamentale utfordringene som kan oppstå når man lager maskinlæringsmodeller for uregelmessige tidsrekker. Prosjektet vil fokusere på følgende oppgaver - Prognoser: å predikere fremtidige verdier for tidsrekken basert på historiske data. - Representasjonslæring: Lage modeller som produserer datarepresentasjoner som kan brukes til mange forskjellige oppgaver eller å redusere mengden data som kreves for å lære en oppgave. - Imputering/støyreduksjon: Lage “ren” data når man observerer tidsrekker med støy eller manglende data. - Avviks- og feilprediksjon, som handler om å vite hvilke observasjoner er unormale eller som indikerer at et system er i en kritisk tilstand. - Syntetiske data. Det siste punktet er sterkt knyttet til å lage datasett som sikrer personvern. Et eksempel hvor dette er relevant er sensordata hentet fra mobiltelefonen, som i utgangspunktet ikke er anonyme data. Nyere forskning viser at det likevel kan være mulig å generere syntetiske data som statistisk oppfører seg som reelle data, men som samtidig er anonyme. Prosjektet har også fokus på reproduserbar forskning og utvikling av åpen kildekode. ML4ITS vil produsere tre doktorgrader innen dette området, og minst atten mastergrader. Videre har prosjektet tre industripartnere, Telenor, Exabel og Refinitiv, og er et samarbeid mellom tre institutter ved NTNU (Institutt for datateknologi og informatikk, Institutt for matematiske fag og Institutt for elektroniske systemer) og Sintef Digital.

Time series data are ubiquitous. The broad diffusion and adoption of Internet of Things, and major advances in sensor technology are examples of why such data have become pervasive. These technologies have applications in several domains, such as healthcare, finance, meteorology and transportation, for solving related tasks on time series. Deep Neural Networks have recently been used to create models that improve on the state of the art for some of these tasks. In some scenarios obtaining a training set that matches the feature space and predicted data distribution characteristics of the test set can be time consuming, difficult and expensive. Thus, there is a need for focusing on modern AI techniques that can extract value from small and irregular data. These considerations can also contribute to conform with the increasing need to address the sustainability and privacy aspects of ML and AI. The goal of this project is to overcome the issue of limited available or labelled data in the time series domain, where the heterogeneity of the data, e.g. non-stationarity, multi-resolution, irregular sampling, poses a further challenge. ML4ITS's main objective is to advance the state-of-the-art in time series analysis for 'irregular' time series data (see explicit definition of 'irregular time series' in the proposal). We plan to achieve these goals and tackling the 'robustness' challenge, by developing novel A) Transfer Learning and B) Unsupervised learning and Data Augmentation methods. These techniques have hardly been explored in the time series domain. We relies on a multidisciplinary study combining different perspectives from the three main scientific communities involved in time series analysis. As a result, the consortium has been composed with this complementarity in mind including researchers across these different fields (IES, MATH, IDI).