Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

Advanced Analytics on Smart Data

Alternativ tittel: Avansert analyse av smarte data

Tildelt: kr 15,5 mill.

Målsetningen for ANALYST-prosjektet har vært å utvikle nye metoder for analyse av store datasett med en romlig struktur. Med store datasett menes millioner til hundrevis av millioner punkter. Forskningen har, i samarbeid med Kartverkets Sjødivisjon, satt søkelys på havbunns og terrengdata samlet inn med Lidar og sonar, og, i samarbeid med Intervensjonssenteret ved Rikshospitalet, satt søkelys på lagvise medisinske bildedata fra CT- og MR-skannere. En fellesnevner for begge disse datatyper er en stykkevis glatt struktur i de underliggende geometrier. Prosjektets hypotese har vært at slike data kan representeres nøyaktig matematisk med splineteknologi, samt at de lokalt forfinede splines utviklet ved SINTEF det siste tiår (LR B-splines) er spesielt egnet for kompakt representasjon av datasett med store lokale variasjoner. Det har også vært viktig å se på hvordan kunstig intelligens kan komplettere tradisjonelle spline algoritmer, både med hensyn på å forbedre dagens ytelse og til å håndtere nye problemstillinger. Havbunns og terrengdata kan ha forskjellige strukturer, som regulære digitale terreng- og overflate-modeller og som ikke-regulære punktdata fra f.eks. Lidar og sonar. For regulære data har konvolusjonelle nevrale nettverk blitt modifisert og anvendt til å fylle manglende data med troverdige verdier i samarbeid med besøkende PhD-stipendiat fra Marie-Curie nettverket ARCADES. For prosessering av ikke-regulære data har utvikling av nye nevrale nettverk startet i ANALYST og fortsettes av en PhD-stipendiat ansatt ved SINTEF i Marie-Curie nettverket GRAPES. For de ikke-regulær punktdatasettene, har vi også videreutviklet rene metoder for LR B-splines uten bruk av nevrale nett. De to siste årene av ANALYST er aktiviteten rettet mot havbunn og terrengdata tilført et nytt aspekt ved å styre approksimasjonen med lokalt forfinede splines med informasjonsmodeller i samarbeid med Universitetet i Hannover. Approksimasjonsprosessen starter med å tilpasse en glatt flate med en svært kompakt representasjon til datamengden, så tilføres gradvis ekstra frihetsgrader/representasjonsstyrke i områder der flaten er mest unøyaktig. Informasjonsmodellene gjør det mulig å stoppe prosessen når det å tilføre ekstra frihetsgrader bidrar lite til den totale nøyaktigheten. Vi har videre med gode resultater utforsket hvordan eksisterende spline algoritmer og programvare utviklet tidligere rettet Computer Aided Design kan brukes til relevant analyse av de genererte modellene. Deteksjon av endringer over tid ved å sammenlikne målinger utført på det samme området ved forskjellige tidspunkt har også vært sentralt. Punktskyene fra forskjellig tidspunkt har normalt ikke samme utstrekning og punktmønster. Dette gjør direkte sammenligning av punktskyer krevende. Vi funnet det betydelig enklere å sammenlikne flater som representerer ulike tidspunkt eller punkter fra et tidspunkt med flater fra et annet tidspunkt. Videre har vi utvidet datasettet med tidsakse og approksimert med et LR B-spline volum. Begge angrepsvinkler har gitt et godt grunnlag for å identifisere endringer over tid. For de lagvise medisinske data har vi med suksess kombinerte tensorprodukt spline representasjoner med nevrale nett. I tensorprodukt spline flater er koeffisientene organisert i et rektangulært nett på samme måte som i et bilde med pixel verdier. Nevrale nett som jobber på tensorprodukt spline representasjoner kan på samme måte som nevrale nett for bilder effektivt utnytte regnekapasiteten til GPUer. Selv om utgangspunktet for arbeidet var CT- og MR-skann, så har de utviklede metodene også vist seg god egnet for andre lagvise sensordata. Et eksempel er slike data fra additiv produksjon (3D printing). Den forventede nytteverdi av ANALYST er. - Innen spline forskning er LR B-spline svært lovende med hensyn på representasjon og prosessering av store datasett i to eller flere variabler. Det er også vist at av de alternative lokalt forfinede spline metoder, så er LR B-spline teknologi den mest fleksible. - Det er demonstrert at nevrale nettverk kan bestemme spline koeffisienter direkte og dermed kode resultatet av en læringsprosess mer kompakt enn bruk av pixel og voxel strukturer. - Det er dannet en bro mellom forskning innen spline teknologi og nevrale nettverk som viser at kombinasjon av kunnskap fra begge fagfelter gir nye muligheter. - For næringslivet og samfunnet er nytteverdi demonstrert på spredte data av geografisk natur ved at kompakte havbunnsmodeller med garantert kvalitet kan skapes. Disse er svært godt egnet for analyseres av matematiske natur. - For lagvise medisinske data kan en direkte skape spline representasjoner som er svært godt egnet for matematisk analyse og betydelig mer kompakte en voxel representasjon. - En overordnet nytteverdi er muligheten til å skape digitale tvillinger fra sensordata for et bredt spekter av anvendelser. Tvillinger som effektivt kan analyseres og sammenliknes med tidligere og fremtidig informasjon og data.

- Kartverkets sjødivisjon sendte i november 2021 inn en søknad til Kommunal- og distriktsdepartementet om finansiering av en ny satsing på "Marine grunnkart i kystsonen". Her er resultater fra ANALYST er en svært aktuell teknologi. - For lagvise (medisinske) data kan en direkte skape spline representasjoner som er svært godt egnet for matematisk analyse og betydelig mer kompakte en voxel representasjon. - En overordnet nytteverdi er muligheten til å skape digitale tvillinger fra sensordata for et bredt spekter av anvendelser. -SINTEF arbeider med å en "Mission Pilot" innen klimatilpassing i samarbeid med Innlandet fylke der resultater fra ANALYST inngår blant basisteknologier denne kan benytte. - Det er dannet en bro mellom forskning innen spline teknologi og nevrale nettverk som viser at kombinasjon av kunnskap fra begge fagfelter gir nye muligheter. I Marie-Curie nettverket GRAPES videreføres arbeid med de implisitte og spline-baserte nevrale nettverk.

Over the last ten years, a new field of research has emerged: Big Data Analytics (BDA). Massively distributed systems offer new tools for exploring large datasets. In parallel, a steady increase in computing power and available training data has enabled the field of Artificial Intelligence (AI) to gain critical mass. The challenge of managing, investigating, and visualizing big datasets is not new in the fields of Science, Technology, Engineering and Mathematics (STEM). Recent developments in BDA offer a new set of tools for overcoming these challenges, however, there are significant challenges that arise from the structural differences between most STEM data and the unstructured textual data typical in classical Big Data applications. In order to address these challenges, we propose using Locally Refined (LR-) spline data modelling to turn Big Data into Smart Data. In early implementations of LR-spline algorithms in 2D and 3D, we have seen their potential as compact interactive models for visual and quantitative analytics on big datasets, well suited for hardware-accelerated interrogation and visualization. By spatial tiling and stitching, we have an extremely versatile and parallelizable approach, well suited for Big Data infrastructures. We can therefore include time and other relevant variables in a compact, interactive, multi-scale, higher order, locally refined model. However, substantial theoretical developments are needed before this vision of LR-spline modelling of Big Data can be realized. ANALYST will provide the research platform to bring the theoretical foundation of LR-splines up to a level where their full potential can be explored, combining BDA and AI to provide advanced analytics on the LR-spline model. While the focus will be on data from applications in the STEM fields, the resulting algorithms have a wider applicability, providing highly scalable complex modelling tools for Big Data Analytics.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon