Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

TrACEr: Time-Aware ConstrainEd Multimodal Data Fusion

Alternativ tittel: TrACEr: Tidsavhengig fusjon av multimodale data

Tildelt: kr 10,4 mill.

Komplekse systemer finnes i mange domener og en bedre forståelse av hvordan slike systemer oppfører seg og utvikler seg over tid kan gi oss økt forståelse av viktige mekanismer som f.eks. hjernedynamikk og det menneskelige metabolomet. Bedre forståelse kan hjelpe oss å fange opp tidlige tegn på sykdommer. For å oppnå en nødvendig grad av forståelse må disse systemene monitoreres ved bruk av forskjellige sensorteknologier. Dette genererer store mengder data der noen av datasettene endrer seg over tid, mens andre er statiske. Et viktig spørsmål blir da hvordan vi analyserer dynamiske datasett sammen med statiske datasett fra forskjellige kilder. Målet for Tracer prosjektet er å besvare dette spørsmålet gjennom å utvikle nye metoder for dataanalyse som tillater samtidig analyse av statiske og dynamiske data fra flere kilder, samt fange opp underliggende mønstre og utviklingen av disse mønstrene. Den praktiske anvendelsen av disse metodene vil være en analyse av det menneskelige metabolomet. Vi vil bruke de utviklede metodene for å gjøre en samtidig analyse av statisk informasjon (genetikk, mikrobiota) og metabolomikk data. Formålet er å oppdage tolkbare mønstre som avdekker forskjeller i grupper av individer når det gjelder hvordan metabolitter endres over tid. Vi bruker biologiske prøver samlet inn under en måltidsutfordringstest fra COPSAC2000-kohorten for å forstå forskjeller i metabolsk respons mellom grupper av individer (f.eks. grupper med høy kontra lav BMI (kroppsmasseindeks)). I tillegg vil vi vise den brede anvendelse de nye metodene våre har i andre domener, spesielt innen nevrovitenskap. Vi har tilnærmet oss problemet fra flere vinkler: (i) Metoder for data fusjon: Vi har introdusert fleksible algoritmer som kan analysere data fra flere kilder og som kan inkludere eksisterende informasjon i form av begrensninger, forskjellige relasjoner mellom datasett og forskjellige fordelinger av data, (ii) Analyse av data over tid: Vi har introdusert fleksible algoritmer som er i stand til å fange opp mønstre som oppstår over tid. Disse metodene har også blitt innlemmet i vårt data fusjon rammeverk og utvidet til å pålegge en tidsmessig utjevning på utviklende mønstre, (iii) Analyse av dynamiske metabolomikk data (simuleringer): Vi har tatt i bruk modeller innen biologi for å simulere dynamiske metabolomikk data slik at vi kan utforske hvilke datadrevne metoder som er best egnet til å identifisere den underliggende dynamikken. Dette inkluderer både småskala metabolske modeller og metabolske modeller for hele menneskekroppen, (iv) Dynamisk dataanalyse for metabolomikk og fusjon av omikk-data (reelle data): Vi har utviklet forbedrede metoder for å analysere tidsoppløste metabolomikk-data, og demonstrert potensialet disse metodene har når det gjelder å fange opp statiske og dynamiske biomarkører for ulike fenotyper ved å bruke målinger fra COPSAC2000-kohorten. Felles analyse av dynamiske metabolomikk-data og andre omikk-datasett pågår, (v) Andre anvendelser: Vi har brukt de utviklede metodene for å analysere reelle fMRI (funksjonell MR-undersøkelse) data som har gitt interessante funn for å skille mellom friske pasienter og pasienter med schizofreni, samt å avdekke endringer som oppstår over tid. Vi har også studert ytelsen til lignende metoder for å analysere fMRI-data som er samlet inn under forskjellige aktiviteter. Publikasjoner og annen aktivitet i prosjektet finnes på prosjektets hjemmeside: https://tracer.simulamet.no/ Prosjektets hovedbidrag vil være å utvikle nye metoder for dataanalyse som er nødvendige for å hente ut meningsfylt informasjon fra personlige helsedata. Dette er data som blir samlet inn i prediktive medisinstudier der deltakerne regelmessig avgir blodprøver for oppfølging av deres helsetilstand og for å bli varslet om tidlige tegn på sykdommer.

Data mining holds the promise to improve our understanding of dynamics of complex systems such as the human brain and human metabolome (i.e., the complete set of small biochemical compounds in the human body) by discovering the underlying patterns, i.e., subsystems, in data collected from these systems. However, discovering those patterns and understanding their evolution in time is a challenging task. The complexity of the systems requires collection of both time-evolving and static data from multiple sources using different technologies recording the behavior of the system from complementary viewpoints, and there is a lack of data mining methods that can find the hidden patterns in such complex data. The goal of this multidisciplinary project is to develop novel data mining techniques to jointly analyze static and dynamic data sets to discover underlying patterns, understand temporal dynamics of those patterns, and capture early signs of future outcomes. We will introduce a scalable and constrained data fusion framework that can jointly factorize heterogeneous data in the form of matrices and multi-way arrays, by incorporating temporal as well as domain-specific constraints. These methods will be motivated by a real, challenging system: the human metabolome, and used to jointly analyze static genetic information and longitudinal metabolomics data to discover interpretable patterns, i.e., subsystems corresponding to metabolic networks (networks of metabolites acting together), with the ultimate goal of understanding their role in the transition from healthy to diseased states. The project will play a significant role in terms of developing the data mining tools needed to extract meaningful information from the surge of data, referred to as "personal data clouds" being collected in predictive medicine studies, where participants give blood samples regularly to track their health status and will be alerted of early signs of diseases.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon