Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

TROMBOLOME: Development and application of a comprehensive digital archive of the TROMsø study metaBOLOME

Alternativ tittel: Utvikling og applikasjon av et digitalt arkiv over TROMsøundersøkelsens metaBOLOM

Tildelt: kr 14,3 mill.

Datadrevet helseforskning kan gi mer nøyaktige helse- og sykdomsprofiler og dermed bedre prediktive modeller for sykdomsutvikling samt være til hjelp for å identifisere tidlige markører for potensielt alvorlige sykdommer. På bakgrunn av dette kan helsevesenet i fremtiden tilby skreddersydde behandlinger tidlig i et sykdomsforløp, noe som vil reduserer de økonomiske og menneskelige kostnadene som er resultat av ikke-optimale behandlingsløp. En forutsetning for å kunne bygge solide modeller er adgang til systematiserte datasett over kliniske data. Vår visjon er å gjøre biologiske komponenter fra kliniske prøver tilgjengelig for datadreven helseforskning. Målet med TROMBOLOME er å bygge et komplett digitalt arkiv over metabolomet i kliniske prøver. Vi ønsker å utforske hvordan mest mulig data fra biologiske prøver kan først analyseres og deretter digitaliseres og til slutt brukes i maskinlæringsbasert helseforskning. En blodprøve inneholder store biokjemiske datamengder som reflekterer organismens tilstand. Fra immunsystemets signalstoffer til nedbrytningsstoffer av hva vi spiste til frokost. I tillegg til celler, proteiner og fettstoffer består blodet av tusenvis av små organiske molekyler som i sin helhet kalles metabolomet. Metabolomet er utfordrende å analysere i sin helhet pga. kjemisk mangfold og store forskjeller i konsentrasjon. I prosjektet har vi utviklet en praktisk arbeidsgang til å bygge opp lokale stoffbibliotek. Til formålet har vi brukt pipetteringsrobot og blanding av analytter basert på kjemisk informasjon om referansematerialet. Denne arbeidsgangen er anvendt i to forskjellige laboratorier med i alt seks analysemetoder. Lokale stoffbibliotek er nødvendig for å øke sporbarheten og dermed tiltroen til hvilke metabolitter som måles i prøver. Analytiske metoder til metabolomanalyser av serumprøver er også utviklet og validert. Datasettene vi har innsamlet brukes til graf-basert maskinlæring for å understøtte identifikasjon av analytter som ikke allerede har blitt testet med referansemateriale. Analytisk rådata må arkiveres på en enkel og tilgjengelig måte som muliggjør sammenligning av tusenvis av prøver og som i tillegg er skalerbar. Dette vil gi full kontroll over databehandling og resultater. TROMBOLOME settes opp som en SQL-database i skyen, og koden til å overføre data fra instrumentfiler til SQL-databasen har blitt utviklet og vil bli publisert via GitHub. Ifølge planen skulle prøveanalyse være påbegynt ved dette tidspunktet i prosjektet. Biomarkørkomiteen for Tromsøstudien anbefalte tidligere i år at vår studie skulle få tilgang til biologiske prøver for analyse basert på en modifisert analyseplan: Dette inkluderer et panel av target-metabolomikkanalyser i tillegg til den originale studiedesignen som kun hadde untargeted-metabolomikkanalyse. Det har vært utfordrende å overbevise befolkningsundersøkelsens prøveansvarlige instans om fordelene med metabolomikkundersøkelser. Det mangler generelt standardisering og harmonisering i untargeted metabolomikk, og det vitenskapelige miljøet ofrer ikke mye oppmerksomhet til reproduserbarhet. Vår modifiserte analyseplan med paret target- og untarget- metabolomikkanalyser vil bringe viktig ny innsikt til feltet og etablere metoders egnethet for formålet på en objektiv måte. Slike resultat er avgjørende for å verifisere at metabolomikkresultat kan reproduseres med forskjellige metoder. De ekstra target-analysene er derimot veldig kostbare, og på grunn av dette vil vi analysere færre prøver (N=1000) i studien enn først planlagt (N=5000) – men med større dybde. TROMBOLOME-databasen vil bli brukt til å finne metabolske markører assosiert med risiko for hjerteinfarkt. Studien er nylig akseptert av den regionale etiske komité (REK-Nord). Studiedesignen vil være en kasus-kohort studie basert på analyser av serumprøver fra den syvende Tromsøundersøkelsen. Kasusgruppen består av deltakere som har hatt hjerteinfarkt etter prøveinnsamlingen til denne syvende Tromsøundersøkelsen, mens kontrollgruppen vil bli tilfeldig utvalgt fra de resterende deltakerne. Den siste godkjenningen som trengs, er fra data- og publikasjonsutvalget for Tromsøstudien før analysene kan igangsettes. All rekruttering for prosjektet er fullført. Det har vært en høy grad av internasjonal aktivitet for prosjektet, inkludert et seks måneders internasjonalt forskningsopphold (PhD student), presentasjoner på både nasjonale og internasjonale konferanser, en Erasmus+ utveksling, og deltakelse i ledelseskomité for et COST action program (AtheroNET). Den potensielle nytten av prosjektet vil bli: (i) å sette nye standarder for digitalisering og anvendelse av analytiske rådata, (ii) utvikling av en metode til strømlinjet annotering av komponenter i det digitale arkiv som kan lette analytiske arbeidsmetoder, og (iii) å høste et større potensiale fra Norges største befolkningsundersøkelse ved disse store og unike datasettene.

The vision is to integrate small organic molecule (the metabolome) analytical data with biobank big data. This will be achieved by building an annotated digital archive of biological samples from the Tromsø population study. We propose a radically new approach by facilitating bottom-up metabolomics with full metabolome component annotation. The project is initiated in the context of the UN sustainable development goal: ‘Ensure healthy lives and promote well-being for all at all ages’. We strongly believe that coupling the metabolome onto the vast digital archives of health and diseases status, genomics, and additional well-curated big data sets in the Tromsø study, can through focused efforts open up new scientific opportunities in data-driven research on diagnostic and lifestyle markers and lead to radical breakthroughs. The main novelties in the project include significant methodological advancements for a) rational storage and organization of metabolome big data, and b) development of a complete multi-parametric virtual analytical method to perform automated large-scale metabolome annotation and define the borders of investigated chemical space. This will require basic research on statistical machine learning combined with applied deep machine learning. The project will set new standards for accessibility of metabolome data to stakeholders and push the frontier for metabolomics in data-driven health research. This unique, well-organized, veracious, and readily retrievable digital archive will allow harnessing a bigger potential of Norway’s largest population study and increase its competitiveness. A work package is dedicated to dissemination to relevant stakeholders to establish familiarity with TROMBOLOME’s merits. The project group is international and cross-disciplinary with experts in machine learning, cheminformatics, and metabolomics with the complementary skills necessary to answer the research questions and realize the vision.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon