Store språkmodeller (LLM-er) – den samme teknologien som brukes i ChatGPT – åpner stadig nye muligheter. De kan svare på spørsmål, løse problemer og nå også bidra i medisinsk forskning. Helsedata, enten de kommer fra registre eller pasientjournaler, er mer enn bare tall og ord – de er fortellinger om livsløp, der hvert legebesøk, hver diagnose og hver resept har betydning, og der rekkefølgen av hendelser spiller en viktig rolle.
Prosjektet vårt startet med et enkelt spørsmål: Kan språkmodeller lære av hele sykdomshistorien til en pasient – og bruke denne kunnskapen til å forutsi hva som kan skje videre? Tradisjonell statistikk og maskinlæring er fortsatt gullstandarden, men de krever mye tilrettelegging og antagelser. Språkmodeller er derimot laget for å forstå sekvenser, noe som gjør dem særlig egnet til å analysere data som følger pasienter over tid.
Som første steg brukte vi MIMIC-IV, en åpen database fra intensivavdelinger i USA. Den inneholder informasjon om diagnoser, prøver, medisiner og utfall. Vi testet om språkmodeller kan bruke slike data til å forutsi kliniske hendelser – for eksempel risiko for død innen 90 dager. Resultatene viste både muligheter og begrensninger. MIMIC-IV er ufullstendig, har mye støy og lite informasjon per pasient. Den er derfor ikke ideell som testarena for de nyeste AI-modellene, men ga oss likevel verdifull læring: vi fikk innsikt i utfordringene med å bruke generativ AI på helsedata – og bekreftet at modellene faktisk kan gjenkjenne mønstre i sykdomsforløp.
Neste og mest spennende steg er å ta i bruk de unike norske helseregistrene. Norge har data fra millioner av innbyggere, med sykdomshistorier som strekker seg over flere tiår. Til forskjell fra MIMIC dekker de både sykehusopphold, fastlegebesøk, legemiddelbruk og dødsårsaker. Denne bredden gjør dem spesielt godt egnet til å studere komplekse sykdommer som demens, hvor tidlige tegn kan vise seg mange år før diagnosen.
Målet vårt er todelt. For det første vil vi undersøke om språkmodeller kan gi klinisk nyttige prediksjoner – for eksempel om en pasient har økt risiko for demens eller hjerte-karsykdom, og kanskje også i valg av legemiddelbehandling eller predikere birvirkninger. For det andre ønsker vi å se om de norske helseregistrene kan bli en ny global standard for hvordan AI kan brukes i helseforskning og legemiddelutvikling.
Hvis vi lykkes, kan dette gi bedre behandling for pasienter med kroniske og sammensatte sykdommer, bidra til utvikling av nye legemidler og styrke helsetjenesten.
Prosjektet gjennomføres av NordicRWE i samarbeid med Senter for fremragende forskning INTEGREAT ved Universitetet i Oslo. PhD-kandidaten som deltar, får en unik mulighet til å fordype seg i kunstig intelligens, statistikk og helsedata – og samtidig bidra til viktige fremskritt for pasientbehandling og folkehelsen.
This project aims to leverage large language models (LLMs) to enhance real-world evidence (RWE) research, focusing on drug repurposing, drug safety signal detection, and patient trajectory predictions. By creating embeddings of healthcare events, our models will predict outcomes like mortality, dementia onset, and drug side effects, aiming to surpass current biostatistical models. Using comprehensive registry data, the PhD candidate will develop and fine-tune LLMs to uncover new drug effectiveness and safety signals.
In the first project, we hypothesize that a trained LLM can discover patterns in medication use associated with dementia. Using data from nationwide registries, we will create a Drug Wide Association Study (DWAS) and compare LLM predictions with traditional methods. The goal is to identify potential drug repurposing candidates for dementia.
The second project focuses on drug safety surveillance. We will train LLMs to detect patterns in lipid-modifying drug use and their side effects. The study will include a DWAS and compare LLM predictions with established biostatistical methods, aiming to enhance drug safety signal detection.
In the third sub-project, we will use LLMs to predict disease trajectories in oncology. Using longitudinal data, we will compare LLM predictions based on narrative descriptions versus tabular data. The model’s performance will be benchmarked against traditional statistical methods to determine the best approach for predicting patient outcomes.
NordicRWE offers a dynamic environment with expertise in health data, epidemiological research and drug R&D. The PhD candidate will develop skills and contribute to innovative projects relevant to drug development and public health. Affiliated with the Norwegian Centre for Knowledge-Driven Machine Learning (INTEGREAT) at the University of Oslo, the candidate will join a community of experts in statistics, AI, and ML, supported by experienced supervisors from both institutions.