Dette prosjektet bruker AI, spesielt store språkmodeller (LLM), for å fremme nye metoder for helseforskning innen tre ulike områder: nye bruksområder for eksisterende legemidler, avdekke bivirkningsmønster for legemidler og prediksjon av pasientutfall. Målet er å utvikle metoder ved hjelp av LLM-er som ikke bare forbedrer, men potensielt overgår tradisjonelle biostatistiske tilnærminger, og gir nye innsikter fra eksisterende helsedata.
Det første delprosjektet har som mål å identifisere om eksisterende medisiner kan bidra til å forebygge eller behandle demens. Ved å analysere nasjonale registerdata vil LLM-en utføre en kartlegging av alle legemidler for å avdekke mønstre i legemiddelbruk knyttet til demensutvikling. Målet er å oppdage nye legemiddelkandidater, på behandlinger som allerede er tilgjengelige, men hvor gunstige anti-demens effekter ikke er kjent.
I det andre delprosjektet vil LLM-en fokusere på lipidmodifiserende legemidler og bivirkningsmønster. Ved å analysere mønstre i legemiddelbruk, vil LLM-en oppdage signaler på det som kan være potensielle bivirkninger. Disse prediksjonene vil sammenlignes med tradisjonelle metoder, med potensiale til å etablere nye forskningsmetoder for legemiddelsikkerhetsovervåkning for å beskytte pasienter mot uønskede bivirkninger.
Det tredje delprosjektet fokuserer på å forutsi sykdomsforløp hos kreftpasienter. Ved å bruke detaljerte, virkelighetsnære helsedata med lange tidsserier, vil LLM-en analysere tekst og strukturerte data for å forutsi hvordan en pasients tilstand kan utvikle seg. Dette kan føre til mer personlige behandlingsopplegg og bedre helseutfall.
Forskningen utføres ved NordicRWE i samarbeid med Senter for fremragende forskning (SFF), INTEGREAT, ved Universitetet i Oslo. PhD-kandidaten vil arbeide i et innovativt miljø, utvikle ekspertise innen AI, statistikk og helsedata, og bidra til fremskritt innen folkehelse og legemiddelutvikling.
This project aims to leverage large language models (LLMs) to enhance real-world evidence (RWE) research, focusing on drug repurposing, drug safety signal detection, and patient trajectory predictions. By creating embeddings of healthcare events, our models will predict outcomes like mortality, dementia onset, and drug side effects, aiming to surpass current biostatistical models. Using comprehensive registry data, the PhD candidate will develop and fine-tune LLMs to uncover new drug effectiveness and safety signals.
In the first project, we hypothesize that a trained LLM can discover patterns in medication use associated with dementia. Using data from nationwide registries, we will create a Drug Wide Association Study (DWAS) and compare LLM predictions with traditional methods. The goal is to identify potential drug repurposing candidates for dementia.
The second project focuses on drug safety surveillance. We will train LLMs to detect patterns in lipid-modifying drug use and their side effects. The study will include a DWAS and compare LLM predictions with established biostatistical methods, aiming to enhance drug safety signal detection.
In the third sub-project, we will use LLMs to predict disease trajectories in oncology. Using longitudinal data, we will compare LLM predictions based on narrative descriptions versus tabular data. The model’s performance will be benchmarked against traditional statistical methods to determine the best approach for predicting patient outcomes.
NordicRWE offers a dynamic environment with expertise in health data, epidemiological research and drug R&D. The PhD candidate will develop skills and contribute to innovative projects relevant to drug development and public health. Affiliated with the Norwegian Centre for Knowledge-Driven Machine Learning (INTEGREAT) at the University of Oslo, the candidate will join a community of experts in statistics, AI, and ML, supported by experienced supervisors from both institutions.