Tilbake til søkeresultatene

FRINATEK-Fri prosj.st. mat.,naturv.,tek

Penalised Complexity-priors: A new tool to define default priors and robustify Bayesian models

Alternativ tittel: Apriori-fordelinger basert på straffet kompleksitet: Et nytt verktøy for å definere apriori fordelinger og robustifiser Bayesianske modeller

Tildelt: kr 7,6 mill.

Bayesiansk statistikk handler om å lage en presis beskrivelse av den eksisterende kjennskapen om et fenomen basert på ekspertkunnskap og tidligere utførte studier, og deretter oppdatere denne kjennskapen basert på observerte data. Dette leder til robuste metoder som gir en presis beskrivelse av usikkerheten som kommer både fra modellen og modellparameterene. Den eksisterende kunnskapen beskrives gjennom en sannsynlighetsfordeling som kalles en a priori sannsynlighetsfordeling. I praksis er det vanskelig å konstruere sannsynlighetsfordelinger som beskriver all kunnskap om et fenomen, og a priori sannsynlighetsfordelingene konstrueres typisk separat for hver modellparameter. I dette prosjektet konstruerer vi intuitive simultane sannsynlighetsfordelinger for modellparameterene som respekterer modellstrukturen og muliggjør en mer presis beskrivelse av eksisterende kunnskap. I additive modeller dekomponerer vi den totale variansen hierarkisk langs en trestruktur til de individuelle modellkomponentene. Dette gir en intuitiv og simultan a priori sannsynlighetsfordeling for variansparameterene og en utvetydig grafisk beskrivelse som oppfordrer til økt åpenhet i det vitenskapelige samfunnet. Vi har funnet ut at denne nye måten å definere a priori sannsynlighetsfordelinger på er nyttig i mange vitenskapelige områder. Et eksempel er genomisk modellering. Her kan vi bruke eksisterende kunnskap om den relative størrelsen av forskjellige kilder til variasjonen i fenotyper på en intuitiv måte, som er enkel til å formidle til anvendte forskere og som føre til robust inferens. Vi tilbyr en ny R-pakke, "makemyprior", som har integrert et intuitivt grafisk brukergrensesnitt for å lette konstruksjon og vurdering av forskjellige valg av priors gjennom visualisering av treet og joint prior. Etter å ha fullført spesifikasjonen av a priori sannsynlighetsfordelingen, kan inferensen utføres direkte med de populære R-pakkene INLA (www.r-inla.org) og rstan (www.mc-stan.org), eller forhåndsberegnede a priori sannsynlighetsfordelingene kan brukes i andre programvare for Bayesiansk analyse. Pakken har målet til å utvide verktøykassen til anvendte forskere og gjøre a priori sannsynlighetsfordelingener til en aktiv komponent i den Bayesianske "workflow".

Providing a well-motivated, transparent and intuitive framework for formulating priors is relevant for researchers in applied statistics and sciences. We developed a general framework for constructing joint priors for variance parameters in a Bayesian hierarchical model. Prior knowledge, obtained from previous experiments or comparable investigations, and expert knowledge can be intuitively included to make the model more robust while the model structure is acknowledged. Up til now, there has been lack of software that intuitively allows the proper inclusion of such knowledge and simple visualisation of chosen priors, and with our new framework implemented in the R-package "makemyprior" we close this gap.

A long lasting problem within Bayesian statistics, is the choice of prior distributions. Although various approaches have been suggested to approach this issue, the current practice among applied statisticians is not good. In this project we will develop a recent proof of concept idea of Penalised Complexity (PC) priors, which is a principled approach to construct priors. This approach constructs priors that are invariant to reparameterisations, are designed to support Occam's razor and seem to have excellent robustness properties. We will develop this idea further and define default priors suitable for routine applied use. The priors and with them model robustness against possible model deviations can be controlled by the user in a transparent, consistent and intuitive way. Instead of considering each model component separately, the user needs only to provide an intuition about the linear predictor as a whole, which is then like a chain reaction transferred to the single model components. The framework will be integrated into the program-system R-INLA for doing Bayesian inference in latent Gaussian models.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

FRINATEK-Fri prosj.st. mat.,naturv.,tek