Tilbake til søkeresultatene

FRINATEK-Fri prosj.st. mat.,naturv.,tek

ERC-Hjort Focus Driven Statistical Inference With Complex Data

Tildelt: kr 12,4 mill.

Prosjektnummer:

235116

Søknadstype:

Prosjektperiode:

2014 - 2019

Geografi:

FocuStat-prosjektet har vart fra jan 2014 til des 2018. Det har sysselsatt PhD-ene Céline Cunen (fra aug 2014 til disputas des 2018) og Sam-Erik Walker (fra okt 2014 til mars 2018; han leverer avhandling i 2019), samt PostDoc-ene Gudmund Hermansen (fra okt 2014 til mars 2017) og Kristoffer Hellton (fra mai 2015 til des 2018). Disse har alle vært av stor betydning for prosjektets høye kvalitet, brede horisonter, og gjennomføring. I tillegg har vi hatt andre PhD-er, veiledet eller medveiledet av Hjort, i nær nok tilknytning til prosjektet til at de har deltatt i de regulære møter, holdt foredrag ved våre workshops og forskningskjøkken, osv.: Marting Jullum (disputert april 2016; Vinnie Ko, leverer avhandling juni 2019, et år før tiden; Emil Stoltenberg, leverer sept 2019, Jonas Moss og Martin Tveten, leverer 2020). Videre har vi hatt halvtårs besøkende studenter fra Italia (en master, en PhD). Endelig har flere av våre kolleger, nasjonalt og internasjonalt, havnet i nært samarbeid med oss, for visse arbeider. Prosjektet har på disse vis hatt et betydelig større volum og nedslagsfelt enn "bare" å sysselsette de direkte støttede 2 PhD pluss 2 PostDoc. Våre temaer har vært metodiske, i ulike spesifiserte retninger, men med en klar anvendt profil. For noen av våre arbeider har problemstillinger fra anvendte fagfelt vært direkte inspirator for metodeutvikling. En kort beskrivelse av våre metodiske temata er som følger. 1. Konfidensfordelinger, som gir verktøy for å etablere aposteriorifordelinger for viktige parametre uten Bayesianske apriorifordelinger (Cunen, Hjort, Hermansen, og med Tore Schweder, økonomisk institutt). 2. Fokusert modellbygging og modellvalg, delvis via FIC, det fokuserte informasjonskriterium (Cunen, Hellton, Hermansen, Hjort, Ko, Walker, og med Lars Walløe). 3. Kombinasjon av informasjon fra sterkt ulike kilder (Cunen, Hjort). 4. Robustifisering av visse klassiske metoder, innen estimering og modellvalg (Hjort, Walker). 5. Knekkpunkter, eller regime-skift (Cunen, Hermansen, Hjort, Tveten, med Håvard Nygård, Prio). Dette handler om å være i stand til å nå presise utsagn om at visse forandringer har funnet sted, og at disse endringer, i visse situasjoner, har skyldtes endringspunkt, f.eks. et årstall. Metodikken har som mål å identifisere slike regime-skift, samt gi graden av endringen. 6. Personifisert statistikk, f.eks. for biomedisinske anvendelser (Hellton, Hjort). 7. Bayesiansk ikkeparametri, med nye anvendelser (Hermansen, Hjort, Stoltenberg). Våre anvendelser har favnet vidt. Noen av disse har involvert hvaler (Cunen, Hjort, med Walløe); kriger og konflikter (Cunen, Hermansen, Hjort, Walker, med Nygård, samt masterstudent J.K. Haug); levetidsanalyser i komplekse sammenhenger (Cunen, Hjort, Stoltenberg); litterær analyse (Cunen, Hjort); makroøkonomi (Hjort, med Schwedder); det fallende ozon-nivået i Europa (Hjort, Walker). Vi har hatt en aktiv blogg, med omtrent 25 Statistical Stories, og denne skal holdes i aktiv hevd også etter jan 2019. Mange av våre historier har nådd langt ut, med tusenvis av lesere (Steven Pinkers tweet om Hjorts "sophisticated analysis of battle death distributions" ledet til tusen nye, i løpet av en uke). Denne oppmerksomheten har også ledet til ulike medieoppslag. Spesielt ofte har Cunen og Hjort vært i ulike intervjuer, i ulike kanaler. Cunen vant Titan-prisen 2018 for vitenskapskommunikasjon. Av stor viktighet for gruppen har vært tre tre-dagers internasjonale workshops, henholdsvis "Inference With Confidence" (mai 2015), "FICology", om fokusert modellering, modellvalg og modellvekting (mai 2016), "Building Bridges" (mai 2017), om broer mellom parametri og ikkeparametri. I mai 2018 holdt vi en større oppsummeringskonferanse, med 45 deltagere. Konferansene har holdt en høy internasjonal standard. Artikler fra en av disse ledet til et Special Issue av en sterk journal, med Hjort og Scwheder som gjesteredaktører. Vi har også organisert fem såkalte Research Kitchens, med internasjonale gjester; i sept 2014 om empirical likelihood, i okt 2015 om robust estimering via scoring-rules og minimum-divergens-estimatorer, i okt 2016 om robustifisering av likelihoods, for ulike formål, om From Processes to Models i nov 2017, og endelig om Combination of Information i nov 2018. Hvert år har vi pekt ut en konferanse der vi alle har bidratt, med foredrag og annen synlig deltagelse. I 2015 var vi på ISI i Rio, i 2016 på NordStat i København (der Cunen og Hellton vant best poster priser), i 2017 på norsk møte i Fredrikstad, og i 2018 på NordStat i Tartu. Vi har hatt "invited sessions" m.m. For en oversikt over publiserte artikler, de 138 foredrag og presentasjoner, priser, medie-anledninger, og blogginnlegg, ved medlemmer av FocuStat-gruppen, konsulter vår vevside, som vil fortsette å være i bruk også etter januar 2019. Vi tør også anbefale vår separat publiserte Summary Report (48 sider).

Her var jeg ikke klar over den strikte 1000-tegn-grensen, så min lange tekst på 4000 tegn får altså ikke plass. Her kommer derfor en meget amputert versjon. NFR kan få min fulle tekst om det er interesse for det. 1. Kompetanseheving, ikke bare for kjernegruppen, men for mange av de andre PhD- er og PostDoc-er ved statistikk UiO. 2. Privilegert og krevende samarbeid med eksperter innen havøkologi (Walløe) og krig-og-konfliktforskning (Nygård, Prio). Vi har vedvarende prosjekter med disse. 3. Et høyt antall publikasjoner, 138 foredrag og presentasjoner, mange populærvitenskapelige. Ved siden av mange Statistical Stories, publisert på vår blogg, og som har nådd tusener, har vi vært med på å sette fagstatistikk på kartet. 4. Hjort vil søke om videre prosjektstøtte, (a) om From Processes to Models, via FRIPRO, i april 2019; (b) om det tverrfaglige Stability and Change, med Nygård (PRIO).

Statistics is the science of reaching decisions under uncertainty and is in many respects a far-ranging success story, permeating nearly all substantive sciences and areas of society where data are collected. It has used around hundred years to reach its present state of high maturity and uniform usefulness. In broad strokes, the four main areas associated with (i)parametrics (models indexed by low-dimensional parameters); (ii) nonparametrics (models with high- or infinite-dimensional parameters); (iii) assessment and selection of models; and (iv) combination of different sources of information, drive most of modern statistics, and have, in essence, been well sorted out, conceptually and operationally. There are important gaps to be filled and new para digms and principles to develop, however, when faced with the statistical challenges of the 21st century. New types of data, related both to new types of substantive questions in a changing society and to evolving technologies for monitoring and examining more complicated phenomena than earlier, create a need for new types of statistical modelling for new types of analysis, and potentially also for new concepts of information and inference. Themes and challenges we shall work on here share the concept of the focus, the operational view that the science and context drive the most important questions which again should influence the optimal combinations of models, their analysis, and the ensuing decisions. Three such challenges are as follows. A: "breaking the wall" between areas (i) and (ii), partly leaning on recent advances inside area (iii). B: extending the current scope and catalogue of approaches and methods of relevance to area (iv). C: extending and developing new methodologies for areas (i) and (iii) for the by now frequently occurring situations where the number of measurements per individual exceeds the sample size.

Publikasjoner hentet fra Cristin

Budsjettformål:

FRINATEK-Fri prosj.st. mat.,naturv.,tek