Tilbake til søkeresultatene

STIPINST-Stipendiatstillinger i instituttsektoren

Stipendiatstillinger til NIVA (2017-2021)

Tildelt: kr 3,3 mill.

Vurderingen av økosystemenes helse er av stor interesse for å få innsikt i virkningen av menneskelige aktiviteter. Helsen til et økosystem kan ses på som summen av påvirkningen på organismer som okkuperer dette økosystemet. Den største bekymringen er virkningen utslippskjemikalier har på disse organismene. Kjemikaliekonsentrasjonene i miljøet kan måles, men vi må sammenligne disse med referanse eller terskelkonsentrasjoner der ingen gifteffekt kan forventes. Disse terskelverdiene gjelder kjemiske konsentrasjoner og hvordan dette påvirker organismer. Normalt samles disse terskelverdiene gjennom laboratorieeksperimenter hvor organismer blir utsatt for økende konsentrasjoner av giftige kjemikalier. Disse eksperimentene har både etiske og økonomiske kostnader, og det vitenskapelige samfunnet jobber med å redusere bruken av disse dyreforsøkene. Det er utviklet metoder for å estimere toksisiteten på en organisme, disse kan deles inn i to kategorier, QSAR eller Read-Across til kjente data. QSAR eller Quantitative structure-activity relationship ser på egenskapene til hvert kjemikalie for å bestemme hva og hvordan det har en giftvirkning på en organisme. Read-Across på den annen side kan se på større grupper av kjemikalier eller arter og bestemme større nivålikheter og på denne måten bruke eksisterende data for en gruppe arter (eller kjemikalier) for å fylle ut hull i vår kunnskap. Denne avhandlingen undersøker en hybrid tilnærming av de to metodene beskrevet ovenfor ved å introdusere bakgrunnskunnskap i modelleringsmetodene. Denne bakgrunnskunnskapen har form av en kunnskapsgraf som er en samling av faktaopplysninger. Disse faktaopplysninger uttrykkes på en måte som er både maskinell og menneskelig lesbar. Denne kunnskapsgrafen inneholder faktaopplysninger om arter, kjemikalier og eksisterende laboratorieforsøk, samt store mengder metadata knyttet til disse. Kunnskapsgrafer er symbolsk kunnskap som ikke er ideell for bruk i modelleringsmetoder, for eksempel maskinlæring, hvor numeriske verdier er nødvendige. Derfor bruker vi metoder for innbygging av kunnskapsgrafer. Oppgaven til disse metodene er å gjøre ting (eg. et kjemikalie) i kunnskapsgrafen til numeriske representasjoner i form av en vektor. Disse metodene tar hensyn til kunnskapsgrafens struktur og prøver å bevare den så godt som mulig i den numeriske representasjonen. Nå som kunnskapsgrafen er representert numerisk, kan vi lære sammenhenger mellom representasjonene arter og kjemikalier og den toksiske effekten sistnevnte har på førstnevnte. Vi fant at ved å inkludere bakgrunnskunnskapen i denne modelleringsmetoden var vi i stand til å øke prediksjonsnøyaktigheten i forhold til en metode som bruker kjemisk og taksonomisk likhet. Disse modelleringsmetodene som brukes er naturlig vanskelige å forklare, det vil si at relasjonene som læres fra dataene kan være svært komplekse og det er umulig å utlede disse på en enkel måte. Derfor bruker vi kunnskapsgrafen på noen få måter for å øke forståelsen av hvordan modellen gjør prediksjoner. Vi ser på hvor mye data som er tilgjengelig i kunnskapsgrafen, og det viser seg at datamengden korrelerer med feilen i hver prediksjon. Vi bruker også kunnskapsgrafen til å gi faktaopplysninger som er relevante for prediksjonen. Disse faktaopplysningerene kan presenteres til en domeneekspert som kan trekke konklusjoner om kunnskapsområder som mangler og må utvides. Vi har vist, ved hjelp av maskinlæring og kunnskapsgrafer, at storskala, generiske modeller for toksisitet er mulig å utvikle. Dessuten er store områder av dette feltet fortsatt ukjente og ytterligere forskning er nødvendig for å øke robustheten og forklarbarheten til modellene.

-

Budsjettformål:

STIPINST-Stipendiatstillinger i instituttsektoren