Tilbake til søkeresultatene

STIPINST-Stipendiatstillinger i instituttsektoren

Stipendiatstilling 4 NINA (2021-2023)

Tildelt: kr 4,2 mill.

Maskinlæring og dyplæring er metoder som i økende grad blir brukt i økologisk forskning med suksess. I dette PhD-prosjektet jobber vi med utvikling av metoder relatert til bildebehandling, GIS og fjernmåling, akustikk og lydlandskap og miljø-DNA (eDNA). Bildebasert gjenkjenning har stort potensiale for å automatisere og forbedre prosedyrer i innsamling av biologiske og økologiske datasett. Innledende studier er utført for å identifisere planter samt individer av ørret og salamandere fra bilder. Dette arbeidet er bare et første steg i retning av å utvikle et presist og automatisk system. Vi arbeider for å videreutvikle disse metodene. Overvåking av det akustiske miljøet, eller lydbildet, er raskt i ferd med å bli et sentralt verktøy i økosystemforvaltning av arter. Automatiserte akustiske undersøkelsesmetoder er nødvendige for å kunne klare å oppfylle nye krav om å studere effekter av globale endring på biologisk mangfold. Lav-kostnad akustiske loggere er nå tilgjengelige, noe som baner vei for slike tilnærminger. Likevel mangler vi gode analysemetoder. I PhD prosjektets første år har vi først og fremst jobbet med maskinlæring for å analysere lydlandskap. Arter endrer i økende grad artssammensetning og migrasjonstidspunktene på grunn av klimaendringer. En effektiv økologisk forvaltning og bevaring er avhengig av å identifisere nåværende fordelinger og forutsi endringer. Overvåking av arter og økosystemer er ofte tidskrevende og innebefatter mye feltarbeid. Miljølydlandskap er i økende grad et alternativt overvåkingsverktøy som kan være kostnadssparende. Å kombinere lydlandskap med etablerte abiotiske art-miljø relasjoner kan skape et mer komplett økologisk fingeravtrykk for modellering av biologisk mangfoldstrender. Vi har studert og sammenlignet vi den prediktive styrken til lydlandskap, lokalt vær og nasjonale værdata i USA over en fireårsperiode i Sapsucker Words i Ithaca, New York. Tilstedeværelsesdata for fuglearter ble hentet fra sjekklister for artsundersøkelser fra eBird Basic Dataset fra januar 2016 til august 2020 (eBird 2022), begrenset til en radius på 200 meter fra mikrofongruppen ved siden av Cornell Lab of Ornithology. Bare komplette sjekklister for undersøkelser ble inkludert, noe som gjorde det mulig å lage et artsfraværsdatasett. For å unngå dupliserte sjekklister ble overflødige oppføringer for delte gruppesjekklister droppet. For å forhindre tidsmessig skjevhet i modellen, ble det totale antallet sjekklister for hvert år begrenset til det laveste årlige antallet over studieperioden 2016-2019. For de andre årene ble sjekklister trukket ut tilfeldig. Lyddatasettet består av mer enn fire år med kontinuerlige lyddata fra januar 2016-august 2020, tatt opp på en Gras-41AC presisjonsmikrofonmikrofon utenfor Cornell Lab of Ornithology (breddegrad: 42.47955, lengdegrad: -76.45132), digitalisert med en Barix Instreamer ADC ved 48 kHz, og lagret i tapsfrie .flac-filer i intervaller på 15 minutter. Alle lyddata ble konvertert til VGGish innebyggingsfunksjoner på Saga HPC Cluster på SIGMA2 (superdatamaskinen til NTNU). VGGish er en tensorflow-modell trent for klassifisering av lyd på et stort datasett med youtube-videoer (Tensorflow Github). Den konverterer 0,96 segmenter med lyddata til 128-dimensjonale flytefunksjonsvektorer som er optimert for lydklassifisering. Lydklassifiseringsmodeller som bruker lydfunksjoner, presterer sammenlignbare eller bedre enn CNN-modeller som er trent direkte på lydspektrogrammer og har tidligere blitt brukt i økoakustikkfeltet. Disse vektorene ble beregnet i gjennomsnitt på den daglige skalaen, så vel som fra 03:30 til 07:30 for hver dag. Dette tidsvinduet ble valgt basert på en analyse av seks vanlige skogfuglearter, som fant at morgenkor har en tendens til å begynne 20 minutter før nautisk skumring til 100 minutter etterpå (Bruni et al 2014). Nautisk skumring varierer fra omtrent 04:00 til 06:30 i Ithaca, New York (Almanac 2022). Vi fant sterke sammenhenger mellom lydbildet og biologisk mangfold i området. Ved hjelp av maskinlæringsmodeller og funksjonsviktighetsanalyser identifiserte vi tidsmessige mønstre i prediksjonskraften til lydlandskap og ulike værfunksjoner. Vi fant at lydbildet, dog med noen dagers etterslep, var den viktigste parameteren for å forklare artenes sammensetning i vårens hekkemåneder. I gjennomsnitt for alle arter hadde dog værdata høyere nøyaktighet enn lyd for å forutsi tilstedeværelse for arter. Imidlertid var lydfunksjonene mer nøyaktige enn værfunksjoner med predikere arters tilstedeværelse fram i tid. Ved å bruke teknikker for valg av funksjoner for å kombinere alle vær- og lydfunksjoner best mulig, forbedret vi prediktiv kraft ytterligere. Vi jobber videre med å demonstrere merverdien av økoakustikk også ved øke innsamling av data. I forbindelse med dette er vi i ferd med å samle lyd fra mange forskjellige steder og økosystemer i Norge gjennom prosjektet «Sound of Norway».

Budsjettformål:

STIPINST-Stipendiatstillinger i instituttsektoren