Tilbake til søkeresultatene

KUNSTI-Kunnskapsutviklling for norsk språkteknologi

TREPIL: trebankpilotprosjekt

Tildelt: kr 3,2 mill.

TREPIL vil utvikle prinsipper, metoder og redskaper som kan bidra til oppbygging av en norsk trebank. Motivasjonen er at en norsk trebank er ettertraktet som et empirisk grunnlag for språkmodellering. Prosjektet er basert på halvautomatisk korpusannotasjo n som bygger på integrasjon av ulike syntaktiske og semantiske strukturer fra automatisk parsing og tagging. Til dette formålet evalueres, gjenbrukes og tilpasses norske språkressurser, hovedsakelig Oslo-Bergen-taggeren, grammatikken fra det tidligere NFR -prosjektet NorGram (basert på LFG/XLE) og kompatible verktøy fra TIGER (Stuttgart). Forskningsarbeidet innebærer utvikling av prinsipper og spesifikasjon av et tagsett med hensyn til anvendelse; videre inngår informasjonsanalyse og databasedesign, evalue ring og tilpasning av programvare, testing og tilpasning av grammatikk og leksikon, og oppbygging og testing av en trebankprototyp. Prosjektet vil holde tett kontakt med Nordisk Trebanknettverk og relevante KUNSTI-prosjekter.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

KUNSTI-Kunnskapsutviklling for norsk språkteknologi

Temaer og emner

Ingen temaer knyttet til prosjektet