Back to search

KUNSTI-Kunnskapsutviklling for norsk språkteknologi

TREPIL: trebankpilotprosjekt

Awarded: NOK 3.2 mill.

TREPIL vil utvikle prinsipper, metoder og redskaper som kan bidra til oppbygging av en norsk trebank. Motivasjonen er at en norsk trebank er ettertraktet som et empirisk grunnlag for språkmodellering. Prosjektet er basert på halvautomatisk korpusannotasjo n som bygger på integrasjon av ulike syntaktiske og semantiske strukturer fra automatisk parsing og tagging. Til dette formålet evalueres, gjenbrukes og tilpasses norske språkressurser, hovedsakelig Oslo-Bergen-taggeren, grammatikken fra det tidligere NFR -prosjektet NorGram (basert på LFG/XLE) og kompatible verktøy fra TIGER (Stuttgart). Forskningsarbeidet innebærer utvikling av prinsipper og spesifikasjon av et tagsett med hensyn til anvendelse; videre inngår informasjonsanalyse og databasedesign, evalue ring og tilpasning av programvare, testing og tilpasning av grammatikk og leksikon, og oppbygging og testing av en trebankprototyp. Prosjektet vil holde tett kontakt med Nordisk Trebanknettverk og relevante KUNSTI-prosjekter.

Publications from Cristin

No publications found

No publications found

No publications found

Funding scheme:

KUNSTI-Kunnskapsutviklling for norsk språkteknologi

Thematic Areas and Topics

No thematic area or topic related to the project