Prosjektet vil arbeide med en rekke relaterte problemstillinger knyttet til
- leksikon for språkteknologiske anvendelser
- grammatikker velegnet for datamaskinell prosessering
- ordmening
- anvendelser av denne kunnskapen i et søkesystem
Sentralt i prosjektet vil stå en database som samler forskjellige leksikalske ressurser basert på ordbøker og ulike datalingvistiske prosjekter. Den vil kunne tjene som et forrådskammer for språkteknologiske anvendelser. Flere av delprosjektene vil utvide denne databasen med ny informasjon. Spesielt vil prosjektet arbeide med metoder for å utvide leksikonet fra kopora vha. statistikk og mønstergjenkjenning. Dernest vil prosjektet studere metoder for å formalisere ordsemantikk og muligheter for å represent ere dette i leksikon. Videre vil det spesielt arbeides med leksikon for to syntaktiske modeller, mye brukt i datalingvistikk, LFG og HPSG, som deler av utvikling av slike grammatikker for norsk. I neste omgang vil prosjektet studere hvordan et søkesystem for norsk kan forbedres gjennom det som er oppnådd og bygge en prototyp av et slikt system.
Funding scheme:
KUNSTI-Kunnskapsutviklling for norsk språkteknologi