TREPIL vil utvikle prinsipper, metoder og redskaper som kan bidra til oppbygging av en norsk trebank. Motivasjonen er at en norsk trebank er ettertraktet som et empirisk grunnlag for språkmodellering. Prosjektet er basert på halvautomatisk korpusannotasjo n som bygger på integrasjon av ulike syntaktiske og semantiske strukturer fra automatisk parsing og tagging. Til dette formålet evalueres, gjenbrukes og tilpasses norske språkressurser, hovedsakelig Oslo-Bergen-taggeren, grammatikken fra det tidligere NFR -prosjektet NorGram (basert på LFG/XLE) og kompatible verktøy fra TIGER (Stuttgart). Forskningsarbeidet innebærer utvikling av prinsipper og spesifikasjon av et tagsett med hensyn til anvendelse; videre inngår informasjonsanalyse og databasedesign, evalue ring og tilpasning av programvare, testing og tilpasning av grammatikk og leksikon, og oppbygging og testing av en trebankprototyp. Prosjektet vil holde tett kontakt med Nordisk Trebanknettverk og relevante KUNSTI-prosjekter.