Tilbake til søkeresultatene

KUNSTI-Kunnskapsutviklling for norsk språkteknologi

SVoG - Norsk storvokabular talegjenkjenner

Tildelt: kr 0,75 mill.

Prosjektet tar utgangspunkt i et eksisterende initiativ for å utvikle en første storvokabular talegjenkjenner (minst 20000 ord) for norsk språk og generelle anvendelser. Det pågående initiativet er et samarbeid mellom NTNU og SINTEF finansiert av Forsknin gsrådet gjennom VOCALS, som er et prosjekt i IKT2010-programmet. I VOCALS tas det sikte på å utvikle en foreløpig versjon av et slikt system med de begrensede ressursene som er tilgjengelige. I dette nye prosjektet vil vi videreutvikle gjenkjenneren fra V OCALS, dokumentere valgte metoder og "best practice" som er brukt under utviklingen, samt å gjøre dette tilgjengelig for det språkteknologiske miljøet i Norge. Det tas utgangspunkt i tale, tekst og leksikalske ressurser fra konkursboet til NST, som nå nyl ig er blitt gjort tilgjengelig. Utviklingen baseres på bruk av åpen kildekode, slik at systemet vil være et godt grunnlag for videre forskningsbaserte aktiviteter innen storvokabular talegjenkjenning på norsk. I dag finnes det ikke et slikt åpent system t ilgjengelig i Norge. Kommersielt finnes det heller ikke systemer for generell diktering på norsk, men kun for spesielle domener (sykehussektoren). Dessuten er kommersielle systemer lukket, dvs. ikke egnet som utgangspunkt for videre åpen forskning og utvi kling. Anvendelsesområdene for en slik gjenkjenner vil være mange, hvorav den mest assosierte anvendelsen er diktering. Også innen telekommunikasjon (selvbetjeningstjenester), dialogsystemer (som f.eks. KUNSTI-prosjektet BRAGE), søk i mediedatabaser og hj elpemidler for funksjonshemmede vil dette ha stor nytte. Et eksempel på sistnevnte er teksting av direktesendte TV-programmer for hørselshemmede. Selv innen begrensede domener hvor man ønsker at brukeren skal kunne benytte et naturlig språk, vil en storvo kabular gjenkjenner ha et stort potensial. Hovedutfordringene ligger i utviklingen av gode akustiske og statistiske språkmodeller for norsk, som kan gi en høy nok gjenkjenningsrate med akseptabel forsinkelse.

Budsjettformål:

KUNSTI-Kunnskapsutviklling for norsk språkteknologi

Temaer og emner

Ingen temaer knyttet til prosjektet