Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

Artificial Intelligence in Innovation of Investigative Interviews Speech-To-Text and Text Analysis Using Machine Learning

Alternativ tittel: Kunstig intelligens i innovasjon av avhør for tale-til-tekst og tekstanalyse ved bruk av maskinlæring.

Tildelt: kr 6,9 mill.

Det overordnede målet med AI4INTERVIEWS er å øke effektiviteten av avhør i politiet betydelig ved å designe, utvikle, utforske og bruke AI-løsninger for tale-til-tekst og tekstanalyse. Hvert år gjennomfører norsk politi tusenvis av avhør av ulike typer. Generelt blir disse transkribert manuelt helt eller delvis, eller det skrives et sammendrag av intervjuene. Dette er svært tidkrevende og ofte kjedelig arbeid for etterforskere og politiansatte. Antall avhør knyttet til kriminalitet som organisert kriminalitet, vold, barnemishandling og økonomisk kriminalitet forventes å øke kontinuerlig. Dessverre har Covid-19-pandemien til og med økt antallet seksuelle overgrep mot barn på internett. Videre er Europa verdens episenter som er vert for bilder av seksuelle overgrep mot barn. Samtidig blir pedofile mer avanserte, sofistikerte og sadistiske. For politiet er det derfor svært viktig å takle disse utfordringene og behovene med automatiseringsteknologi, som for eksempel maskinlæring. Maskinlæring (ML) har revolusjonert feltene tale-til-tekst og tekstanalyse. Selv om slik teknologi har eksistert en stund, har det først vært nylig at forskere har utviklet dyplæringsmodeller som er egnet for språkforståelsesoppgaver. Først nylig ble det de effektivt å kunne trene dem med enorme mengder data, og dermed produsere langt mer praktisk modeller enn det som har eksistert tidligere. ML for norsk har eksistert en stund allerede og fortsetter å utvikle seg i en utrolig fart i fremtiden. Videre forventes det at bruk av ML til å utføre tekstanalyse av avhørene har lovende og spennende muligheter til å støtte etterforskerne under etterforskningen. For eksempel kan ML brukes til å finne mønstre og kontekster knyttet til steder, navn, organisasjoner og hendelser.

Every year, the Norwegian police carry out thousands of investigative interviews of different types. Generally, these are either transcribed manually (dialog reports) in full or partially, or reports are written as a summary of the interviews. This is very time-consuming and tedious work for the investigators and police officers. Furthermore, the number of investigative interviews related to crimes like organised crime, violence, child abuse and economic crime, is expected to increase continuously. Machine learning (ML) has been revolutionizing the fields of speech-to-text (STT) and text analysis (TA). While such technology has existed for some time, it has only been recently that scientists have developed deep learning models appropriate for language understanding tasks, and it has only been recently that they could effectively train them with massive amounts of data, thus producing far more practical models than what has existed in the past. ML for Norwegian has existed for some time already and is continuing to develop at an incredible speed. Further, using ML to perform text analysis of the interview text files has promising and exciting opportunities to support an investigation of crime. For instance, ML can be used to find patterns and contexts related to places, names, organizations and events. The design of this project combines innovation and applied research, builds upon a “building-blocks”, experiences and expands the scope from an ongoing pre-study within applied research. The pre-study started in September 2020 as a cooperation between NTNU CCIS and Oslo Police District. We have so far learned that “speech-to-text” for Norwegian already exists in use in the market with inspiring results that have been found very promising by the Norwegian police. Thus, our research focuses on assessing the readiness of speech-to-text technology for police work, and also develops and assesses a user interface for such tools that the police would be ready to adopt.

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon