Det overordnede målet med AI4INTERVIEWS er å øke effektiviteten av avhør i politiet betydelig ved å designe, utvikle, utforske og bruke AI-løsninger for tale-til-tekst og tekstanalyse.
Hvert år gjennomfører norsk politi tusenvis av avhør av ulike typer. Generelt blir disse transkribert manuelt helt eller delvis, eller det skrives et sammendrag av intervjuene. Dette er svært tidkrevende og ofte kjedelig arbeid for etterforskere og politiansatte. Antall avhør knyttet til kriminalitet som organisert kriminalitet, vold, barnemishandling og økonomisk kriminalitet forventes å øke kontinuerlig. Dessverre bidro Covid-19-pandemien til betydelig økt antallet seksuelle overgrep mot barn på internett. Videre er Europa verdens episenter som er vert for bilder av seksuelle overgrep mot barn. Samtidig blir pedofile mer avanserte, sofistikerte og sadistiske.
Maskinlæring (ML) har revolusjonert feltene tale-til-tekst og tekstanalyse. Selv om slik teknologi har eksistert en stund, har det først vært nylig at forskere har utviklet dyplæringsmodeller som er egnet for språkforståelsesoppgaver. ML for norsk har eksistert en stund allerede og fortsetter å utvikle seg i en utrolig fart i fremtiden. I 2023 tok ChatGPT og store språkmodeller verden med storm. ML og store språkmodeller vil meget trolig fortsetter å utvikle seg i en utrolig fart. Dette gir svært politiet svært spennende og lovende og muligheter til å støtte etterforskerne med analyser og oppsummeringer av store datamengder.
Every year, the Norwegian police carry out thousands of investigative interviews of different types. Generally, these are either transcribed manually (dialog reports) in full or partially, or reports are written as a summary of the interviews. This is very time-consuming and tedious work for the investigators and police officers. Furthermore, the number of investigative interviews related to crimes like organised crime, violence, child abuse and economic crime, is expected to increase continuously.
Machine learning (ML) has been revolutionizing the fields of speech-to-text (STT) and text analysis (TA). While such technology has existed for some time, it has only been recently that scientists have developed deep learning models appropriate for language understanding tasks, and it has only been recently that they could effectively train them with massive amounts of data, thus producing far more practical models than what has existed in the past. ML for Norwegian has existed for some time already and is continuing to develop at an incredible speed. Further, using ML to perform text analysis of the interview text files has promising and exciting opportunities to support an investigation of crime. For instance, ML can be used to find patterns and contexts related to places, names, organizations and events.
The design of this project combines innovation and applied research, builds upon a “building-blocks”, experiences and expands the scope from an ongoing pre-study within applied research. The pre-study started in September 2020 as a cooperation between NTNU CCIS and Oslo Police District. We have so far learned that “speech-to-text” for Norwegian already exists in use in the market with inspiring results that have been found very promising by the Norwegian police. Thus, our research focuses on assessing the readiness of speech-to-text technology for police work, and also develops and assesses a user interface for such tools that the police would be ready to adopt.