Tilbake til søkeresultatene

SAMRISK-2-Samfunnssikkerhet og risiko

Fakespeak - The language of fake news Fake news detection based on linguistic cues

Alternativ tittel: Fakespeak - språket i falske nyheter. Avsløring av falske nyheter på grunnlag av språklige kjennetegn

Tildelt: kr 11,7 mill.

Det meste av forskningen omkring avsløring av falske nyheter (definert som "nyheter" der opphavspersonen vet at "nyhetene" er usanne, og der formålet er å villede) gjøres av informatikere (computer scientists) alene. Språkvitenskapen har imidlertid vist at de språklige trekkene ved en tekst varierer avhengig av hva som er formålet med teksten. Således kan nettopp språket være nøkkelen til å avsløre falske nyheter. På denne bakgrunnen oppsto dette lingvistikkdrevne fireårige prosjektet, som involverer en kjernegruppe av språkvitere og informatikere basert i Norge og England. Språkviterne i prosjektet skal forsøke å avdekke de grammatiske og stilistiske trekkene ved språket i falske nyheter, som vi kaller Fakespeak, i russisk, norsk og engelsk. For å klare dette skal vi først bygge nye og gjøre bruk av eksisterende korpus over falske og genuine nyheter fra ulike nettbaserte medier på alle tre språkene. Deretter blir disse datasettene gjenstand for grundige lingvistiske analyser, der metoder og innsikter fra korpus- og datalingvistikk, anvendt lingvistikk (for eksempel rettslingvistikk) og pragmatikk og retorikk vil bli brukt. Informatikerne tar så utgangspunkt i eksisterende systemer for avsløring av falske nyheter, sammen med språkviternes funn, og forsøker å forbedre disse systemene ved å automatisere de språklige kjennetegnene ved falske nyheter. Det overordnede målet med prosjektet er å gjøre det mulig for systemene å oppdage og flagge potensielt skadelige falske nyheter raskere og mer presist og effektivt enn dagens systemer kan. Ved å automatisere alle - og bare - språklige trekk ved Fakespeak vil forskerne i prosjektet gjøre systemene i stand til å avsløre bare bevisst desinformasjon, og se bort fra misvisende informasjon (som kan være utilsiktet), satire, parodi og tekster som reflekterer en bestemt type meninger. Slik vil prosjektet ivareta både samfunnssikkerheten og ytringsfriheten.

This 4-year project involves a core team of linguists and computer scientists based in Norway and UK. The linguists will seek to reveal the grammatical and stylistic features of the language of fake news, referred to as Fakespeak, in Russian, Norwegian and English. To achieve this goal they will first build, and make use of existing, large corpora of fake and real news from various online media outlets in all three languages, and then subject the datasets to thorough linguistic analyses. They will apply methods and draw on insights from corpus linguistics, computational linguistics, applied linguistics, including forensic linguistics, as well as pragmatics and rhetoric. Taking the linguists´ findings as their point of departure, along with existing fake news detection systems such as those used by Faktisk.no, the computer scientists will seek to improve these systems by automating the defining features of Fakespeak. This will be done by applying and developing neural network models, algorithms, knowledge graphs or sar-graphs, sometimes in combination. The overall aim of the project is to enable fact-checking services to detect and flag potentially harmful fake news items in a more accurate, efficient and timely manner than offered by current state-of-the-art systems. By automating all and only the features of Fakespeak the project team will enable the systems to detect and flag only deliberate disinformation, excluding, for example, (inadvertent) misinformation, satirical texts and texts reflecting a certain set of opinions. Thus, the project will take societal safety and security into consideration while at the same time guarding the freedom of speech.

Aktivitet:

SAMRISK-2-Samfunnssikkerhet og risiko