Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

Graph-based Neural Models for Dialogue Management

Alternativ tittel: Grafbaserte nevrale nettverk for dialogssytring

Tildelt: kr 8,0 mill.

Talespråk er en naturlig form for kommunikasjon mellom mennesker. Siden vi ble født har vi alle lært hvordan språk brukes til å kommunisere med hverandre, og mye av hverdagen vår tilbringes i samtaler. Bruken av språk som kommunikasjonsmedium mellom mennesker og maskiner har gitt opphav til teknologier som virtuelle assistenter (som Siri, Cortana, Google Home eller Amazon Echo), stemmekontroll i bilen og snakkende roboter. Disse dataprogrammene er alle eksempler på (talebaserte) dialogsystemer. Inne i disse systemene er det en modul kalt dialogstyreren (dialogue manager) som er ansvarlig for å ta beslutninger om hva systemet skal si eller gjøre på et gitt tidspunkt (for eksempel å svare brukeren eller utføre en bevegelse). For å ta disse beslutningene, registrerer dialogstyreren hva systemet vet om samtalen i en datastruktur kalt "dialogtilstanden". Dialogstyrere er ofte utviklet med hjelp av maskinlæringsmetoder (for eksempel dype nevrale nettverk) og trent på samtaledata. Nåværende modeller har imidlertid flere begrensninger. Den første er at de begrenser dialogtilstanden til et fast, forhåndsdefinert sett tilstandvariabler, noe som gjør det vanskelig å representere sammensatte kontekster som utvikler seg over tid. For det andre er disse modellene avhengige av store datamengder for å lære nyttig atferd. Dette er problematisk for applikasjoner der data er knappe og dyre å samle inn. GraphDial undersøker en alternativ tilnærming til dialogstyring basert på grafer som kjernerepresentasjon for dialogtilstanden. Grafer er godt egnet til å registrere komplekse interaksjoner som inkluderer flere enheter (for eksempel steder, personer, objekter, oppgaver eller ytringer) og forholdene dem i mellom. Videre jobber også GraphDial med bruk av svakt tilsyn (weak supervision) for dialogstyring. Svakt tilsyn er et gryende paradigme innen AI og har som formål å gi maskinlæringsmodeller indirekte treningsdata hentet fra regelsett eller domenekunnskap. Disse grafbaserte modellene er testet i praksis ved å utvikle en "resepsjonist-robot" som kan besvare ulike hendelser, slik som f.eks. når en ansatte er tilgjengelig eller hvor et møte finner sted. Prosjektet har så langt ført til et nytt datasett (GraphWOZ), samt en ny tilnærming til innhentingsbasert responsgenerering som tar utgangspunktet i en kunnskapsgraf som representerer den nåværende dialogtilstanden, og som oppdateres jevnlig med nye observasjoner.

The GraphDial project sets out to advance the state-of-the-art in dialogue management. Current approaches to dialogue management often make use of neural models trained on dialogue data using supervised or reinforcement learning. These approaches have led to enhanced performance across a broad range of tasks, but also have two important shortcomings: (1) They rely on quite restrictive representations of the dialogue state (often based on fixed numbers of slots to fill); (2) They are dependent on large amounts of training data to learn the model parameters. The project will investigate an alternative approach to dialogue management based on the use of probabilistic graphs as core representation for the dialogue state. Graphs are well suited to capture rich interaction contexts including multiple entities and relations. They also facilitate the use of relational abstractions covering large portions of the state space in a compact and human-readable manner. Another central topic for the project is the use of weak supervision to train neural models for dialogue state tracking and action selection. Weak supervision allows machine learning models to be trained with indirect data extracted from noisy labelling functions or domain knowledge. The use of weak supervision is particularly attractive for dialogue management due to the difficulty of obtaining annotated data in most dialogue domains. The project intends to integrate a range of weak supervision signals, including user responses to grounding or clarification acts, heuristic rules and global constraints on the graph structure. To achieve these objectives, GraphDial will feature collaborations with leading researchers in the field of spoken dialogue systems, statistical relational learning, graph neural networks and human-robot interaction. The project will also be in contact with two Norwegian companies involved in the development of conversational technology to facilitate the dissemination of project results.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon