Kontekstualisering av industrielle data

Alternative title: Contextualization of Industrial Data

Awarded: NOK 1.7 mill.

Those who work in the industry today are often forced to look into many computer systems to get the information they need. Imagine you are checking out a pump you think there's something wrong with. You have to go into one system to see sensor values, and documentation can found in another system. To see how the pump is connected to other equipment you must look at process diagrams in a third. A fourth system can show maintenance logs for the pump, while a fifth system contain SSE logs concerning the pump. Not surprisingly are 3D models also in a separate sixth system. And so it continues. An industry worker might how to deal with dozens of computer systems on a daily basis to his/her job. Traditionally, most data has been locked into different systems that doesn't talk to each other and run separate locations. This is changing, and more and more data find the way to modern cloud solutions where data from many sources are collected. This opens up for big opportunities in simplifying existing workflows, and not the least open up for working in completely new ways. But when data is coming in from from many source systems it's hard to figure out how different data are related. The source systems has usually few or no common references. So there's no easy way for a computer to understand which sensor measurements in one system belong to which equipment in another. Or where in the 3D model a component described in an SSE report is located. In this project we call the task of establishing such information links between data contextualization. The project will study contextualisation of industrial data using real data from the industry. The goal is to extract value from data originating from separate source systems. The project will center around different view into the industrial reality which reflect typical questions a software developer or data scientist would need answered.


Mye av dataene i industrien er innelåst i proprietære systemer som ikke snakker sammen og som kjører på ulike steder. Dette er under forandring – data finner i økende grad veien til sky-miljøer. Men for å få denne informasjonen forståelig for datamaskiner må det utvikles ny teknologi. Når data kommer inn fra mange kildesystemer er det vanskelig å kartlegge hvordan ulike data henger sammen og lage en informasjonsmodell som kan brukes av moderne algoritmer for å gi innsikt. I dette prosjektet kaller vi denne prosessen som etablerer informasjonskoblinger mellom data for kontekstualisering. Hensikten med denne kontekstualiseringen er å skape semantisk interoperabilitet mellom systemer og datakilder. Det betyr at en applikasjon skal automatisk kunne forstå dataene fra andre applikasjoner utelukkende fra beskrivelsene av selve dataene. Ofte bruker en et standardisert semantisk markup-språk som RDF (Resource Description Language) til å definere dataenes tolkning, slik at en kan dra nytte av andres definisjoner og dele egne med for eksempel industripartnere. I dette prosjektet vil vi studere kontekstualisering av industrielle data med utgangspunkt i en samling virkelige use cases. Målet er å hente ut verdi fra data som kommer fra ulike kilder. Prosjektet sentreres rundt ulike synsvinkler inn i den industrielle virkeligheten som reflekterer typiske spørsmål en programutvikler eller data scientist trenger svar på. Det overordnede målet er å utvikle ny teknologi som muliggjør semantisk interoperabilitet mellom ulike applikasjoner og ulike datakilder for valgte anvendelsesområdene.

