Tilbake til søkeresultatene

FRINATEK-Fri prosj.st. mat.,naturv.,tek

Logical and categorical methods in data transformation

Alternativ tittel: Logiske og kategoriteoretiske metoder i datatransformasjon

Tildelt: kr 3,1 mill.

Et stadig økende problem i næringsliv og offentlig administrasjon er å finne og inhente data når disse finnes på ulike steder og lagret på forskjellige måter. Ontologibasert datatilgang er en ny tilnærming til dette problemet der hovedidéen er å koble flere ulike, og ofte store, databaser opp mot et enhetlig kunnskapsrepresentasjonssystem kalt en ''ontologi''. Standardmåten å representere databaser teoretisk - kjent som relasjonsmodellen - har visse svakheter med hensyn til de utfordringer som dette gir opphav til. For eksempel er den mindre egnet i dynamiske settinger. I dette tilfellet gjelder dette de problemene som oppstår når databasene som skal kobbles til ontologien ikke er fastlagte en gang for alle, men kan konstant endres eller skiftes ut. Lignende utfordringer gjelder også for representasjon av informasjon i form av ontologier. I tillegg oppstår det fort et såkalt skaleringsproblem, da det er notorisk komplisert og kostbart å vedlikeholde ontologier når de blir store. Det er derfor nødvendig å kombinere utviklingen av praktiske løsninger med teoretisk grunnlagsforskning på representasjon av data, databaser og ontologier. Prosjektet består derfor av to gjensidig avhengige deler, en ''teoretisk'' og en ''anvendt''. Anvendelsedelen skal utvikle praktiske løsninger for ontologibasert datatilgang. Den teoretiske delen skal forske på grunnlagsspørsmål i data- og kunnskapsrepresentasjon med hjelp av moderne matematiske hjelpemidler. Den teoretiske delen forsyner den anvendte med nye perspektiver og hjelpemidler, og mottar i sin tur tilbakemelding på disse fra konkrete anvendelser. Prosjektet samarbeider med eksisterende prosjekter og sentra ved Universitetet i Oslo m. fl. og aktører i næringslivet og offentlig administrasjon Prosjektet har publisert resultater hva gjelder forbedring av nåværende metoder for formidling av data fra databaser til ontologier med hensyn til problemer knyttet til unntaksbetingelser; utfordringer knyttet til manglende data i formidling mellom databaser; og en ny og alternativ formell modell for databaser. Projektets kanskje viktigste bidrag har vært utviklingen, i samarbeid med forskere ved Siriussenteret ved UiO, av en ny teori og metode for behandling av mønstre i ontologier. Å kunne identifisere og manipulere gjentagende mønstre på en uniform og systematisk måte er et viktig hjelpemiddel i ontologikonstruksjon og -behandling. Metoden har gjennomgått en vellykket test i industrien og blitt publisert i ledende internasjonale konferanser. Den utvikles videre ved Siriussenteret.

Et stadig økende problem i næringsliv og offentlig administrasjon er å finne og inhente data når disse finnes på ulike steder og lagret på forskjellige måter. Ontologibasert datatilgang er en ny tilnærming til dette problemet der hovedidéen er å koble flere ulike, og ofte store, databaser opp mot et enhetlig kunnskapsrepresentasjonssystem kalt en ''ontologi''. Prosjektet har bidratt til denne tilnærmingen med resultater knyttet til utfordringene med å kunne håntere store og dynamiske datamengder både på database- og ontologisiden, og for koblingene mellom de to sidene. Størst potensiell virkning for brukeraktører i næringslivet har kanskje den teori for gjentagende mønstre i ontologier som prosjektet har bidratt til å utvikle. Denne har blitt møtt med stor interesse blant brukere, og videreutvikles i et forskningsprosjekt ved Universitetet i Oslo.

In this project, we aim to develop completely new and groundbreaking techniques, perspectives, and ideas for the field of database representation, outside the current paradigm---the relational model---and in order to address the deficiencies of that model , especially in the area of data transformation (in a wide sense of the term, including transforming to or from ontologies). Basic theoretical machinery and strategies are in place for this part, and some results have already been obtained, but results us eful for end users (the database community) cannot be guaranteed. That, rather, is what we propose to investigate, hence the ``high risk''. The ``high gain'' would lie in a radical new perspective and resulting completely new techniques for the manipulati on of databases, especially in the area of comparing and transforming data structured under different schemas, and potentially in other areas such as the representation of partial records and missing data (nulls). The project's second part will begin in the other end, with the current research frontier in data transformation, particularly in the new field of ontology-based data access. While the first part will start with developing a new, abstract framework for representing data with an aim to benefit c urrent developments in the field, the second part will start with an analysis of the current challenges and methods of the field, then develop a framework for addressing them. In a manner of speaking, while the first part has techniques and ideas, and wan ts to explore what results can be obtained from them, the second knows what results it wants to obtain, and is looking for techniques to obtain them. The two parts will then continuously interact and feed off each other.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

FRINATEK-Fri prosj.st. mat.,naturv.,tek