FRINATEK-Fri prosj.st. mat.,naturv.,tek

Et stadig økende problem i næringsliv og offentlig administrasjon er å finne og inhente data når disse finnes på ulike steder og lagret på forskjellige måter. Ontologibasert datatilgang er en ny tilnærming til dette problemet der hovedidéen er å koble flere ulike, og ofte store, databaser opp mot et enhetlig kunnskapsrepresentasjonssystem kalt en ''ontologi''. Standardmåten å representere databaser teoretisk - kjent som relasjonsmodellen - har visse svakheter med hensyn til de utfordringer som dette gir opphav til. For eksempel er den mindre egnet i dynamiske settinger. I dette tilfellet gjelder dette de problemene som oppstår når databasene som skal kobbles til ontologien ikke er fastlagte en gang for alle, men kan konstant endres eller skiftes ut. Lignende utfordringer gjelder også for representasjon av informasjon i form av ontologier. I tillegg oppstår det fort et såkalt skaleringsproblem, da det er notorisk komplisert og kostbart å vedlikeholde ontologier når de blir store. Det er derfor nødvendig å kombinere utviklingen av praktiske løsninger med teoretisk grunnlagsforskning på representasjon av data, databaser og ontologier. Prosjektet består derfor av to gjensidig avhengige deler, en ''teoretisk'' og en ''anvendt''. Anvendelsedelen skal utvikle praktiske løsninger for ontologibasert datatilgang. Den teoretiske delen skal forske på grunnlagsspørsmål i data- og kunnskapsrepresentasjon med hjelp av moderne matematiske hjelpemidler. Den teoretiske delen forsyner den anvendte med nye perspektiver og hjelpemidler, og mottar i sin tur tilbakemelding på disse fra konkrete anvendelser. Prosjektet samarbeider med eksisterende prosjekter og sentra ved Universitetet i Oslo m. fl. og aktører i næringslivet og offentlig administrasjon Prosjektet har publisert resultater hva gjelder forbedring av nåværende metoder for formidling av data fra databaser til ontologier med hensyn til problemer knyttet til unntaksbetingelser; utfordringer knyttet til manglende data i formidling mellom databaser; og en ny og alternativ formell modell for databaser. Projektets kanskje viktigste bidrag har vært utviklingen, i samarbeid med forskere ved Siriussenteret ved UiO, av en ny teori og metode for behandling av mønstre i ontologier. Å kunne identifisere og manipulere gjentagende mønstre på en uniform og systematisk måte er et viktig hjelpemiddel i ontologikonstruksjon og -behandling. Metoden har gjennomgått en vellykket test i industrien og blitt publisert i ledende internasjonale konferanser. Den utvikles videre ved Siriussenteret.

In this project, we aim to develop completely new and groundbreaking techniques, perspectives, and ideas for the field of database representation, outside the current paradigm---the relational model---and in order to address the deficiencies of that model , especially in the area of data transformation (in a wide sense of the term, including transforming to or from ontologies). Basic theoretical machinery and strategies are in place for this part, and some results have already been obtained, but results us eful for end users (the database community) cannot be guaranteed. That, rather, is what we propose to investigate, hence the ``high risk''. The ``high gain'' would lie in a radical new perspective and resulting completely new techniques for the manipulati on of databases, especially in the area of comparing and transforming data structured under different schemas, and potentially in other areas such as the representation of partial records and missing data (nulls). The project's second part will begin in the other end, with the current research frontier in data transformation, particularly in the new field of ontology-based data access. While the first part will start with developing a new, abstract framework for representing data with an aim to benefit c urrent developments in the field, the second part will start with an analysis of the current challenges and methods of the field, then develop a framework for addressing them. In a manner of speaking, while the first part has techniques and ideas, and wan ts to explore what results can be obtained from them, the second knows what results it wants to obtain, and is looking for techniques to obtain them. The two parts will then continuously interact and feed off each other.

Publikasjoner hentet fra Cristin

Budsjettformål:

FRINATEK-Fri prosj.st. mat.,naturv.,tek

3,1MRD. KRtotalt tildelt i programperioden 586PROSJEKTERhar fått tildeling i programperioden 3KILDERhar finansiert programmet

Finansieringskilder

Kunnskapsdepartement Energidepartementet Olje- og energidepar

FRINATEK-Fri prosj.st. mat.,naturv.,tek

Logical and categorical methods in data transformation

Alternativ tittel: Logiske og kategoriteoretiske metoder i datatransformasjon

Tildelt: kr 3,1 mill.

Populærvitenskapelig framstilling

Oppnådde effekter

Sammendrag

Publikasjoner hentet fra Cristin

On equivalence and cores for incomplete databases in open and closed worlds

Constructive Reflectivity Principles for Regular Theories

Mapping Data to Ontologies with Exceptions Using Answer Set Programming

Making a Case for Formal Relations over Ontology Patterns

Practical Ontology Pattern Instantiation, Discovery, and Maintenance with Reasonable Ontology Templates

Generating Ontologies from Templates: A Rule-Based Approach for Capturing Regularity

Practical Ontology Pattern Instantiation, Discovery, and Maintanence with Reasonable Ontology Templates - Demo paper

Towards Characterising Data Exchange Solutions in Open and Closed Words

Budsjettformål:

FRINATEK-Fri prosj.st. mat.,naturv.,tek

Finansieringskilder

Temaer og emner