Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

ClinCode - Computer-Assisted Clinical ICD-10 Coding for improving efficiency and quality in healthcare

Alternativ tittel: ClinCode - Datamaskinstøttet klinisk ICD-10-koding for å forbedre effektiviteten og kvaliteten i helsetjenesten

Tildelt: kr 12,0 mill.

ICD-10 diagnosekoder spiller en viktig rolle både på norske og svenske sykehus så vel som over hele verden. Etter hver pasientkontakt skal behandleren registrere en eller flere diagnoser eller prosedyrekoder i epikrisen som beskriver hva slags utredning eller behandling pasienten har fått. ICD-10 kodesystemet omfatter over 30.000 koder og kan være både vanskelig og tidkrevende å bruke. ICD-10 kodesystemet omfatter over 30.000 koder og kan være både vanskelig og tidkrevende å bruke. Ofte vil klinikere registrere feil koder, eller ikke få med alle passende koder. Kodene som registreres samles og brukes på overordnet nivå til å måle aktivitet på sykehusene. Feilaktig og mangelfull koding gjør det vanskelig å fakturere korrekt og planlegge for effektiv ressursutnyttelse i helsetjenesten. I ClinCode prosjektet skal vi undersøke hvordan datamaskinassistert kodestøtte (Computer-Assisted Coding, CAC) kan øke kvaliteten på ICD-10 koding uten at klinikeres arbeidsbelastning blir større. I sykehusenes elektroniske pasientjournaler finnes allerede et omfattende materiale av manuelt kodede pasientforløp. I vårt prosjekt skal vi studere den medisinske spesialiteten gastrokirurgi. Pasientjournalene har blitt brukt til å trene opp et dataprogram kalt Easy-ICD-verktøy som kan lese den enkelte pasients epikrise og automatisk foreslå passende ICD-10-koder til ansvarlig lege eller diagnosekoder. Dataprogrammet analyserer både fritekstnotater og strukturerte data som allerede er manuelt kodet med ICD-10-koder, ved hjelp av naturlig språkbehandling og maskinlæring som er en del av kunstig intelligens. Maskinlæringsmetoden er nevral dyp læring som BERT (Bidirectional Encoder Representations from Transformers) og lærer av disse manuelt ICD-10 diagnose annoterte epikriser. Siden vi tidlig i prosjektet hadde tilgang til et avidentifisert og pseudonymisert elektronisk pasientjournaldatasett på svensk, den såkalte Stockholm EPR PHI Gastro ICD-10 Pseudo Corpus II som inneholder 113 174 gastropasienter med 317 971 epikriser og deres manuelt tildelte ICD -10 diagnosekoder (såkalte K-koder), kunne vi utvikle den første versjonen av Easy-ICD-verktøyet, som også ble integrert i DIPS Arenas elektroniske pasientjournalsystem ved Universitetssykehuset Nord-Norge, Tromsø, UNN. Når det gjelder Norwegian fikk vi sent i prosjekttiden tilgang til et norsk gastrosett med 31 000 gastropasientjournal fra UNN, som vi avidentifiserte og pseudonymiserte automatisk som en del av prosjektet og deretter brukt til prediksjon av gastro ICD-10 K-koder i norske epikriser med gode resultater. Easy-ICD-verktøyet for svensk ble også evaluert i en brukerstudie med 16 leger og kodere, både svenske og norske med svært lovende resultater, slik at kodingen med verktøyet blir mye raskere og mer korrekt spesielt for lengre epikriser. Til slutt har vi også konstruert den første avidentifiserte og pseudonymiserte norske kliniske BERT-modellen, NorDeClin-BERT som gir gode resultater innen klinisk tekstutvinning og som vi håper å dele med andre norske sykehus og til forskere over hele verden etter at vi har fått tillatelse fra Regionale komiteer. for medisinsk og helsefaglig forskningsetikk, REK, Nord.

Vi har skapat ett avidentifierat och pseudonymiserat norskt dataset ClinCode Gastro Corpus med 31 000 patienter som omfattar 8.8 million anteckningar från åren 2017-2022. Vidare har vi skapat den första norska kliniska språkmodeller NorDeClin-BERT som vi ämnar dela med andra forskare och norska sjukhus så fort vi fått tillstånd från REK. Vidare har vi skapat en webbaserad prototyp Easy-ICD for svenska epikriser som vi har utvärderat med kodare med goda resultat. Planen är att implementera den för norska gastroepikriser med en norsk språkmodell som också gett goda resultat.

This project will develop a Computer-Assisted Coding (CAC) tool for ICD-10 coding for Norwegian electronic health records and specifically for the discharge letter. There are over 20 000 ICD-10 diagnosis codes for Norwegian divided into 22 chapters. The codes are hierarchical in 3 levels and each code has a textual description. One or several of these ICD-10 codes are assigned to the patient's discharge summary by the physician both for medical and for administrative purposes. The process of assigning codes is difficult and time consuming and it is also shown that up to 41 percent of the manually assigned main diagnosis maybe wrong or sometimes missing. The CAC tool will learn from previously manually coded discharges summaries, patient notes both free text and structured information such as laboratory results, blood values, etc and assign ICD-codes to unseen discharge summaries. The CAC tool will use Artificial Intelligence methods such as Natural Language Processing and Deep Learning techniques to learn and predict codes. Ranked ICD-10 code suggestions will be presented to the physician such that he or she can can select among them and assign the correct code. This will enable fast and high quality semi automatic ICD-10 coding. The CAC tool can also be used for assessing coding quality on historical data for hospital management and health authorities. The CAC tool will reduce coders workload and improve overall code quality. High-quality codes enable efficient data reuse, promoting fast knowledge generation in healthcare, thereby laying foundations for personalized medicine, more efficient health management, and, subsequently, higher quality of care. The project builds on the clinical text mining research activities started in the incubator project, NorKlinTekst (HNF1395-18), funded by Helse Nord in 2017.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon