IME - AZ EGÉSZSÉGÜGYI VEZETŐK SZAKLAPJA

Tudományos folyóirat

   +36-30/459-9353       ime@nullimeonline.hu

   +36-30/459-9353

   ime@nullimeonline.hu

Az ePáciens rendezett, összetett fogalomtár (ontológia) adatszerkezetének készítése és feltöltése mintatartalommal

  • Cikk címe: Az ePáciens rendezett, összetett fogalomtár (ontológia) adatszerkezetének készítése és feltöltése mintatartalommal
  • Szerzők: eEgészség Programiroda
  • Intézmények: ESZCSM
  • Évfolyam: III. évfolyam
  • Lapszám: 2004. / 9
  • Hónap: december
  • Oldal: 41-44
  • Terjedelem: 4
  • Rovat: INFOKOMMUNIKÁCIÓ
  • Alrovat: eHEALTH, eEGÉSZSÉG

Absztrakt:

Az eEgészség Program, – amely az egészségügyi ágazat komplex információs fejlesztési programja – keretében kerül sor a fogalomtárak (ontológiák) közös adatmodelljének kidolgozására, valamint az eAdat, eBeavatkozások, eEszközök, ePáciens fogalomtárak adatszerkezetének elkészítésére, illetve feltöltésére mintaadatokkal. A jelen összeállításban – az előző számokban szereplő hasonló témájú publikáció folytatásaként – Héja Gergely az ePaciens fogalomtár szerkezeti kialakításával és ennek mintaadatokkal való feltöltésével foglalkozik, melynek keretében a fogalmak áttekintése az Európai Unió-ban elfogadott (elő)szabványokkal összhangban történik. A tevékenység alapvető célja az egyértelmű és egységes használat elősegítése. Az egységesség lényegesen hozzájárul ahhoz, hogy az egészségügyi informatikai alkalmazások megbízhatóbbá váljanak, illetve kisebb költséggel legyenek összekapcsolhatók és működtethetők.

INFOKOMMUNKÁCIÓ eEGÉSZSÉGÜGY Az ePáciens rendezett, összetett fogalomtár (ontológia) adatszerkezetének készítése és feltöltése mintatartalommal Az eEgészség Program, – amely az egészségügyi ágazat komplex információs fejlesztési programja – keretében kerül sor a fogalomtárak (ontológiák) közös adatmodelljének kidolgozására, valamint az eAdat, eBeavatkozások, eEszközök, ePáciens fogalomtárak adatszerkezetének elkészítésére, illetve feltöltésére mintaadatokkal. A jelen összeállításban – az előző számokban szereplő hasonló témájú publikáció folytatásaként – Héja Gergely az ePaciens fogalomtár szerkezeti kialakításával és ennek mintaadatokkal való feltöltésével foglalkozik, melynek keretében a fogalmak áttekintése az Európai Unió-ban elfogadott (elő)szabványokkal összhangban történik. A tevékenység alapvető célja az egyértelmű és egységes használat elősegítése. Az egységesség lényegesen hozzájárul ahhoz, hogy az egészségügyi informatikai alkalmazások megbízhatóbbá váljanak, illetve kisebb költséggel legyenek összekapcsolhatók és működtethetők. BEVEZETÉS Általános értelemben az „ontológia” fogalmát röviden úgy definiálhatjuk, hogy egy meghatározott tudásterület leírásához kifejezéseket és összefüggéseket határoz meg. Tehát az ontológia célja egy meghatározott értelmezési tartományon (esetünkben az egészségügy valamely területén – beavatkozás, páciens, orvosi eszközök stb.) alkalmazott fogalmak, és a közöttük lévő összefüggések leképezése számítógépek és emberek által értelmezhető formában. A fogalomtárakkal szemben alapelvként fogalmazódott meg, hogy közös, egységes elveken alapuló megoldással és eszközzel kell mind a négy témakör fogalomtárát kidolgozni. Ezt segítendő az eEgészség Szabványok tartalmára vonatkozó „Fogalomtárak közös adatmodellje” című, külön projekt foglalkozott a fogalomtárak közös adatmodelljének meghatározásával, és a fogalomtárak adatait kezelő eszköznek a kijelölésével. A közös adatmodell projektben az előzőekben említett négy témakör (eAdat, eBeavatkozás, eEszköz, ePáciens) fogalomtárainak ábrázolására egy közös adatszerkezet kialakítása, és az ilyen fogalomtárak kezelésére alkalmas meghatározott eszköz felderítése volt a cél. A projekt eredményei alapján az eEgészség Programirodával történt egyeztetések során a közös adatmodell leírására, a projekt ideje alatt szabvánnyá vált, OWL leírónyelvet, míg az ada- tok kezelésére, a mintatartalom feldolgozására a Protege szoftver eszközt jelölték meg. ePÁCIENS ONTOLÓGIA KÉSZÍTÉS, MINT A PROJEKT FELADATA Az informatikai fejlesztési lehetőségek bővülésével egyre nagyobb jelentőséget kapott az egészségügyben keletkező információk elektronikus áramlása, az adatok elektronikus továbbítása, feldolgozása. Ez alapvetően az egészségügyi szolgáltatók egymás közötti, és a szolgáltatók valamint a szakmai felügyeletet ellátó és a finanszírozó intézmények közötti adatáramlást jelenti, amik többnyire rendszeres, kötelező, jogszabályban előírt adatszolgáltatások. Az ilyen elektronikus bizonylatok, jelentendő rekordképek szabványosítására kidolgozandó javaslat a jelen program egyik feladata. Az ezekben megjelenő információk összegyűjtésének, feldolgozásának alapfeltétele az adatok egyértelmű jelentése, értelmezése, amit megfelelő kódrendszerekkel és a mögöttük meghúzódó fogalmak pontos leírásával, értelmezésével érhetünk el. Ezt szolgálják az egészségügyi információkra vonatkozó ismerethalmazt lefedő fogalomtárak. Fentiek alapján az „összetett, rendezett fogalomtár (ontológia) adatszerkezet készítése” feladat, mind a négy témakörben, és így az ePáciens projektben is, az alábbiak elvégzését jelenti: • Az adott témakörhöz tartozó tudásterületek meghatározását, amelyek ontológiái képezik a feladat tárgyát. • Az adott ontológiára vonatkozó osztályhierarchiák, fogalmi összerendelő kategóriák meghatározása, felépítése. • Az adott tudásterületre már létező, kiindulásként felhasználható fogalomtárak felderítése, begyűjtése, elemzése. • Az adott ontológiára felépített szerkezet és tartalom OWL konvenciók szerinti leírása. • A kiválasztott minta (vagy minták) OWL leírása, és feldolgozása a Protege szoftverrel, igazolva a meghatározott adatszerkezet, és a leíró szabályok alkalmasságát, használhatóságát. A fogalomtár kialakításánál a közös szerkezetben előírt szabályok szerinti megfelelésen túl azt kell szem előtt tartani, hogy a fogalomtárnak milyen igényeket kell kielégítenie, azaz milyen kérdésekre kell választ adnia. Ez szabja meg, hogy milyen kategorizálásoknak van értelme, milyen szintű hierarchia kiépítése szükséges, és milyen kapcsolatok, összerendelések, hivatkozások ábrázolását kell megoldani. IME III. ÉVFOLYAM 9. SZÁM 2004. DECEMBER 41 INFOKOMMUNKÁCIÓ eEGÉSZSÉGÜGY AZ ePÁCIENS FOGALOMTÁR CÉLJA Az egészségügyi adatok nagyrészt diagnózisokra, betegségekre, beavatkozásokra, ellátásra vonatkoznak, azaz személyhez, pácienshez kötöttek. Az adatok keletkezésekor, azok felvételekor a páciens személyére vonatkozó adatokat is rögzítenek, amiknek körét, felhasználhatóságát jogszabályok rögzítik. Az ePáciens témakörét a projekt feladatának meghatározása szerint éppen ezek a páciens személyére (tehát nem állapotára, betegségére, kezelésére) vonatkozó adatok alkotják. Esetünkben tehát személyekre vonatkozó adatokról, attribútumokról van szó, melyek beszerezhetőségéről, nyilvántarthatóságáról és kezeléséről a személyes adatok védelméről (1992. évi LXIII törvény), és az egészségügyi és a hozzájuk kapcsolódó személyes adatok védelméről (1997. évi XLVII törvény) szóló törvények rendelkeznek. Az egészségügyről és az egészségügyi szolgáltatásról, ellátásról szóló jogszabályok pedig meghatározzák az orvosok, kórházak és egyéb intézmények nyilvántartási és jelentési kötelezettségeit, amik előírják az adattartalmat is. Ezen jogszabályok figyelembe vételével vizsgálhatók az ePáciens témakörbe tartozó adatkörök, és csak a nyilvántartási és jelentési kötelezettségek közé tartozó, és a személyiségi jogokat figyelembe véve, bekérhető és tárolható adatokat érdemes elemezni. Fogalomtár szempontjából azok az attribútumok jöhetnek szóba, amelyekhez megadható értékek jól meghatározhatók, leírhatók, és véges számú elemmel rendelkeznek. Az ilyen adatkörre a megadható értékek, mint fogalmak általában jól meghatározottak. Gondot mindig az adatok felvételekor a megadandó érték egyértelmű, mindenki számára, és így az informatikai feldolgozások számára is egyértelmű beazonosítása jelenti. Ezt oldja meg, hogy az adott adatkörhöz egy úgynevezett értéklistát kötünk, és az attribútum megadásakor csak ebből választhatjuk ki valamelyiket. Az értéklista elemei pedig egyértelműen vannak hozzárendelve a fogalmakhoz, másként fogalmazva a fogalmak egyértelmű azonosítókkal rendelkeznek, és ezek képezik az értéklistát. Az ilyen értéklistás adatkörök elemeit a számítógépes feldolgozásokhoz kódokkal látják el, és az elektronikus adatlapokon, rekordképekben a kódokat kell alkalmazni, ami az értékek egyértelmű azonosítását biztosítja. Tehát az ePácienst alkotó adatkörök mindegyike lényegében egy kódtár. A fogalomtár kiépítésénél azonban minket az értéklisták elemei mint fogalmak érdekelnek, tehát azok leírása, kategorizálása és főbb jellemzőik meghatározása. Így a kódot is mint az adott fogalom egy meghatározó tulajdonságát kezeljük, ezért nem foglalkozunk a kód felépítésével, és esetleges információ tartalmával. A fentiek alapján egyáltalán szóba jöhető adatköröket tovább elemezve kapjuk meg az egészségügyi informatikai fejlesztések szempontjából lényeges ePáciens fogalomtárat alkotó kódtárakat. Az adatkörök közül a nem, családi állapot, biztosítási jogcím, állampolgárság, a lakcím, tartózkodási hely adaton 42 IME III. ÉVFOLYAM 9. SZÁM 2004. DECEMBER belüli ország esetében egyértelműen definiálhatók az adatkör fogalmai, és meghatározható az elfogadott pontos értéklista. Mindegyikük a nevével pontosan meghatározott, néhány elemből álló értéklista, melyek további osztályozása a projekt során megfogalmazott célok érdekében szükségtelen. Így mindegyik egy szintű felsorolásból áll, és külön leíró, magyarázó szöveg nem kapcsolódik a fogalmakhoz. A helységneveknél már gond van az értéklista meghatározásával. Először el kell döntenünk, hogy mire várunk választ ettől az adatkörtől. Valószínűsíthető, hogy korlátoznunk kell az értéklistát a magyar helységekre, mert csak ekkor tudjuk érdemben felhasználni az információt, és a külföldi születési helyeknél és lakcímeknél elégséges a „külföldi” információ. (Nyilván az adott feldolgozásokban, rekordképekben meg kell engednünk a nem magyarországi születésűekre, illetve a nem magyar lakcíműekre tetszőleges érték létezését.) Ha elfogadjuk, hogy csak a magyar helységek kerüljenek a kódtárba, akkor további kérdés, hogy szükséges-e valamilyen szempontú kategorizálása. Mi esetünkben az országokhoz hasonlóan csak a neveket tartalmazó egy szintű kódtárnak tekintettük. A foglalkozások nagyon sokféleképpen definiálhatók, és főként sokféle szempont szerint kategorizálhatók. A magyarországi előírások szerint a jelentési kötelezettségekben a KSH által kiadott FEOR kódrendszert kell használni. Eltérően kategorizált és más hierarchiába épített a SNOMED foglalkozások kódtára. (Mintaként mind a két kódtár kialakításával foglalkoztunk.) Az előbbieket összevetve tehát a program jelen fázisában az alábbi kódrendszerek képezik az ePáciens fogalomtár főbb osztályait: • Foglalkozások FEOR alapján • Foglalkozások SNOMED alapján • Országkódtár • Biztosítási jogcímek (Térítési kategóriák osztálynév alatt) • Családi állapot • Nem ePÁCIENS FOGALOMTÁR A KÖZÖS ADATSZERKEZETBEN A négy témakör fogalomtárait tehát egységes, közös alapelvek szerint, de jelen fázisban önállóan, elkülönítetten kellett felépíteni. A Protege-ben felépített adatszerkezetben így a „Thing” gyökérosztályhoz most közvetlenül kapcsolódó alosztályt képez az „ePatient” nevű osztály, amit tehát a meghatározott kódtárak összessége. Mindegyik kódtár az „ePatient” osztály egy-egy alosztálya. Itt kapcsolatokat csak a kódtárakon belüli esetleges hierarchia jelent. A különböző kódtárak között nincsenek hivatkozások, öszszerendelések, így esetünkben az „AssociatedCategory” (Összerendelő kategóriák) osztály üres. Tehát a mintaállományként feltöltött kódtárakkal az 1. sz. ábrán lévő adatszerkezetet mutatja: INFOKOMMUNKÁCIÓ eEGÉSZSÉGÜGY 1. ábra Az ePáciens osztály kódtárai között nincs összerendelés Az ePáciens témakörben – az alapértelmezett tulajdonságokon kívül – további data típusú tulajdonságokat vezettünk be, melyek az alábbiak (2. ábra): • FeorKod – A KSH által kiadott FEOR kategóriák azonosító kódjai • SnomedKod – A SNOMED foglalkozások kategóriáinak kódjai • CountryKod – Az országok kódtárban alkalmazott két betűből álló azonosító • TeritesiKategoriaKod – A 43/1999-es Korm. rendeletben előírt jelentési kötelezettségekben alkalmazandó térítési kategória megjelölésére használandó kód • DengerKod – a páciens nemét jelölő fogalom kódja 2. ábra Az ePáciens „data” típusú tulajdonságai Azt, hogy az ePáciens fogalomtár mindenben megfeleljen a közös adatszerkezetre vonatkozó előírásoknak (névkonvenciók, tulajdonságok stb.), az OWL állományok létrehozásakor az előírt szabályok betartásával biztosítottuk. és igényeit vettük alapul. Ezek alapján a foglalkozás kódtárral szemben támasztott egyeztetett és rögzített igények: • A fogalmakat magyarázó szöveges leírás kezelésére jelenleg nincs szükség. • A foglakozások nagy száma miatt, az áttekinthetőséget, keresést, felhasználást segíti a már amúgy is meglévő kategorizálás megtartása, és az alapján az osztályhierarchia felépítése. • Az előírások alapján az adatfelvételeknél a KSH által kiadott FEOR kódrendszert kell alkalmazni, tehát ennek fogalmait és osztályozását kell alapul venni, és csak a KSH közleményben szereplő magyar megnevezéseket kell használni. • Összerendeléseket, hivatkozásokat más fogalomtárakkal nem kell kezelni. A FEOR kódrendszer négy osztályozási szintet alkalmaz: • Főcsoport – egy jegyű kódszám • Csoport – két jegyű kódszám • Alcsoport – három jegyű kódszám • Foglalkozás – négy jegyű kódszám A követelményeket kielégítő OWL leírás, ami a tételsorokat pontosan meghatározza: FEOR kódszám a fogalom (osztály) magyar megnevezése 1.0 Az osztályok azonosító neveinél itt a magyar nevekből kellett kiindulni, így az adatszerkezetnél a nevekre előírt szabályokat betartva a magyar név ékezet nélkül vett leírását alkalmaztuk. Több szóból álló névnél a szavakat szorosan egymás mellé írva, és minden szót nagy betűvel kezdve alakult ki az osztály megnevezése, mint az alábbi példák mutatják: Speciális oktató, nevelő: SpecialisOktatoNevelo Szakképzett pedagógus: SzakkepzettPedagogus Gyógypedagógus: Gyogypedagogus Példaként vegyük a „2441”-es kódú „Gyógypedagógus” foglalkozás OWL leírását, amelyik a „244”-es kódú és „Speciális oktató, nevelő” megnevezésű alcsoport tagja. KÓDTÁR ÉPÍTÉSÉNEK FOLYAMATA A kódtárak építésének módját az osztályhierarchiába szervezett „foglalkozások” kódtárral mutatjuk be. A foglalkozások fogalomtár célját meghatározó kérdések felvetésekor és elemzésekor esetünkben csak az egészségügyben meghatározott elektronikus bizonylatokban, és adatszolgáltatási kötelezettségekben lévő rovatok felhasználási lehetőségeit 2441 Gyógypedagógus 1.0 IME III. ÉVFOLYAM 9. SZÁM 2004. DECEMBER 43 INFOKOMMUNKÁCIÓ eEGÉSZSÉGÜGY A tétel sorok leírását kiegészítettük az XML konvenciók szerint, az alkalmazott névterek leírásával. Az előállított OWL állományt a Protege „Build New Project” funkciójával feldolgozva létrejön a „Thing” gyökér alatt a „FoglalkozasFeor” osztály a FEOR foglakozásokra felépített osztályhierarchiával (3. ábra). 4. ábra Az ePáciensbeli FeorKod és a Gyogypedagogus összerendelése KARBANTARTÁS, TOVÁBBFEJLESZTÉS 3. ábra Az ePáciens FoglalkozásFeor osztályhierarchiája A kibontott osztályhierarchiában a korábban példaként említett „Gyógypedagógus” foglalkozást látjuk. A tétel kiválasztásakor az alábbi 4. ábrán látható jellemzők jelennek meg. Az önmagában letesztelt, és jónak talált állományt aztán az ePáciens közös fogalomtár alá helyeztük. Az ePáciens fogalomtár karbantartása és továbbfejlesztése szempontjából elsősorban azt kell megvizsgálni, hogy az egészségügy területén milyen személyekhez köthető információk azok, amelyek jelenleg és a jövőben fogalmi rendszerek, kódrendszerek tekintetében felmerülhetnek. Meglátásunk szerint a jelen anyagban elemzett körülményeket, törvényi előírásokat nézve személyhez köthető ilyen információk az itt tárgyaltakon kívül nem igen lesznek szükségesek. Viszont az egészségügyi adatszolgáltatások, elektronikus bizonylatok (eKórlap, eRecept stb.) sok olyan rovatot tartalmaznak, melyeknél lényeges az egyértelmű, pontos fogalmi meghatározás, illetve a meghatározott értéklista alkalmazás. Ebből adódóan véleményünk szerint a továbbfejlesztés egyik hasznos iránya az egészségügyben alkalmazható további kódtárak feltérképezése, és leképezése a jelen anyagban leírtak szerint. A közelebbi jövő szükséges lépése mindenképpen a mintatartalommal feltöltött kódtárakból, az új szabványok, előírások alapján szükségesek teljes körű, pontos kiegészítése. Feladat lehet még az esetlegesen a későbbiekben felmerülő további szükséges információk felvétele újabb tulajdonságok bevezetésével. eEgészség Programiroda REFERENCIA LISTA a) „Közös Adatszerkezet kialakítása az eAdat, eBeavatkozás, eEszköz, ePáciens Fogalomtárak – Ontológiákrészére – eEgészség program keretében” című dokumentum b) Törvények: 1992. évi LXIII. tv. A személyes adatok védelméről és a közérdekű adatok nyilvánosságáról 1997. évi CLIV. tv. Az egészségügyről 1997. évi XLVII. tv. Az egészségügyi és a hozzájuk kapcsolódó személyes adatok kezeléséről és védelméről 43/1999 Kormányrendelet az egészségügyi szolgáltatások Egészségbiztosítási Alapból történő finanszírozásának részletes szabályairól 44 IME III. ÉVFOLYAM 9. SZÁM 2004. DECEMBER c) KSH közlemény a Foglalkozások Egységes Osztályozási Rendszeréről d) GYÓGYINFOK honlapon elérhető kódtárak e) Owl alapinformációval kapcsolatos források http://www.w3.org/2001/sw/WebOnt/ http://www.w3.org/TR/2004/REC-owl-features20040210/ http://www.w3.org/TR/owl-guide/ http://www.w3.org/TR/owl-ref/ http://www.w3.org/TR/2003/NOTE-owl-xmlsyntax20030611/ f) Protege-vel kapcsolatos információk http://protege.stanford.edu/