Egészségügyi adatok biztonságos és etikus kezelése
chat dec. 8., h., 16:54open_in_new vik.bme.hu/hir/3566-egeszsegugyi-adatok-biztonsagos-es-etikus-kezelese
SAJTÓKÖZLEMÉNY
2025.december 8.
A SECURED projektben, melyben a Semmelweis Egyetem és a BME kutatói is részt vettek, azt vizsgálták 9 európai ország 18 intézményének tudósai, hogyan lehet az egészségügyi adatokat szintetikus adatokká átalakítani úgy, hogy azok kutatási alkalmazása biztonságos lehessen.
A szintetikus adatok olyan, számítógépes rendszerek által mesterségesen előállított adatok, amelyek hasonlítanak a valós adatokhoz, de nem tartalmaznak személyes információkat, például a páciens nevét vagy egyéb adatait. Ezek az akár képi, szöveges vagy videó alapú adatok lehetővé teszik az egészségügyi modellek fejlesztését és tesztelését anélkül, hogy a páciensek érzékeny adatai veszélybe kerülnének.
Végéhez közeledik az európai összefogással megvalósuló SECURED projekt, amely az elmúlt két évben az egészségügyi adatok védelmével és – a szintetikus adatok alkalmazásán keresztül – etikai aggályoktól mentes felhasználásával foglalkozott. A 9 európai ország 18 partnerét (https://secured-project.eu/consortium/) összefogó, az Európai Unió által finanszírozott projekt kutatói azt vizsgálták, miként lehet az egészségügyi adatokat úgy átalakítani, hogy azok kutatási alkalmazása biztonságos lehessen. Magyarországon a Budapesti Műszaki és Gazdaságtudományi Egyetem, valamint a Semmelweis Egyetem Egészségügyi Menedzserképző Központ szakértői vettek részt a nemzetközi együttműködésben.
A szintetikus adatok olyan, számítógépes rendszerek által mesterségesen előállított adatok, amelyek hasonlítanak a valós adatokhoz, de nem tartalmaznak személyes információkat, például a páciens nevét vagy egyéb adatait. Ezek az akár képi, szöveges vagy videó alapú adatok lehetővé teszik az egészségügyi modellek fejlesztését és tesztelését anélkül, hogy a páciensek érzékeny adatai veszélybe kerülnének. A SECURED (az angol Scaling Up Secure Processing, Anonymization and Generation of Health Data for EU Cross-Border Collaborative Research and Innovation rövidítése) projekt fő célja az volt, hogy az adatanonimizáció és a szintetikus adatok létrehozása révén segítse az egészségügyi szolgáltatások fejlesztését, a kutatási együttműködések biztonságos megvalósítását, és ezáltal hozzájáruljon a betegek jobb ellátásához az Európai Unióban.
Miközben a digitális eszközök – például az elektronikus kórlapok, képalkotó platformok és távgyógyászati rendszerek – átalakítják a betegellátást, új kockázatokat is teremtenek: adatvédelmi incidensek, magánélethez fűződő jogok sérülése és szigorodó megfelelési követelmények formájában. A SECURED projekt bemutatja, hogyan képes az egészségügy ezekre a kihívásokra adatvédelmet középpontba helyező megközelítésekkel válaszolni, amelyek révén az érzékeny egészségügyi adatok egyszerre maradnak védettek és hasznosíthatók.
Mint a projektben résztvevő Semmelweis Egyetem Egészségügyi Menedzserképző Központ munkatársa, Dr. Pollner Péter elmondta: „Az adatvezérelt egészségügy és a mesterséges intelligencia korában a szintetikus adatok kulcsszerepet játszanak abban, hogy a fejlesztések adatvédelmi kockázatok nélkül, mégis valósághű környezetben történhessenek meg, így hidat képeznek a klinikai alkalmazás és a kutatási innováció között.A szintetikus adatok lehetővé teszik, hogy az egészségügyi mesterséges intelligencia fejlesztése során valósághű, de adatvédelmi szempontból biztonságos környezetben végezhessünk kutatásokat, ezáltal felgyorsítva az algoritmusok tesztelését és a klinikai alkalmazhatóság felé vezető utat. Ez azonban nem jelenti azt, hogy érzékeny adatokból előálló szintetikus adatot bárki számára hozzáférhető lehetne tenni.”
Dr. Ács Gergely, a projektben szintén résztvevő Budapesti Műszaki és Gazdaságtudományi Egyetem Kriptográfia és Rendszerbiztonság Laboratóriumának kutatója hozzátette: „A biztonságos adatmegosztás nemcsak technológiai kérdés, hanem bizalomépítés is az egészségügyi szereplők között. A SECURED projektben azt kerestük, hogyan lehet ezt a bizalmat valós, működő megoldásokon keresztül megerősíteni. A bizalom megerősítése éppen ott kezdődik, ahol a leggyakoribb a félreértés: a szintetikus adatok önmagukban nem garantálnak teljes adatvédelmet. Amikor a szintetikus adatok szóba kerülnek, sokan azt gondolják: »Nem valósak, tehát már nem is érzékeny adatok.« Ez a feltételezés viszont nagyon veszélyes” – figyelmeztetett a kutató. „A kihívás lényege az, hogy a fejlesztések során két cél között kell egyensúlyoznunk, ami általában kompromisszumokkal jár: egyrészt az adat legyen pontos és hasznos (megtartva az eredeti statisztikai tulajdonságait), másrészt legyen anonim és GDPR-megfelelő (ne legyen köthető fizikai személyhez). Sajnos, a kettő kielegítése kompromisszumok nélkül nem lehetséges.”
Dr. Pejó Balázs, aki fiatal posztdoktori kutatóként vesz részt a projektben Dr. Ács Gergely kollégájaként, részletesebben elmagyarázata a probléma lényegét: a generatív modellek (amelyek a szintetikus adatokat előállítják) megőrzik az eredeti adatok bizonyos tulajdonságait, ami viszont érzékeny információkat tárhat fel.
„A szintetikus adatok valójában aggregált információk összességei. Ha ezeket az aggregált információkat össze tudjuk kombinálni, felfedhetünk egyedi titkokat. A legszemléletesebb példa a célzott modellezés: Képzeljünk el egy modellt, amit csak rákos betegeken tanítottunk. Ha egy kutató valahogyan rájön, hogy egy bizonyos egyén szerepelt a tanító adathalmazban (mondjuk mert néhány szintetikus adatban fellelhetők csak az egyénre jellemző egyedi vonások), akkor azt is megtudja, hogy az illető rákos. Ezt a kritikus információt a modell – akaratlanul, de – kiszolgáltatta.”
Dr. Ács Gergely hozzátette, hogy a veszély forrása maga a gépi tanulás működési elve:
„Általában a modell másként viselkedik azon az adaton, amit már látott (ezen optimalizálta magát), hiszen azon pontosabb a jóslása. Ezt a memóriát kihasználva, egyszerű statisztikai próbákkal el lehet dönteni, hogy melyik adaton javasol a modell szignifikánsan pontosabban, és így valószínűsíthető, hogy azt az egyedi adatot már »látta«. Ez a teszt jelzi az egyénekről történő adatszivárgást, rámutatva arra, hogy a szintetikus adatok önmagukban nem garantálják a titoktartást.”
A SECURED projekt során kidolgozott módszertan lehetővé teszi, hogy több szervezet – például különböző egészségügyi intézmények – biztonságosan megosszák egymással az elemzések eredményeit a zárt csatornáikon keresztül, anélkül, hogy a nyers, érzékeny adatok elhagynák rendszereiket. Ez az eljárás új lehetőségeket teremt az etikus egészségügyi kutatások és az orvostanhallgatók gyakorlati képzése számára egyaránt. Ehhez a projekt a megoldást nem a szintetikus adatban, hanem az azt körülvevő technológiában kereste. A biztonságos alkalmazáshoz tehát további technológiai védőhálókra van szükség, mint például a homomorf titkosítás.
A SECURED projekt eredményei és módszertana nyíltan elérhetővé válnak, hogy azokat az egészségügyi intézmények és kutatók szélesebb körben is alkalmazhassák az egészségügyi adatok biztonságos és etikus kezelése érdekében.
Honlap:
A projekt az Európai Unió Horizon 2020 kutatási és innovációs programjának támogatásával valósul meg, a 101095717 számú támogatási megállapodás keretében.