• login Bejelentkezés
  • Ötletek, visszajelzés, kérdések
  • Hibajelentés
  • Forráskód
  • Egészségügyi adatok biztonságos és etikus kezelése

    SAJTÓKÖZLEMÉNY

    2025.december 8.

    A SECURED projektben, melyben a Semmelweis Egyetem és a BME kutatói is részt vettek, azt vizsgálták 9 európai ország 18 intézményének tudósai, hogyan lehet az egészségügyi adatokat szintetikus adatokká  átalakítani úgy, hogy azok kutatási alkalmazása biztonságos lehessen.

    A szintetikus adatok olyan, számítógépes rendszerek által mesterségesen előállított adatok, amelyek hasonlítanak a valós adatokhoz, de nem tartalmaznak személyes információkat, például a páciens nevét vagy egyéb adatait. Ezek az akár képi, szöveges vagy videó alapú adatok lehetővé teszik az egészségügyi modellek fejlesztését és tesztelését anélkül, hogy a páciensek érzékeny adatai veszélybe kerülnének.

    Végéhez közeledik az európai összefogással megvalósuló SECURED projekt, amely az elmúlt két évben az egészségügyi adatok védelmével és – a szintetikus adatok alkalmazásán keresztül – etikai aggályoktól mentes felhasználásával foglalkozott. A 9 európai ország 18 partnerét (https://secured-project.eu/consortium/) összefogó, az Európai Unió által finanszírozott projekt kutatói azt vizsgálták, miként lehet az egészségügyi adatokat úgy átalakítani, hogy azok kutatási alkalmazása biztonságos lehessen. Magyarországon a Budapesti Műszaki és Gazdaságtudományi Egyetem, valamint a Semmelweis Egyetem Egészségügyi Menedzserképző Központ szakértői vettek részt a nemzetközi együttműködésben.

    A szintetikus adatok olyan, számítógépes rendszerek által mesterségesen előállított adatok, amelyek hasonlítanak a valós adatokhoz, de nem tartalmaznak személyes információkat, például a páciens nevét vagy egyéb adatait. Ezek az akár képi, szöveges vagy videó alapú adatok lehetővé teszik az egészségügyi modellek fejlesztését és tesztelését anélkül, hogy a páciensek érzékeny adatai veszélybe kerülnének. A SECURED (az angol Scaling Up Secure Processing, Anonymization and Generation of Health Data for EU Cross-Border Collaborative Research and Innovation rövidítése) projekt fő célja az volt, hogy az adatanonimizáció és a szintetikus adatok létrehozása révén segítse az egészségügyi szolgáltatások fejlesztését, a kutatási együttműködések biztonságos megvalósítását, és ezáltal hozzájáruljon a betegek jobb ellátásához az Európai Unióban.

    Miközben a digitális eszközök – például az elektronikus kórlapok, képalkotó platformok és távgyógyászati rendszerek – átalakítják a betegellátást, új kockázatokat is teremtenek: adatvédelmi incidensek, magánélethez fűződő jogok sérülése és szigorodó megfelelési követelmények formájában. A SECURED projekt bemutatja, hogyan képes az egészségügy ezekre a kihívásokra adatvédelmet középpontba helyező megközelítésekkel válaszolni, amelyek révén az érzékeny egészségügyi adatok egyszerre maradnak védettek és hasznosíthatók.

    Mint a projektben résztvevő Semmelweis Egyetem Egészségügyi Menedzserképző Központ munkatársa, Dr. Pollner Péter elmondta: „Az adatvezérelt egészségügy és a mesterséges intelligencia korában a szintetikus adatok kulcsszerepet játszanak abban, hogy a fejlesztések adatvédelmi kockázatok nélkül, mégis valósághű környezetben történhessenek meg, így hidat képeznek a klinikai alkalmazás és a kutatási innováció között.A szintetikus adatok lehetővé teszik, hogy az egészségügyi mesterséges intelligencia fejlesztése során valósághű, de adatvédelmi szempontból biztonságos környezetben végezhessünk kutatásokat, ezáltal felgyorsítva az algoritmusok tesztelését és a klinikai alkalmazhatóság felé vezető utat. Ez azonban nem jelenti azt, hogy érzékeny adatokból előálló szintetikus adatot bárki számára hozzáférhető lehetne tenni.”

    Dr. Ács Gergely, a projektben szintén résztvevő Budapesti Műszaki és Gazdaságtudományi Egyetem Kriptográfia és Rendszerbiztonság Laboratóriumának kutatója hozzátette: „A biztonságos adatmegosztás nemcsak technológiai kérdés, hanem bizalomépítés is az egészségügyi szereplők között. A SECURED projektben azt kerestük, hogyan lehet ezt a bizalmat valós, működő megoldásokon keresztül megerősíteni. A bizalom megerősítése éppen ott kezdődik, ahol a leggyakoribb a félreértés: a szintetikus adatok önmagukban nem garantálnak teljes adatvédelmet. Amikor a szintetikus adatok szóba kerülnek, sokan azt gondolják: »Nem valósak, tehát már nem is érzékeny adatok.« Ez a feltételezés viszont nagyon veszélyes” – figyelmeztetett a kutató. „A kihívás lényege az, hogy a fejlesztések során két cél között kell egyensúlyoznunk, ami általában kompromisszumokkal jár: egyrészt az adat legyen pontos és hasznos (megtartva az eredeti statisztikai tulajdonságait), másrészt legyen anonim és GDPR-megfelelő (ne legyen köthető fizikai személyhez). Sajnos, a kettő kielegítése kompromisszumok nélkül nem lehetséges.

    Dr. Pejó Balázs, aki fiatal posztdoktori kutatóként vesz részt a projektben Dr. Ács Gergely kollégájaként, részletesebben  elmagyarázata a probléma lényegét: a generatív modellek (amelyek a szintetikus adatokat előállítják) megőrzik az eredeti adatok bizonyos tulajdonságait, ami viszont érzékeny információkat tárhat fel.

    A szintetikus adatok valójában aggregált információk összességei. Ha ezeket az aggregált információkat össze tudjuk kombinálni, felfedhetünk egyedi titkokat. A legszemléletesebb példa a célzott modellezés: Képzeljünk el egy modellt, amit csak rákos betegeken tanítottunk. Ha egy kutató valahogyan rájön, hogy egy bizonyos egyén szerepelt a tanító adathalmazban (mondjuk mert néhány szintetikus adatban fellelhetők csak az egyénre jellemző egyedi vonások), akkor azt is megtudja, hogy az illető rákos. Ezt a kritikus információt a modell – akaratlanul, de – kiszolgáltatta.

    Dr. Ács Gergely hozzátette, hogy a veszély forrása maga a gépi tanulás működési elve:

    Általában a modell másként viselkedik azon az adaton, amit már látott (ezen optimalizálta magát), hiszen azon pontosabb a jóslása. Ezt a memóriát kihasználva, egyszerű statisztikai próbákkal el lehet dönteni, hogy melyik adaton javasol a modell szignifikánsan pontosabban, és így valószínűsíthető, hogy azt az egyedi adatot már »látta«. Ez a teszt jelzi az egyénekről történő adatszivárgást, rámutatva arra, hogy a szintetikus adatok önmagukban nem garantálják a titoktartást.

    A SECURED projekt során kidolgozott módszertan lehetővé teszi, hogy több szervezet – például különböző egészségügyi intézmények – biztonságosan megosszák egymással az elemzések eredményeit a zárt csatornáikon keresztül, anélkül, hogy a nyers, érzékeny adatok elhagynák rendszereiket. Ez az eljárás új lehetőségeket teremt az etikus egészségügyi kutatások és az orvostanhallgatók gyakorlati képzése számára egyaránt. Ehhez a projekt a megoldást nem a szintetikus adatban, hanem az azt körülvevő technológiában kereste. A biztonságos alkalmazáshoz tehát további technológiai védőhálókra van szükség, mint például a homomorf titkosítás.

    A SECURED projekt eredményei és módszertana nyíltan elérhetővé válnak, hogy azokat az egészségügyi intézmények és kutatók szélesebb körben is alkalmazhassák az egészségügyi adatok biztonságos és etikus kezelése érdekében.

    Honlap:

    https://secured-project.eu/

    A projekt az Európai Unió Horizon 2020 kutatási és innovációs programjának támogatásával valósul meg, a 101095717 számú támogatási megállapodás keretében.