醫(yī)療健康行業(yè)中個人信息去標(biāo)識化的技術(shù)方案
編者按
在醫(yī)療健康行業(yè),共享患者數(shù)據(jù)對改善和突破醫(yī)療技術(shù)至關(guān)重要,尤其是處在海量數(shù)據(jù)與人工智能技術(shù)的時代。但在利用和共享自然人的醫(yī)療健康數(shù)據(jù)同時,還應(yīng)重點考量個人信息的安全風(fēng)險。因此,如何在確?;颊邆€人信息安全的同時實現(xiàn)數(shù)據(jù)共享和訪問成為業(yè)界關(guān)注的焦點,醫(yī)療行業(yè)數(shù)據(jù)充分去識別化的技術(shù)方案因而進入了行業(yè)相關(guān)方的視野。
本文在HealthITAnalytics發(fā)布的Exploring Data De-Identification in Healthcare一文的基礎(chǔ)上,闡釋了醫(yī)療行業(yè)中數(shù)據(jù)去識別化技術(shù)及其與個人信息保護、人工智能和連接設(shè)備運用之間的關(guān)系,以探討醫(yī)療健康行業(yè)中個人信息保護與數(shù)據(jù)共享的兩全之策。
01 采取避免患者信息的“二次識別”的控制措施
最基本的“去識別化”是指無法根據(jù)病歷中的信息重新識別自然人,通常涉及刪除、隱藏個人姓名、出生日期、性別、地址或其他信息。除了這種基本的去識別化外,醫(yī)療行業(yè)利益相關(guān)者還需要了解其他信息以及可識別的級別,以保護患者信息。
實際上,存在一種超出潛在可識別性的信息級別,比如患者的IP地址、與患者起搏器相關(guān)聯(lián)的唯一設(shè)備ID、僅患者就診組織內(nèi)可見的病歷編號等信息。從理論上講,這些信息很容易重新識別到該患者。因此,人們需要采用額外的手段,對這類級別的信息去識別化,并且該操作應(yīng)當(dāng)持續(xù)到自然人個體不再容易被識別為止。換句話說,除了提取個人身份信息之外,還要有額外的信息保護和控制措施。
一個通過關(guān)聯(lián)信息進行識別的例子:
一位億萬富翁在去年接受了針對特定類型癌癥的特定治療,通過與所選擇的治療方案、癌癥類型和時間范圍等信息的關(guān)聯(lián),以及在醫(yī)療環(huán)境之外(例如在社交媒體平臺上)獲得的健康信息,此患者信息變得可識別。
因此,可以從兩個方面去考慮去識別化:一是提取特定信息,避免可以與特定個體相關(guān)聯(lián)的信息,或者串聯(lián)起來可以識別特定個體;二是如何使用一組數(shù)據(jù)集的因素組合來追蹤特定個體。這不僅僅通過提取特定信息來實現(xiàn),還通過限制數(shù)據(jù)集查詢到特定個體的方式,防范追蹤到特定個體。
02 通過隱私增強技術(shù)推進大規(guī)模醫(yī)療協(xié)作
在醫(yī)療行業(yè),數(shù)據(jù)提取在個人信息保護合規(guī)方面發(fā)揮著重要作用,但不斷發(fā)展的數(shù)據(jù)分析技術(shù)(如AI技術(shù))為符合合規(guī)標(biāo)準(zhǔn)進行數(shù)據(jù)去識別化時,也帶來了新的挑戰(zhàn)和機遇。
AI技術(shù)有著更強大的信息識別功能,在AI面前,使用傳統(tǒng)的去識別化合規(guī)定義,會遇到一些問題。例如,由于AI技術(shù)比傳統(tǒng)分析框架更能夠?qū)崿F(xiàn)高水平的圖像重建,AI可以將識別面部的患者頭部CT掃描用來重建患者面部特征。因此,從理論上講,AI技術(shù)能夠在無需任何其他潛在的可識別信息的情況下,重新識別患者。
解決該問題的關(guān)鍵在于兩個方面:第一,如何充分混淆核心數(shù)據(jù),無論是通過數(shù)學(xué)轉(zhuǎn)換、密碼轉(zhuǎn)換還是其他方式,從本質(zhì)上有效地使其在單個數(shù)據(jù)點上實現(xiàn)數(shù)據(jù)用戶的不可見,或者攔截試圖訪問該數(shù)據(jù)的其他人;第二,如何確保所進行的分析操作的核心目的不是識別人群?可在流程中,使用技術(shù)方法、合規(guī)標(biāo)準(zhǔn)方法,以及手工操作的方法。
人工智能在幫助研究人員深入了解疾病和改進治療方面有巨大前景,但如果不能廣泛訪問人群的數(shù)據(jù)集,醫(yī)療協(xié)作和研究將受到嚴(yán)重限制,醫(yī)學(xué)研究與治療的進展可能會停滯。
僅使用傳統(tǒng)“混淆或提取個體標(biāo)識符”的去識別方法,將限制醫(yī)療行業(yè)的發(fā)展。因此,確保數(shù)據(jù)不被復(fù)制到多個數(shù)據(jù)組中,使個人無法攔截或惡意使用是至關(guān)重要的。這就是隱私增強技術(shù) (PET)發(fā)揮作用的地方,即在整個數(shù)據(jù)生命周期中,基于人工智能的技術(shù)可幫助用戶和組織來保護個人信息。
根據(jù)OECD在2023年3月8日發(fā)布的《新興增強隱私的技術(shù)(Emerging privacy-enhancing technologies)》,隱私增強技術(shù)(PET)是一種數(shù)字解決方案,即數(shù)字技術(shù)和方法的集合,PET允許收集、處理、分析和共享的信息,同時保護數(shù)據(jù)的機密性和隱私。
PETs可以分為四類:數(shù)據(jù)混淆、加密數(shù)據(jù)處理、聯(lián)合和分布式分析以及數(shù)據(jù)問責(zé)工具。
數(shù)據(jù)混淆工具包括零知識證明(ZKP)、差分隱私、合成數(shù)據(jù),以及匿名化、假名化工具。這些工具通過改變數(shù)據(jù)來增加隱私保護,增加 "噪音"或刪除識別細節(jié)。混淆數(shù)據(jù)可以使保護隱私的機器學(xué)習(xí),并允許信息驗證(例如,年齡驗證)。而不需要披露敏感數(shù)據(jù)。然而,如果不仔細執(zhí)行,數(shù)據(jù)混淆工具可能會泄露信息。例如,在數(shù)據(jù)分析和補充數(shù)據(jù)集的幫助下,匿名的數(shù)據(jù)可以被重新識別出來。
加密的數(shù)據(jù)處理工具包括同態(tài)加密,多方計算包括私有集相交以及可信的執(zhí)行環(huán)境。加密數(shù)據(jù)處理PET允許數(shù)據(jù)在使用中加密,從而避免了在處理之前需要對數(shù)據(jù)進行解密。例如,加密的數(shù)據(jù)處理工具被廣泛部署在冠狀病毒追蹤應(yīng)用中。然而,這些工具有局限性。舉例來說,它們的計算成本往往很高。
?聯(lián)合和分布式分析允許在數(shù)據(jù)上執(zhí)行分析任務(wù),而數(shù)據(jù)對執(zhí)行任務(wù)的人來說是不可見或不可訪問的。例如,在聯(lián)合學(xué)習(xí)中,一種技術(shù)越來越受到關(guān)注,數(shù)據(jù)在數(shù)據(jù)源處被預(yù)處理。在這種方式下,只有摘要統(tǒng)計結(jié)果被傳遞給執(zhí)行任務(wù)的人。聯(lián)合學(xué)習(xí)模型被大規(guī)模部署,例如,在移動操作系統(tǒng)上的預(yù)測性文本應(yīng)用中,以避免將敏感的擊鍵數(shù)據(jù)送回。?
數(shù)據(jù)問責(zé)工具包括問責(zé)系統(tǒng)、閾值秘密共享和個人數(shù)據(jù)存儲。這些工具的主要目的不是在技術(shù)層面上保護個人數(shù)據(jù)的機密性,因此通常不被視為技術(shù)層面的內(nèi)容。因此,通常不能稱為嚴(yán)格意義上的PET。然而,這些工具試圖通過讓數(shù)據(jù)主體控制自己的數(shù)據(jù)來加強隱私和數(shù)據(jù)保護。并制定和執(zhí)行何時可以訪問數(shù)據(jù)的規(guī)則。大多數(shù)工具都處于早期開發(fā)階段,用例集較少且缺乏獨立的應(yīng)用。
PET不僅僅是特定數(shù)據(jù)標(biāo)識符的提取,還能限制數(shù)據(jù)的移動,同時還允許對數(shù)據(jù)進行分析操作。這將有助于減少風(fēng)險,在不會危及患者個人信息安全的前提下充分利用數(shù)據(jù)。當(dāng)然,PET并不能完全消除風(fēng)險。因此,還需要通過盡職調(diào)查的方式,了解數(shù)據(jù)運行的算法,并保持?jǐn)?shù)據(jù)用戶和數(shù)據(jù)所有者之間的密切溝通。以上技術(shù)和方法給數(shù)據(jù)提供者和患者創(chuàng)造了通過AI驅(qū)動的數(shù)據(jù)去識別化,實現(xiàn)數(shù)據(jù)訪問與數(shù)據(jù)共享。
03 更新個人信息保護規(guī)則框架,滿足復(fù)雜連接設(shè)備與技術(shù)的合規(guī)要求
從個人信息傳輸?shù)结t(yī)院的角度來考慮連接設(shè)備時,由于醫(yī)院與患者之間存在“合同”,因此個人信息保護規(guī)則框架如何影響設(shè)備數(shù)據(jù)傳輸問題是相對簡單的。然而,與去識別化一樣,連接設(shè)備與個人信息保護規(guī)則框架合規(guī)問題卻極為復(fù)雜。
在此類情況下,數(shù)據(jù)處理者可能是執(zhí)行檢查的衛(wèi)生系統(tǒng)或第三方,這給個人信息保護規(guī)則框架合規(guī)制造出額外的考慮因素。當(dāng)人們考慮到患者的數(shù)據(jù)不僅存儲在醫(yī)生辦公室,而且廣泛分布在只有某些人可以訪問的云設(shè)備時,問題變得愈來愈復(fù)雜。
歸根結(jié)底,所有問題都回到了協(xié)調(diào)舊的個人信息保護規(guī)則框架與更新技術(shù)的矛盾當(dāng)中。
醫(yī)療行業(yè)必然是保守的,人們不希望醫(yī)療行業(yè)過于創(chuàng)新。尤其在涉及到人們的個人健康時,并不想產(chǎn)生風(fēng)險。因此,無論是藥物,還是醫(yī)療技術(shù),人們都希望明確事物如何運作、為何如此運作,并擁有適當(dāng)?shù)目蚣軄碜C明新事物的使用是合理的。此外,在討論醫(yī)療行業(yè)中數(shù)據(jù)去識別化問題時,需要對臨床醫(yī)生、研究人員、監(jiān)管機構(gòu)、律師和個人信息保護合規(guī)專家、認證人員等不同群體進行培訓(xùn)。
同時,法律框架也需要演進,以適應(yīng)醫(yī)療行業(yè)數(shù)據(jù)去識別化的需求。舊的法律框架沒有考慮到現(xiàn)實中存在擴展保護級別需求的新技術(shù)。因此,仍需要在個人信息保護規(guī)則框架內(nèi),進一步細化對醫(yī)療健康行業(yè)數(shù)據(jù)去識別化的解釋。
參考資料:
1.Health Insurance Portability and Accountability Act of 1996 (HIPAA),https://www.cdc.gov/phlp/publications/topic/hipaa.html.
2.OECD:Emerging privacy-enhancing technologies,https://www.oecd.org/digital/emerging- privacy-enhancing-technologies-bf121be4-en.htm
聲明:本文來自數(shù)據(jù)信任與治理,版權(quán)歸作者所有。文章內(nèi)容僅代表作者獨立觀點,不代表安全內(nèi)參立場,轉(zhuǎn)載目的在于傳遞更多信息。如有侵權(quán),請聯(lián)系 anquanneican@163.com。
相關(guān)知識
2019年醫(yī)療行業(yè)信息化解決方案.ppt
從2018 CHITEC,看醫(yī)療信息化行業(yè)的跌宕起伏
大力推動健康醫(yī)療信息化
遠程醫(yī)療,持續(xù)推進醫(yī)療行業(yè)信息化發(fā)展
醫(yī)藥與健康護理行業(yè)信息點評:《“十四五”全民健康信息化規(guī)劃》制定 醫(yī)療信息化產(chǎn)業(yè)有望加速發(fā)展
個人健康醫(yī)療信息保護模式考察
智慧醫(yī)療是什么?有什么醫(yī)療信息化建設(shè)方案推薦?
20家醫(yī)療信息化企業(yè)大盤點
移動醫(yī)療:體驗醫(yī)療服務(wù)信息化
遠程醫(yī)療:醫(yī)療信息化的必由之路——HC3i中國數(shù)字醫(yī)療網(wǎng)
網(wǎng)址: 醫(yī)療健康行業(yè)中個人信息去標(biāo)識化的技術(shù)方案 http://www.u1s5d6.cn/newsview516785.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10428
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7828