共享AI見解而不共享患者數(shù)據(jù)
弗雷德·哈奇癌癥研究中心(Fred Hutch)首席數(shù)據(jù)官杰夫·里克(Jeff Leek)在2024年6月10日于華盛頓州西雅圖舉行的弗雷德·哈奇教員退修會上主持了一場關(guān)于人工智能的分組討論會。照片由羅伯特·胡德(Robert Hood)/弗雷德·哈奇新聞服務(wù)提供。
保護(hù)私人健康信息不僅是一項法律義務(wù),也是弗雷德·哈奇癌癥研究中心最高的倫理優(yōu)先事項之一。電子健康記錄跟蹤所有與患者護(hù)理和治療相關(guān)的臨床數(shù)據(jù),包括檢查結(jié)果、生命體征、病程記錄和放射學(xué)報告。這些記錄還包含有關(guān)年齡、性別、種族、收入、教育水平和婚姻狀況等個人信息。醫(yī)學(xué)影像和基因測序有助于指導(dǎo)個體患者的護(hù)理。
所有同意參與研究的弗雷德·哈奇患者的累積數(shù)據(jù)對于癌癥研究也具有重要價值。通過使用復(fù)雜的計算技術(shù),弗雷德·哈奇的研究人員可以在這些患者數(shù)據(jù)中找到隱藏的模式和聯(lián)系,以更好地理解癌癥并發(fā)現(xiàn)更有效的治療方法。其他綜合癌癥中心也在從其患者記錄中學(xué)習(xí)。
然而,患者保密的要求使得難以將來自不同中心的數(shù)據(jù)整合到一個單一的計算機模型中,該模型可以根據(jù)大量實例進(jìn)行強大的預(yù)測和推理。為此,弗雷德·哈奇宣布了一個項目,與另外三個國家癌癥研究所指定的癌癥中心合作,利用尖端的人工智能技術(shù)構(gòu)建這樣一個模型。
癌癥AI聯(lián)盟(Cancer AI Alliance - CAIA)包括丹娜法伯癌癥研究所(Dana-Farber Cancer Institute)、紀(jì)念斯隆凱特琳癌癥中心(Memorial Sloan Kettering Cancer Center)、悉尼基梅爾綜合癌癥中心(The Sidney Kimmel Comprehensive Cancer Center)以及約翰霍普金斯大學(xué)惠廷工程學(xué)院(Whiting School of Engineering at Johns Hopkins)。弗雷德·哈奇獲得了初始資金并將作為聯(lián)盟的協(xié)調(diào)中心。CAIA得到了AWS、德勤、微軟、英偉達(dá)和Slalom提供的超過4000萬美元的資金、AI技術(shù)和專業(yè)知識支持。
CAIA中心將共同建立一個資源,使研究人員能夠在不共享患者數(shù)據(jù)的情況下,構(gòu)建一個從每個癌癥中心的患者記錄中學(xué)習(xí)的計算機模型。
計算機模型的工作原理
基本上,模型是對現(xiàn)實的簡化表示,就像地圖一樣。想象一下你是如何到達(dá)今天的工作地點的。你依賴于基于以前通勤經(jīng)歷的心理地圖。你走的路越多,心理地圖就越可靠,這很重要,因為它幫助你準(zhǔn)確預(yù)測交通情況并準(zhǔn)時到達(dá)。
但心理地圖仍然是你通勤的模型,不是真實的情況。繞道、關(guān)閉、事故、天氣和水手隊的主場比賽都是可能影響通勤的變量,你需要不斷更新心理地圖以使其更接近實際情況。
弗雷德·哈奇和其他CAIA中心希望創(chuàng)建一個可以準(zhǔn)確預(yù)測患者癌癥可能如何進(jìn)展、哪些治療在什么條件下可能有效以及癌癥如何改變以逃避這些治療的計算機模型。這個模型需要從大量多樣化的患者數(shù)據(jù)中學(xué)習(xí),以準(zhǔn)確反映現(xiàn)實世界中的癌癥。模型的變量將是代表患者記錄中所有不同類型信息的數(shù)字,從年齡、種族和吸煙史到遺傳學(xué)、MRI、血液測試和藥物劑量。這些變量及其相對影響是模型的設(shè)置,可以根據(jù)反饋調(diào)整,以使模型的預(yù)測更加準(zhǔn)確。
如何共享見解而不共享數(shù)據(jù)
弗雷德·哈奇只能在其自己的數(shù)據(jù)上訓(xùn)練模型,但如果它還能訓(xùn)練波士頓、紐約和巴爾的摩的患者數(shù)據(jù),其模型會更好。同樣,這些中心的模型也會因為訓(xùn)練西雅圖和其他城市的患者數(shù)據(jù)而變得更好。聯(lián)邦學(xué)習(xí)方法使得這一點成為可能,而無需共享患者數(shù)據(jù)。具體過程如下:
每個CAIA中心都會獲得同一總體模型的副本,并在自己的患者數(shù)據(jù)上對其進(jìn)行訓(xùn)練,調(diào)整變量設(shè)置以獲得更準(zhǔn)確的預(yù)測。然后,各中心將這些新的、調(diào)整后的設(shè)置發(fā)送到中央位置以更新和改進(jìn)總體模型。當(dāng)你更新你的通勤心理地圖以反映水手隊的主場比賽時,你不需要知道誰在比賽、誰是首發(fā)投手或水手隊正在與誰比賽——只需要知道日期和時間即可。
同樣,在更新癌癥模型時,你不需要共享完整的患者數(shù)據(jù)配置文件。各中心只會共享調(diào)整后的設(shè)置,而不是影響這些調(diào)整的患者數(shù)據(jù)?;颊哂涗洷旧砣匀话踩乇4嬖诟鱾€機構(gòu)的防火墻內(nèi)。這些共享的調(diào)整(數(shù)百萬個)被合并,以建立反映總體模型從所有中心的患者記錄中學(xué)到的新共識設(shè)置。每個中心然后會獲得更新后的總體模型的新共識設(shè)置副本,并用自身的患者數(shù)據(jù)進(jìn)一步細(xì)化。這一本地訓(xùn)練和中央更新的循環(huán)可能會重復(fù)多次,以使癌癥模型與CAIA中心的癌癥現(xiàn)實更加吻合。
這些模型——基于四個癌癥中心的全面且多樣化的患者經(jīng)驗數(shù)據(jù)訓(xùn)練,并可能擴展到更多機構(gòu)——將幫助研究人員更好地理解腫瘤生物學(xué)、疾病進(jìn)展、對治療的反應(yīng)和耐藥性的復(fù)雜分子相互作用。這對于研究罕見癌癥和小群體尤其有用,這些群體在每個中心只有少數(shù)患者,這可能會揭示新的治療方法。
關(guān)于CAIA的問答
11月20日的在線全體職員弗雷德·哈奇市政廳會議包括了一個關(guān)于新聯(lián)盟的問答環(huán)節(jié),參與者包括弗雷德·哈奇總裁托馬斯·林奇二世博士(Thomas J. Lynch Jr., MD),他擔(dān)任Raisbeck主席,以及弗雷德·哈奇副總裁兼首席數(shù)據(jù)官杰夫·里克博士(Jeff Leek, PhD),他擔(dān)任J. Orin Edson基金會主席。以下是經(jīng)過編輯的簡短和清晰的對話記錄。
問:(托馬斯·林奇) 上個月,我們宣布啟動癌癥AI聯(lián)盟,稱為CAIA。我對此非常興奮。幾家著名的技術(shù)公司以及四個杰出的癌癥中心聚集在一起,思考如何利用AI來改變癌癥護(hù)理和研究。CAIA意味著什么?誰參與其中,這個想法是如何開始的?
答:(杰夫·里克) 這個想法的初衷是基于從患者數(shù)據(jù)中開發(fā)預(yù)測性、預(yù)后性、治療分配和發(fā)現(xiàn)性機器學(xué)習(xí)模型,并將其重新部署到醫(yī)療系統(tǒng)中以改善患者護(hù)理。我們在弗雷德·哈奇的液體腫瘤項目中已經(jīng)有過這樣的嘗試,通過Gateway系統(tǒng)讓患者同意參與研究,并利用這些患者的信息進(jìn)行新發(fā)現(xiàn),以實現(xiàn)癌癥的新療法。
我們已經(jīng)開始開發(fā)最新的迭代版本,即CARDS平臺(臨床和研究數(shù)據(jù)解決方案),以使我們的所有患者都能受益。我們確保從所有信息中學(xué)習(xí),同時嚴(yán)格保護(hù)隱私,遵循正確的監(jiān)管框架,并利用這些數(shù)據(jù)幫助每個人學(xué)習(xí)和發(fā)展新的模型、新的預(yù)測和新的癌癥療法。
這是UW、IT部門、數(shù)據(jù)部門、法律和合規(guī)團(tuán)隊共同努力的結(jié)果,使我們能夠按照所有規(guī)則和協(xié)議使用患者數(shù)據(jù),以構(gòu)建新模型并從中學(xué)習(xí)。每個癌癥中心都在嘗試做類似的事情。我們的合作伙伴——紀(jì)念斯隆凱特琳、丹娜法伯和悉尼基梅爾癌癥研究所——也在建立類似的學(xué)習(xí)醫(yī)療數(shù)據(jù)系統(tǒng)。
但挑戰(zhàn)在于這些系統(tǒng)是孤立的。如果我想了解約翰霍普金斯的癌癥患者,我必須創(chuàng)建一項研究并制定數(shù)據(jù)共享協(xié)議和材料轉(zhuǎn)移協(xié)議。這需要很長時間才能為每個單獨的研究建立起來。
我們?nèi)绾蝿?chuàng)造一種激勵機制,打破這些孤島,使我們能夠在癌癥中心之間開展這項工作?
有很多原因使得這一點很難做到,但現(xiàn)在出現(xiàn)了一些技術(shù),使我們能夠進(jìn)行所謂的聯(lián)邦學(xué)習(xí)。利用這些技術(shù)的進(jìn)步,我們可以避免直接共享數(shù)據(jù)帶來的挑戰(zhàn)。
問:AI是一種策略還是AI啟用策略?
答: 我認(rèn)為有三個組成部分:一是我們從未如此大規(guī)模收集的數(shù)據(jù);二是我們從未能以前所未有的規(guī)模擬合的模型;三是與人的接口。
這三個方面在當(dāng)前的交匯點上幾乎適用于各行各業(yè),這就是為什么你會看到圍繞AI的興奮。我曾經(jīng)是AI懷疑論者。改變我觀點的是思考AI到底是什么。AI是要取代人類嗎?AI會取代所有卡車司機嗎?五年前我們聽到過這樣的炒作,但事實并非如此。我們?nèi)匀恍枰芏喾派淇漆t(yī)生。
問:我們有點時間不夠用了。
答: 改變我觀點的是將AI視為“更好的計算機”或輔助工具,以及人機協(xié)作工具。這樣你可以思考如何更快、做得更多,并真正做出原本不可能的發(fā)現(xiàn)。當(dāng)我開始這樣思考時,我的懷疑大大減少。我認(rèn)為這在我們的研究社區(qū)和臨床護(hù)理社區(qū)中作為助手,有可能帶來巨大影響,幫助我們做出原本不可能的發(fā)現(xiàn)。
問:請告訴我目前CAIA的情況。我們10月份宣布了CAIA,現(xiàn)在進(jìn)展如何?
答: 簡短的回答是,這將成為有史以來為癌癥研究創(chuàng)建的最酷的AI實驗室。如果成功,我們將擁有最全面的數(shù)據(jù),并結(jié)合一個系統(tǒng),使你能夠構(gòu)建最大、最具創(chuàng)意的模型,這些模型將可供所有這些癌癥中心的研究人員使用,并以非營利方式推進(jìn)研究。這是一個巨大的機會。
我們正在進(jìn)行大量的幕后機構(gòu)工作。我們在構(gòu)建平臺、處理法律安排、建立數(shù)據(jù)模型、談判細(xì)節(jié),并開始考慮使用案例。我們從這四個癌癥中心開始,最終的目標(biāo)是包括美國所有的綜合癌癥中心。一旦能夠在這些癌癥中心之間構(gòu)建和部署模型,我們將有機會繼續(xù)這一循環(huán),做出發(fā)現(xiàn),開發(fā)新模型,并將它們重新部署到這些中心。
我特別興奮的是,我們可以在研究中探討這對患者是否有效,這對我們的提供者是否有效,這是否有助于或妨礙我們的護(hù)理。我們正處于這一革命的初期,我認(rèn)為這使弗雷德·哈奇在未來十年內(nèi)處于戰(zhàn)略性的有利位置,以推動這項研究向前發(fā)展。
(全文結(jié)束)
相關(guān)知識
健康數(shù)據(jù)共享失敗?一文搞定
溫州有了“健康大腦”!健康數(shù)據(jù)全市共享,AI閱片精準(zhǔn)高效
區(qū)塊鏈在醫(yī)療領(lǐng)域的應(yīng)用:數(shù)據(jù)共享和患者隱私
廈門健康醫(yī)療大數(shù)據(jù)中心:打造開放共享+共建共贏的醫(yī)療大數(shù)據(jù)新生態(tài)
如何共享查看健康數(shù)據(jù) iOS 15健康A(chǔ)pp共享方法
健康醫(yī)療大數(shù)據(jù)亟待共享
構(gòu)筑健康醫(yī)療大數(shù)據(jù)共享平臺
健康醫(yī)療數(shù)據(jù)共享分析平臺
基于云計算的健康體檢數(shù)據(jù)共享平臺
華為運動健康如何設(shè)置數(shù)據(jù)共享
網(wǎng)址: 共享AI見解而不共享患者數(shù)據(jù) http://www.u1s5d6.cn/newsview1129704.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826