整個世界如同大型的臨床試驗室。人類每分每秒都從不同渠道生成數(shù)據(jù)流。而在社交媒體、移動GPS、WiFi熱點、網(wǎng)頁記錄、醫(yī)療卡,可穿戴式裝置等等信息源上儲存或流動的信息,都可能為人們的健康生活提供幫助。
關(guān)注大數(shù)據(jù)觀察網(wǎng)(微信公眾號:shuju_net)了解更多精彩資訊
可以想象,F(xiàn)acebook或Google作為目前最大的兩家數(shù)據(jù)平臺和搜索引擎,可以在病人檢出癌癥之前就預測到這一點。有人在社交網(wǎng)站上抱怨自己夜間盜汗和體重降低,他們可能不知道這是淋巴瘤的前兆;還有些人說自己早晨關(guān)節(jié)僵硬,而且很容易曬傷,而這可能預示著他們患有紅斑狼瘡。社交網(wǎng)絡有可能在整理這些帖子時,從中發(fā)現(xiàn)蛛絲馬跡。
這些跡象和預測也許能救人一命,或者改善用戶的健康狀況。但是社交網(wǎng)絡并沒有將這些信息暴露出來,這當然情有可原。那么問題來了,社交網(wǎng)絡利用平臺信息預測用戶健康狀況這件事的利弊如何衡量呢?
思想實驗雖然有報道稱社交平臺可用于預測甚至阻止自殺,但是有關(guān)其能在用戶看醫(yī)生得到確診之前就預知未來的觀點只是個假設。
假設Facebook可以透露一些去標識化的數(shù)據(jù),例如用戶的位置、旅行線路、喜好、發(fā)貼頻率、情緒、瀏覽和搜索習慣,研究人員可以基于這些數(shù)據(jù)建立預測人身體和情緒狀態(tài)的模型。
例如,數(shù)萬個帖子組成的數(shù)據(jù)集中,有某些可以看做人們罹患癌癥、抑郁癥或炎性腸病方面的記錄。研究人員利用機器學習技術(shù)可以在診斷前后采集這些數(shù)據(jù)并研究其語言、風格和內(nèi)容,然后設計出模型,輸入新的用戶數(shù)據(jù)集,便可預測有哪些用戶可能會有相同的病癥。
此模型系統(tǒng)不需要關(guān)注用戶類似發(fā)燒或體重減輕一樣嚴重且發(fā)作較快的病癥。它關(guān)注的是一些看似不重要的無關(guān)數(shù)據(jù)——如購買抗嘔吐藥物或觀看失眠紀錄片——這些數(shù)據(jù)可能會給預測加上重重一記實錘,表明用戶可能有某種疾病。困難在于,我們在社交媒體留下的蛛絲馬跡指向無限的可能性,有些很明顯,有些則無從判斷,卻都可能影響者我們的身體健康和幸福生活。所以如何利用好這些數(shù)據(jù)又是另一回事了。
某些臨床醫(yī)生支持社交平臺為了社會的利益,整合用戶數(shù)據(jù)并提供相應信息。他們與數(shù)據(jù)科學公司Litmus Health展開合作,以便從臨床試驗中收集、整理和分析數(shù)據(jù),并利用這些數(shù)據(jù)改善公民健康狀況。然而,有關(guān)部門也需嚴格監(jiān)管,從道德、技術(shù)和社會層面謹慎看待這一合作。
從監(jiān)管的角度來看,所有社交媒體的服務條款中都標明他們有責任妥善處理用戶數(shù)據(jù)。不走運的是,2014年Facebook與卡內(nèi)基梅隆大學的研究表明,由于服務條款和/或隱私政策過于復雜,根本沒人會閱讀它們,用戶只是盲目地閱讀并在同意處點擊對話而已。
社交平臺的正確“身份認知”社交平臺如果想要扮演道德上的“無害”角色,有很多種方法可以實現(xiàn)——它們可以制定簡單易懂的數(shù)據(jù)政策,避免以不恰當?shù)姆绞绞褂糜脩魝€人資料。要在倫理框架下使用大數(shù)據(jù)必須考慮用戶的身份、隱私、所有權(quán)和聲譽。目前對于大多數(shù)公司來說,未經(jīng)用戶同意便使用它們的數(shù)據(jù)構(gòu)建疾病預測模型,可能有悖于其既定的價值體系。但是,征得用戶同意可能的做法也不過就是把本來就沒人看的用戶協(xié)議寫得更長些。
如果公司要求用戶授權(quán)允許使用他們的數(shù)據(jù)并參與實驗中,那么公司本身應該將信息收集、使用和分享的過程公開透明化。假設一個社交網(wǎng)絡可以使用某種算法來分析用戶的活動——他們抱怨的事物、他們分享的文章、他們點贊的帖子等等。AI便可以探尋到一種表明用戶可能存在健康問題的模式。
假設現(xiàn)在能夠跨越社交網(wǎng)絡、可穿戴式傳感器和移動設備等不同數(shù)據(jù)源獲得可用數(shù)據(jù)流。那么這些不同數(shù)據(jù)流的預測價值可能馬上會水漲船高。例如,用戶關(guān)于頭痛和惡心的帖子,F(xiàn)itbit上的逐步減少的步數(shù),導航過藥房的手機GPS數(shù)據(jù),以與反應速度和協(xié)調(diào)性微妙相關(guān)的打字準確度的降低,這一些都可能指向不容樂觀的身體狀況。
這種完美的預測模型一旦推出,一定技驚醫(yī)療界,但更多的情況是,大多數(shù)有頭痛和惡心癥狀的人也沒有得腦腫瘤。
若社交媒體提示用戶他們可能會感染流感,也許促使其尋求醫(yī)生診斷或治療,這兩者都是相對輕松和廉價的干預措施。但在類似情況下,如果給出的建議是用戶可能患有癌癥,這會引起用戶恐慌并進一步帶來更嚴重的后果,輕則導致情緒創(chuàng)傷,重則會導致用戶盲目進行有害的測試和治療。
由于預測系統(tǒng)針對對象為數(shù)百萬用戶,對于醫(yī)療體系而言,潛在的后勤和財務影響可能是巨大的。雖然基于算法的預測可能涉及我們生活的許多方面,頗有用處,上述這些例子說明了算法預測在健康領(lǐng)域更要三思后行。無論對于潛在的利益亦或風險,都應該進行嚴密的管理和監(jiān)控。
用戶應參與其中臨床醫(yī)師建議,消費者自己應有獲取他們所有數(shù)據(jù)源中所產(chǎn)生的健康數(shù)據(jù)的權(quán)限。這樣做的好處遠遠超過了潛在風險,因為現(xiàn)在越來越多的病人都要求查看自己完整的病歷。患者在治療計劃中應發(fā)揮積極作用,醫(yī)療工作人員也應該肩負責任,促進這一進程。
要讓用戶參與到自己的健康預測之中,首先要允許其數(shù)據(jù)被收集和追蹤。社交網(wǎng)絡公司需謹慎制定具體疾病的追蹤標準,以及在何時通知用戶其健康狀況岌岌可危。發(fā)布通知后,用戶可以選擇接收更多信息或?qū)⑵鋽?shù)據(jù)直接發(fā)送給醫(yī)護人員。因此,目前新的數(shù)據(jù)處理和管理模式亟待推出,對用戶及其數(shù)據(jù)的法律保護將變得愈發(fā)重要。
而對用戶私人數(shù)據(jù)擁有權(quán)限的個人、公司和組織都肩負重任。如果想要利用這些數(shù)據(jù)對更準確地預測用戶健康和疾病狀況,那么所有都需要共同努力,深入了解各自的期望和責任。技術(shù)、法律和社會仍會對這一想法的實施施加重重阻礙,但其改善人們健康狀態(tài)的潛力是巨大的。返回搜狐,查看更多