從課堂到競賽:一位健康數(shù)據(jù)科學(xué)畢業(yè)生的創(chuàng)新旅程
打開網(wǎng)易新聞 查看精彩圖片
重慶理工大學(xué),作為我國西南地區(qū)著名的理工類高等學(xué)府,一直致力于培養(yǎng)具備創(chuàng)新能力和實(shí)踐經(jīng)驗(yàn)的高素質(zhì)人才。為了激勵(lì)在校學(xué)生,展示校友風(fēng)采,我校特別邀請了杰出校友吳柳潔女士接受專訪。吳柳潔女士在校期間表現(xiàn)優(yōu)異,畢業(yè)后赴英深造,在斯旺西大學(xué)取得了健康數(shù)據(jù)分析碩士學(xué)位。她在健康數(shù)據(jù)分析領(lǐng)域的出色表現(xiàn)和創(chuàng)新成果,不僅為母校贏得了榮譽(yù),也為推動(dòng)中英兩國在數(shù)據(jù)科學(xué)領(lǐng)域的交流與合作做出了重要貢獻(xiàn)。
吳柳潔本科畢業(yè)于重慶理工大學(xué),在校期間在全國競賽中表現(xiàn)優(yōu)異,獲得多項(xiàng)榮譽(yù),包括第十一屆ICAN國際創(chuàng)新創(chuàng)業(yè)大賽全國總決賽三等獎(jiǎng)和2017年全國數(shù)學(xué)建模大賽第一名。她還獲得了一項(xiàng)獲得國家授權(quán)的專利"智能教室預(yù)約系統(tǒng)"。在健康數(shù)據(jù)分析專業(yè)研究生期間,吳柳潔繼續(xù)保持出色成績。她在全國數(shù)據(jù)分析大賽中獲得第一名,2024年全國大學(xué)生創(chuàng)新創(chuàng)業(yè)能力大賽中榮獲一等獎(jiǎng),并取得全國數(shù)據(jù)分析證書。利用專業(yè)知識,她帶領(lǐng)團(tuán)隊(duì)開發(fā)了健康數(shù)據(jù)分析軟件,獲得國家認(rèn)可的軟件著作權(quán)。此外,她在Kaggle平臺(tái)組織的創(chuàng)新藥物篩選數(shù)據(jù)分析競賽中獲得銅牌。作為全英生命科學(xué)學(xué)會(huì)青年干事,吳柳潔積極參與學(xué)術(shù)交流,與眾多專家分享醫(yī)療數(shù)據(jù)分析經(jīng)驗(yàn)。她正在健康數(shù)據(jù)分析領(lǐng)域不斷探索創(chuàng)新,擅長將不同地區(qū)的醫(yī)療實(shí)踐和健康文化融入數(shù)據(jù)分析中。通過精細(xì)的算法設(shè)計(jì)和數(shù)據(jù)建模,她賦予健康數(shù)據(jù)獨(dú)特的解釋力,致力于改進(jìn)醫(yī)療實(shí)踐,充分發(fā)揮數(shù)據(jù)科學(xué)在改善人類健康方面的潛力。
問題1:你本科期間取得如此多的獎(jiǎng)項(xiàng),從校級再到省級,再到國獎(jiǎng),獲得了很多獎(jiǎng)項(xiàng),碩果累累,請問您對哪一個(gè)項(xiàng)目印象最深刻呢?以及能不能講講原因?
我在本科期間取得了多項(xiàng)校級、省級和國獎(jiǎng),這離不開指導(dǎo)老師的耐心指導(dǎo)和團(tuán)隊(duì)成員間的通力合作。我非常感謝之前合作的老師和同學(xué)們。雖然獲得了多個(gè)國獎(jiǎng),包括ICAN國際創(chuàng)新創(chuàng)業(yè)大賽獎(jiǎng)、全國數(shù)學(xué)建模大賽獎(jiǎng)和國家授權(quán)的專利,但最讓我印象深刻的是第十一屆ICAN國際創(chuàng)新創(chuàng)業(yè)大賽全國總決賽三等獎(jiǎng)。這個(gè)比賽歷時(shí)一年多,我們從校內(nèi)比賽開始,經(jīng)過重慶市和中國西南地區(qū)的評比,最終進(jìn)入全國總決賽。這一路走來非常不容易,我們在比賽中不斷積累經(jīng)驗(yàn),根據(jù)評委的反饋持續(xù)優(yōu)化項(xiàng)目。最終獲得的全國總決賽三等獎(jiǎng)不僅是對我個(gè)人的褒獎(jiǎng),更是對整個(gè)團(tuán)隊(duì)的榮譽(yù)。這個(gè)經(jīng)歷讓我深刻體會(huì)到團(tuán)隊(duì)協(xié)作和持續(xù)改進(jìn)的重要性,也讓我在創(chuàng)新創(chuàng)業(yè)方面積累了寶貴的經(jīng)驗(yàn)。
打開網(wǎng)易新聞 查看精彩圖片
吳柳潔女士(左一)在第十一屆ICAN國際創(chuàng)新創(chuàng)業(yè)大賽全國總決賽中榮獲三等獎(jiǎng)后留影紀(jì)念問題2:請問你認(rèn)為數(shù)據(jù)分析在現(xiàn)代醫(yī)療保健中的重要性有多大?
醫(yī)療保健是一個(gè)復(fù)雜的領(lǐng)域,涉及多個(gè)方面,其中患者健康和醫(yī)療質(zhì)量最為重要。在醫(yī)療行業(yè),我們需要綜合考慮數(shù)據(jù)分析如何影響醫(yī)療決策、資源分配、疾病預(yù)防等多個(gè)方面。傳統(tǒng)醫(yī)療的目標(biāo)是診斷、治療和康復(fù),而我認(rèn)為未來的醫(yī)療理念必須加上"數(shù)據(jù)驅(qū)動(dòng)"這一核心要素。
基于數(shù)據(jù)分析的醫(yī)療決策比傳統(tǒng)經(jīng)驗(yàn)型決策準(zhǔn)確度可以大大提高,在診斷、治療和隨訪過程中不僅能降低醫(yī)療錯(cuò)誤,還能優(yōu)化資源利用,從長遠(yuǎn)來看,體現(xiàn)出顯著的優(yōu)越性。例如,在診斷初期投入稍高成本進(jìn)行全面的數(shù)據(jù)采集和分析,能提高診斷的準(zhǔn)確性,從長遠(yuǎn)角度減輕后續(xù)治療的負(fù)擔(dān)。這類高效率的醫(yī)療模式需要有全局眼光,考慮整個(gè)診療過程的可持續(xù)性。
問題3:關(guān)于醫(yī)療數(shù)據(jù)的隱私和安全問題,您是怎么看的呢?
醫(yī)療數(shù)據(jù)的隱私和安全,是指在數(shù)據(jù)收集、存儲(chǔ)、分析和共享過程中保護(hù)患者隱私的所有措施。這包括數(shù)據(jù)的加密、訪問控制、傳輸安全,以及數(shù)據(jù)使用過程中的倫理考量。數(shù)據(jù)處理方式直接影響患者隱私保護(hù)的程度,我們提倡在進(jìn)行有價(jià)值分析的同時(shí)盡可能保護(hù)隱私。常用的個(gè)人識別信息就是高敏感度的數(shù)據(jù),相對而言,去標(biāo)識化后的統(tǒng)計(jì)數(shù)據(jù)就是敏感度較低的數(shù)據(jù)。選擇合適的數(shù)據(jù)處理和分享策略是保護(hù)患者隱私的重要一步。因此,在醫(yī)療數(shù)據(jù)分析項(xiàng)目的早期就做出正確的數(shù)據(jù)管理決策至關(guān)重要。
問題4:您是如何在項(xiàng)目中實(shí)踐數(shù)據(jù)驅(qū)動(dòng)的醫(yī)療策略的,過程經(jīng)歷了什么挑戰(zhàn)?
數(shù)據(jù)驅(qū)動(dòng)的醫(yī)療策略貫穿于醫(yī)療服務(wù)的各個(gè)階段,具體實(shí)施的方法很多,例如使用預(yù)測分析技術(shù)來幫助可視化患者的健康趨勢。在開發(fā)健康數(shù)據(jù)分析軟件時(shí),我作為主要分析師參與設(shè)計(jì)了軟件系統(tǒng)里面的數(shù)據(jù)分析和預(yù)測模塊。在此方案中,我通過患者數(shù)據(jù)的時(shí)間序列分析,研究了不同治療方案和生活方式改變對疾病進(jìn)展的影響,以及各種風(fēng)險(xiǎn)因素對并發(fā)癥發(fā)生的影響。最終我們選擇了一個(gè)能最大程度減少并發(fā)癥風(fēng)險(xiǎn)的干預(yù)方案,并開發(fā)了個(gè)性化的患者管理模塊。這些都說明了數(shù)據(jù)分析對醫(yī)療決策的重要性,該健康數(shù)據(jù)分析軟件系統(tǒng)最終得到了國家的認(rèn)可,順利拿到了軟件著作權(quán)。
另外,我參與了一個(gè)由Kaggle平臺(tái)組織的創(chuàng)新藥物篩選數(shù)據(jù)分析競賽。這個(gè)競賽旨在通過預(yù)測靶蛋白的結(jié)合性來輔助篩選藥物的初級階段。2024年,我作為數(shù)據(jù)分析團(tuán)隊(duì)的主要成員之一,參與研究了如何利用機(jī)器學(xué)習(xí)技術(shù)來預(yù)測未知化合物與特定蛋白靶點(diǎn)的結(jié)合親和力。
在這個(gè)項(xiàng)目中,我們面對的是一個(gè)名為BELKA(Big Encoded Library for Chemical Assessment)的大規(guī)模數(shù)據(jù)集,其中包含了約1.33億個(gè)小分子與三種蛋白靶點(diǎn)相互作用的實(shí)驗(yàn)數(shù)據(jù)。這個(gè)數(shù)據(jù)集的規(guī)模遠(yuǎn)超過現(xiàn)有的公開數(shù)據(jù)集,為我們提供了一個(gè)難得的機(jī)會(huì)來開發(fā)先進(jìn)的預(yù)測模型。在項(xiàng)目過程中,我們面臨了多方面的挑戰(zhàn):首先是如何有效處理如此海量的數(shù)據(jù);其次是如何選擇合適的分子表示方法;最后是如何構(gòu)建準(zhǔn)確的預(yù)測模型。針對這些挑戰(zhàn),我在數(shù)據(jù)處理和模型構(gòu)建上進(jìn)行了大量的實(shí)驗(yàn)和優(yōu)化。例如,在數(shù)據(jù)預(yù)處理階段,我們開發(fā)了一套高效的數(shù)據(jù)清洗和特征提取流程,能夠快速處理SMILES格式的分子結(jié)構(gòu)數(shù)據(jù)。在分子表示方法上,我們嘗試了包括圖神經(jīng)網(wǎng)絡(luò)、3D卷積神經(jīng)網(wǎng)絡(luò)等多種先進(jìn)技術(shù),以捕捉分子的結(jié)構(gòu)信息。在模型構(gòu)建方面,我們探索了從傳統(tǒng)機(jī)器學(xué)習(xí)到深度學(xué)習(xí)的多種算法,并通過集成學(xué)習(xí)等方法來提高模型的泛化能力。這些努力都是為了構(gòu)建一個(gè)能夠準(zhǔn)確預(yù)測小分子與蛋白靶點(diǎn)結(jié)合親和力的模型,從而加速藥物發(fā)現(xiàn)過程。我們的工作不僅有助于在vast的化學(xué)空間中更高效地搜索潛在藥物分子,還為計(jì)算機(jī)輔助藥物設(shè)計(jì)領(lǐng)域貢獻(xiàn)了新的方法和見解。
打開網(wǎng)易新聞 查看精彩圖片
吳柳潔女士進(jìn)行日常數(shù)據(jù)分析和數(shù)據(jù)挖掘工作的場景問題5:對于全球醫(yī)療問題,未來醫(yī)療數(shù)據(jù)分析專家最大的挑戰(zhàn)是什么?
我認(rèn)為醫(yī)療數(shù)據(jù)分析專家肩負(fù)著推動(dòng)精準(zhǔn)醫(yī)療發(fā)展的重任,應(yīng)與醫(yī)療機(jī)構(gòu)攜手實(shí)施數(shù)據(jù)驅(qū)動(dòng)的醫(yī)療模式,這需要各方的共同努力和共識。盡管數(shù)據(jù)收集和分析系統(tǒng)的初期投入較高,但長遠(yuǎn)來看,對數(shù)據(jù)分析的投資會(huì)通過提高醫(yī)療質(zhì)量、降低醫(yī)療成本等方式得到回報(bào),其實(shí)更加經(jīng)濟(jì)實(shí)惠。此外,過去人們常認(rèn)為數(shù)據(jù)分析會(huì)使醫(yī)療失去人性化,難以同時(shí)實(shí)現(xiàn)精準(zhǔn)和溫暖。然而,通過創(chuàng)新技術(shù)應(yīng)用和嚴(yán)格的倫理把控,我們能夠證明數(shù)據(jù)驅(qū)動(dòng)的醫(yī)療同樣可以人性化和個(gè)性化。我的親身經(jīng)歷和眾多優(yōu)秀案例都證明了這一點(diǎn)。
通過此次訪談,我們深入了解了數(shù)據(jù)分析和挖掘在醫(yī)療領(lǐng)域的巨大潛力,同時(shí)也獲得了吳柳潔女士在學(xué)習(xí)、工作方面的寶貴經(jīng)驗(yàn),以及她對醫(yī)療數(shù)據(jù)分析的獨(dú)特見解。作為重慶理工大學(xué)的優(yōu)秀畢業(yè)生,我們期待吳柳潔女士在未來取得更大的職業(yè)發(fā)展和科研成就。我們也希望她能夠促進(jìn)中英兩國的科研交流,進(jìn)一步推動(dòng)數(shù)據(jù)分析在醫(yī)療領(lǐng)域的應(yīng)用和發(fā)展。
通訊員:周旭