首頁(yè) 資訊 語(yǔ)音識(shí)別在移動(dòng)醫(yī)療領(lǐng)域的探索

語(yǔ)音識(shí)別在移動(dòng)醫(yī)療領(lǐng)域的探索

來(lái)源:泰然健康網(wǎng) 時(shí)間:2024年12月07日 22:46

作者Dr.2,MediCool醫(yī)庫(kù)軟件公司董事長(zhǎng)

      隨著計(jì)算機(jī)技術(shù)的發(fā)展,人機(jī)交互的方式也在不斷變革,智能語(yǔ)音的發(fā)展更是為我們的生活及工作方式帶來(lái)了新的變革,其每一步創(chuàng)新都帶給我們更好的用戶體驗(yàn)和更高的交互效率。語(yǔ)音識(shí)別即通過(guò)麥克風(fēng)捕捉用戶發(fā)出的聲音,將聲波信號(hào)轉(zhuǎn)換成機(jī)器可以處理的“發(fā)音特征”,再?gòu)陌l(fā)音和語(yǔ)言的“模型空間”中快速搜索最匹配的句子,即識(shí)別結(jié)果。

      基于語(yǔ)音識(shí)別的原理:語(yǔ)音識(shí)別過(guò)程就是一個(gè)模型匹配的過(guò)程,模型訓(xùn)練的好壞直接關(guān)系到系統(tǒng)識(shí)別的結(jié)果,圖為語(yǔ)音識(shí)別模型匹配的過(guò)程:

      為了得到一個(gè)好的模型,往往需要有大量的原始語(yǔ)音數(shù)據(jù)來(lái)訓(xùn)練這個(gè)語(yǔ)音模型,特別是對(duì)于非特定人的語(yǔ)音識(shí)別系統(tǒng)來(lái)說(shuō),這一點(diǎn)顯得更為重要。因此,在開始進(jìn)行語(yǔ)音識(shí)別研究之前,首先要建立一個(gè)語(yǔ)音數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)包括不同性別、年齡、口音的說(shuō)話人的聲音,并且必須具有代表性,能均衡地反映實(shí)際使用情況。模型訓(xùn)練就是指按照一定的準(zhǔn)則,從大量已知模式中獲取表征該模式本質(zhì)特征的模型參數(shù)。

      目前在醫(yī)學(xué)領(lǐng)域并沒有專門的語(yǔ)音識(shí)別詞庫(kù)和模型,由于醫(yī)學(xué)術(shù)語(yǔ)、藥物名稱、疾病名稱等用詞的專業(yè)性很強(qiáng),因此識(shí)別率會(huì)大幅下降。Dr.2同學(xué)帶了一個(gè)小組的人,耗費(fèi)了7個(gè)月的時(shí)間,分別于IOS平臺(tái)和Android平臺(tái),采用科大訊飛和云之聲兩個(gè)主流第三方SDK,對(duì)藥品詞庫(kù)的36176個(gè)藥品名稱和疾病詞庫(kù)的23501個(gè)疾病名進(jìn)行了測(cè)試,訓(xùn)練出錯(cuò)率較高的詞匯,初步搭建了醫(yī)學(xué)語(yǔ)音識(shí)別領(lǐng)域的第三方素材庫(kù),并決定免費(fèi)開放給任何有志于開發(fā)移動(dòng)醫(yī)療APP 的創(chuàng)業(yè)團(tuán)隊(duì)和個(gè)人。共同構(gòu)建醫(yī)學(xué)語(yǔ)音識(shí)別體系,避免重復(fù)投資,減少整個(gè)社會(huì)的資源浪費(fèi)。

       下面以Android為例,具體介紹我們構(gòu)建體系的流程、標(biāo)準(zhǔn)和測(cè)試方法。以下方法可以幫助各位移動(dòng)醫(yī)療開發(fā)人員快速上手:

測(cè)試平臺(tái):2臺(tái)android4.0系統(tǒng)手機(jī)(小米2、中興U930HD)、珍立拍系統(tǒng)、科大訊飛SDK

      小 組: A組和B組

      測(cè)試方法:對(duì)所有藥品和疾病名稱進(jìn)行反復(fù)測(cè)試,使用糾正訓(xùn)練法,來(lái)克服語(yǔ)音識(shí)別體系中HMM的訓(xùn)練效果。小組A測(cè)試藥品,小組B測(cè)試疾病,普通話識(shí)別。

      測(cè)試步驟

      1、醫(yī)學(xué)詞匯約有數(shù)十萬(wàn)條,前期總結(jié)查找篩選最常用詞匯并分組。

      2、使用珍立拍系統(tǒng)中的語(yǔ)音識(shí)別對(duì)所有詞庫(kù)進(jìn)行第一遍測(cè)試。

      3、在第一遍測(cè)試的基礎(chǔ)上,對(duì)篩選出來(lái)錯(cuò)誤的詞匯進(jìn)行二次測(cè)試,再次篩選。

      4、總結(jié)出識(shí)別易錯(cuò)詞匯,兩組交叉測(cè)試后,隨后交給程序人員,按科大訊飛SDK模型訓(xùn)練,輸入相應(yīng)代碼,完善建庫(kù)。

測(cè)試統(tǒng)計(jì)結(jié)果:

       可能存在的影響因素

      1、讀錯(cuò):由于醫(yī)學(xué)詞匯中有很多較為生僻的漢字,讀錯(cuò)很難避免,很多醫(yī)生即使會(huì)寫這個(gè)詞,但是發(fā)音也可能會(huì)錯(cuò)。

       規(guī)避方法:遇到拿捏不準(zhǔn)的漢字時(shí),查找準(zhǔn)確讀音,盡量避免錯(cuò)誤。

      2、環(huán)境因素:測(cè)試時(shí),所處的環(huán)境存在噪音。

       規(guī)避方法:選擇在低噪音環(huán)境中測(cè)試,但不能完全于安靜的環(huán)境中測(cè)試,因其與日常使用環(huán)境不符。

      3、漢字的同音字:例如:弱視、蕁麻疹,識(shí)別結(jié)果:若是、尋麻疹。

      4、漢字尾音:例如:肝癌,識(shí)別結(jié)果:剛來(lái)。

      5、實(shí)際發(fā)音影響:例如:阻生齒,識(shí)別結(jié)果:主生殖。

下面以疾病詞匯舉例

測(cè)試小結(jié)

       由統(tǒng)計(jì)結(jié)果可以看出疾病名的識(shí)別率高于藥品名,筆者分析,造成此結(jié)果的原因是:疾病名的廣普率要高于藥品名,所以各個(gè)語(yǔ)音識(shí)別公司比較重視,而且疾病生僻漢字較少,而藥品種類要遠(yuǎn)多于疾病種類,其中生僻漢字也較多。二次測(cè)試的正確率較一次測(cè)試大約提升了一個(gè)百分點(diǎn)左右,還是可以適當(dāng)減少錯(cuò)誤數(shù)據(jù)庫(kù)中的詞匯量。

      音節(jié)短的詞出錯(cuò)率較高,如:?jiǎn)我艄?jié)詞,痣(識(shí)別結(jié)果:志),雙音節(jié)詞,義眼(識(shí)別結(jié)果:一眼),長(zhǎng)音節(jié)詞出錯(cuò)率低,原因可能是音節(jié)越短的詞,其同音節(jié)的普通詞較其更常見,而且如果其尾音特殊的話,影響較大。

討論

       針對(duì)醫(yī)學(xué)專業(yè)詞匯識(shí)別率低的問(wèn)題,目前可使用以下三種解決辦法:

一、 擴(kuò)充自定義詞庫(kù)

      雖然有用戶詞表,但是目前科大訊飛用戶詞表僅限數(shù)量2000,經(jīng)溝通后他們正在擴(kuò)大詞匯表數(shù)量中。但如果數(shù)據(jù)過(guò)大,將會(huì)導(dǎo)致數(shù)據(jù)包過(guò)重的問(wèn)題,而移動(dòng)端由于存儲(chǔ)和運(yùn)算能力受限,所以無(wú)法滿足數(shù)量龐大的整個(gè)醫(yī)學(xué)詞庫(kù),因此我們只能先做常用庫(kù)。

二、 搭建第三方素材庫(kù)

       語(yǔ)音識(shí)別雖然在實(shí)用性上已得到很大提高,但是由于目前語(yǔ)音識(shí)別的單一性(只能單純的識(shí)別中文或者英文),以及使用環(huán)境、語(yǔ)音差異化等因素的影響,容易造成識(shí)別錯(cuò)誤。就這些因素而言,我們?yōu)榇俗隽舜罅康幕A(chǔ)工作,用于搭建第三方數(shù)據(jù)庫(kù),在盡可能排除其它干擾因素的情況下,檢測(cè)出識(shí)別錯(cuò)誤的詞匯,也為下一步構(gòu)建專業(yè)領(lǐng)域的識(shí)別模型搭建出了樣本數(shù)據(jù)庫(kù)(針對(duì)大量樣本數(shù)據(jù)庫(kù),精簡(jiǎn)出識(shí)別錯(cuò)誤的小樣本數(shù)據(jù)庫(kù),減少模型訓(xùn)練詞庫(kù))。

三、 構(gòu)建專業(yè)領(lǐng)域的識(shí)別模型

       對(duì)于有大量專業(yè)詞匯的識(shí)別系統(tǒng)來(lái)說(shuō),使用模型訓(xùn)練可以有效提升識(shí)別率,目前模型訓(xùn)練比較常用的有四種方法:最大似然估計(jì)、糾正訓(xùn)練法、最小分類錯(cuò)誤、最大互信息方法。模型訓(xùn)練需要專業(yè)的技術(shù),并與語(yǔ)音識(shí)別公司進(jìn)行合作,由企業(yè)提供詞庫(kù)信息和語(yǔ)音集,專業(yè)人員采用模型訓(xùn)練對(duì)需要識(shí)別的詞庫(kù)進(jìn)行訓(xùn)練,最終給出個(gè)性化定制的識(shí)別模型,以提升識(shí)別率。

       語(yǔ)音識(shí)別技術(shù)在移動(dòng)醫(yī)療領(lǐng)域中的應(yīng)用會(huì)越來(lái)越普遍,但還有大量的基礎(chǔ)工作需要我們大家齊心協(xié)力去完成,Dr.2衷心希望業(yè)內(nèi)的精英之士能夠?qū)Υ硕嘟涣?,多合作,拋開一些利益的糾葛,共同為行業(yè)的發(fā)展貢獻(xiàn)出自己的力量。

(轉(zhuǎn)載請(qǐng)注明作者:Dr.2,愿意與Dr.2交流的請(qǐng)加微信號(hào):1340603421)

 返回搜狐,查看更多

責(zé)任編輯:

相關(guān)知識(shí)

移動(dòng)醫(yī)療領(lǐng)域中的頭部玩家
心理咨詢?cè)诰€,探索現(xiàn)代心理健康的新領(lǐng)域
人工智能在老年醫(yī)療中的應(yīng)用探索.pptx
守護(hù)人類健康:人工智能賦能醫(yī)療領(lǐng)域創(chuàng)新應(yīng)用
人工智能在醫(yī)療健康領(lǐng)域中的應(yīng)用
中國(guó)移動(dòng)5G,為醫(yī)療健康領(lǐng)域帶來(lái)六大機(jī)遇
安徽移動(dòng)賦能智慧醫(yī)療 讓百姓健康更有“醫(yī)”靠
健康大講堂:人工智能時(shí)代下醫(yī)療健康領(lǐng)域的新探索
中國(guó)移動(dòng)攜手醫(yī)療界共建“健康中國(guó)” 探索大數(shù)據(jù)產(chǎn)業(yè)應(yīng)用新方向
探索醫(yī)療科技領(lǐng)域未來(lái)的發(fā)展趨勢(shì)

網(wǎng)址: 語(yǔ)音識(shí)別在移動(dòng)醫(yī)療領(lǐng)域的探索 http://www.u1s5d6.cn/newsview348353.html

推薦資訊