語音識別——智能硬件產(chǎn)品人機交互模式之一
語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別是一門涉及面很廣的交叉學科,它與聲學、語音學、語言學、信息理論、模式識別理論以及神經(jīng)生物學等學科都有非常密切的關(guān)系。語音識別技術(shù)正逐步成為計算機信息處理技術(shù)中的關(guān)鍵技術(shù),語音技術(shù)的應(yīng)用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。
近兩年人工智能快速發(fā)展,語音識別開始成為很多設(shè)備的標配,以語音識別為技術(shù)基礎(chǔ)的硬件設(shè)備成為新的風口,尤其是智能音箱的出現(xiàn)受到行業(yè)及消費者的普遍歡迎。國外微軟、蘋果、谷歌、nuance,國內(nèi)的科大訊飛、思必馳等廠商都在研發(fā)語音識別新策略新算法,似乎人類與語音的自然交互漸行漸近。
語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別是一門涉及面很廣的交叉學科,它與聲學、語音學、語言學、信息理論、模式識別理論以及神經(jīng)生物學等學科都有非常密切的關(guān)系。語音識別技術(shù)正逐步成為計算機信息處理技術(shù)中的關(guān)鍵技術(shù),語音技術(shù)的應(yīng)用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。
所謂“語音識別”,就是利用電子計算機等機械裝置來識別人講話的意義和內(nèi)容。20世紀50代,就有人提出“口授打印機”的設(shè)恕。可以說,這是有關(guān)語音識別技術(shù)最早構(gòu)想。
語音識別技術(shù)經(jīng)歷了語音識別、語音合成以及自然語音合成3個階段。從原理上講,似乎讓計算機識別人的語言并不難,其實困難還是不少的。例如,不同的人讀同一個詞所發(fā)出的音在聲學特征上卻不完全相同;即便是同一個人,右不同情況下對同一個字的發(fā)音也不相同。加上人們講話時常有不合語法規(guī)律的情況,有時還夾雜些俗語,或省略一些詞語,而且語速變化不定。所有這些,在我們聽別人講話時似乎都不成為問題,但讓機器理解則很是困難。近年來,由于計算機功能的日益強大,存儲技術(shù)、語音算法技術(shù)和信號處理技術(shù)的長足進步,以及軟件編程水平的提高,語音識別技術(shù)已經(jīng)取得突破性的進展,使它的廣泛應(yīng)用成為可能。
語音識別技術(shù)的應(yīng)用主要有以下兩個方面。一是用于人機交流。目前這方面應(yīng)用的呼聲很高,因為使用鍵盤、鼠標與電子計算機進行交流的這種方式,使許多非專業(yè)人員,特別是不懂英語或不熟悉漢語拼音的人被拒之于門外,影響到電子計算機的進一步普及。語音識別技術(shù)的采用,改變了人與計算機的互動模式,人們只需動動口,就能打開或關(guān)閉程序,改變工作界面。這種使電腦人性化的結(jié)果是使人的雙手得到解放,使每個人都能操作和應(yīng)用計算機。電話仍是目前使用最為普遍的通信工具,通過電話與語音識別系統(tǒng)的協(xié)同工作,可以實現(xiàn)語音撥號、電話購物以及通過電話辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。不久,能按主人口令接通電話、打開收音機,以及通過聲紋識別來者身份的安全系統(tǒng)也將獲得應(yīng)用。
語音識別技術(shù)的另一方面應(yīng)用便是語音輸入和合成語音輸出。現(xiàn)在,已經(jīng)出現(xiàn)能將口述的文稿輸入計算機并按指定格式編排的語音軟件,它比通過鍵盤輸入在速度上要提高2~4倍。裝有語音軟件的電腦還能通過語音合成把計算機里的文件用各種語言“讀”出來,這將大大推進遠程通信和網(wǎng)絡(luò)電話的發(fā)展。
在現(xiàn)階段,語音技術(shù)主要用于電子商務(wù)、客戶服務(wù)和教育培訓等領(lǐng)域,它對于節(jié)省人力、時間,提高工作效率將起到明顯的作用。能實現(xiàn)自動翻譯的語音識別系統(tǒng)目前也正在研究、完善之中。
隨著技術(shù)不斷發(fā)展突破,語音識別在國內(nèi)外市場將獲得更大發(fā)展空間。拓墣產(chǎn)業(yè)研究院研究指出,全球語音辨識產(chǎn)值將呈現(xiàn)高速成長,自2016年的26.13億美元,至2021年成長為159.79億美元,年復合成長率達43.64%;國內(nèi)市場方面,據(jù)前瞻產(chǎn)業(yè)研究院預計,到2021年,中國生物識別行業(yè)的市場規(guī)模將突破340億元,其中語音識別占比將達到22.4%。
因此,語音識別可以說是生物識別領(lǐng)域中技術(shù)較成熟、商業(yè)化程度較高的細分領(lǐng)域之一,語音識別技術(shù)憑借成本與算法復雜程度低,采集方便等優(yōu)勢,在許多行業(yè)得到了應(yīng)用。人工智能時代的語音識別技術(shù)也給安防行業(yè)帶來了“新鮮血液”。
在監(jiān)控領(lǐng)域,隨著平安城市項目建設(shè)的推進,音頻監(jiān)控在城市安防系統(tǒng)中的應(yīng)用越來越多。音頻監(jiān)控作為安防行業(yè)近年來迅速發(fā)展的一個分支,目前已展現(xiàn)出前所未有的勃勃生機,人們開始從能夠看見和聽見的需求轉(zhuǎn)向?qū)で蟾哔|(zhì)量的音視頻監(jiān)控。例如,公檢法機構(gòu)、機場、鐵路、銀行等領(lǐng)域的安防工程需要清晰、逼真的影音同步監(jiān)控系統(tǒng),以彌補視頻監(jiān)控的不足,音頻監(jiān)控的加入就使得監(jiān)控不再只是上演“無聲電影”,工作人員通過音頻監(jiān)控設(shè)備“聽懂”周圍環(huán)境,對危險事件和意外事件進行安全防范。搭載語音識別技術(shù)的音頻監(jiān)控已經(jīng)成為安防行業(yè)的新亮點。
相關(guān)知識
智能語音交互
語音識別控制芯片——開啟智能交互的新時代
智能語音識別技術(shù):賦能人工智能應(yīng)用新篇章
智能語音交互系統(tǒng):讓溝通無界限的未來科技
百度醫(yī)生APP“語音導診”上線 開啟智能識別導診新模式
語音識別
以人體健康數(shù)據(jù)、語音交互切入,可穿戴設(shè)備品牌「埃微」要讓產(chǎn)品更專業(yè)
什么是智能語音服務(wù)(智能語音服務(wù)介紹)
電銷機器人=AI人工智能+語音識別技術(shù)+語音知識庫+話術(shù)邏輯+智能學習
眼部按摩儀語音控制方案:NRK3301語音識別芯片
網(wǎng)址: 語音識別——智能硬件產(chǎn)品人機交互模式之一 http://www.u1s5d6.cn/newsview682445.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826