語音識(shí)別手藝已經(jīng)成為全球科技大鱷競相追逐的黑科技,也是將來進(jìn)入智能家居、聰明家庭的主要切入點(diǎn),國際巨頭微軟、IBM、蘋果、谷歌一向在語音識(shí)別手藝下足功夫,識(shí)別能力分庭抗禮,IBM以誤碼率低的細(xì)小優(yōu)勢領(lǐng)先行業(yè)。
但近期泛起展轉(zhuǎn),就在此前,近期微軟頒布了一項(xiàng)關(guān)于機(jī)械了解人類說話的主要測試成績,即研究人員獲得了迄今最低語音識(shí)別會(huì)話誤碼率(WER)——6.3%,讓其成功登頂語音識(shí)別最低誤碼率,引起了業(yè)界存眷。
據(jù)領(lǐng)會(huì),該測試是美國國度尺度局(NIST)的2000總機(jī)語音識(shí)別進(jìn)行的使命。咨詢機(jī)構(gòu)Wall Street Pit辯論認(rèn)為,微軟團(tuán)隊(duì)轉(zhuǎn)向“作為行業(yè)尺度的德律風(fēng)語音識(shí)別測試”成就斐然,鞏固了其在語音識(shí)別范疇的霸主地位。 闡明認(rèn)為,微軟取得這一成就來自幾個(gè)方面的勉力:研究人員在本年早些時(shí)辰,應(yīng)用深度神經(jīng)收集手藝博得了一項(xiàng)爭論機(jī)視覺挑戰(zhàn);微軟比來在爭論收集東西包(CNTK)中的成熟案例,也是獲得本次好成就的環(huán)節(jié)構(gòu)成部門。CNTK實(shí)現(xiàn)了“深度進(jìn)修算法”的復(fù)雜優(yōu)化進(jìn)級(jí),運(yùn)行速度比本來晉升一個(gè)數(shù)目級(jí);另一個(gè)環(huán)節(jié)步調(diào)是圖形處理單元的并行練習(xí)能力取得了沖破。
業(yè)內(nèi)助士默示,近年來,大型軟件公司科研經(jīng)費(fèi)有被縮減的趨勢,且更專注于深度神經(jīng)收集的研究,但現(xiàn)實(shí)上,語音識(shí)別手藝的應(yīng)用更早一些。有辯論稱,曩昔20年中,研究顯示的爭論機(jī)語音識(shí)別系統(tǒng)的最高誤碼率甚至達(dá)到過43%,而隨后最超卓的單系統(tǒng)NIST2000總機(jī)誤碼率為6.9%。
在近日于舊金山進(jìn)行的“Interspeech語音通信和手藝國際會(huì)議”上,IBM驕傲地頒布其誤碼率只有6.6%。但此次微軟頒布的6.3%的誤碼率,以微弱優(yōu)勢取勝。
今朝,微軟已經(jīng)擬定出了基于語音平臺(tái)的人機(jī)交互策略,成功構(gòu)建起人工智能的環(huán)節(jié)手藝,讓相關(guān)語音對(duì)話在可穿戴設(shè)備、智妙手機(jī)、聰明家庭、聰明車輛及貿(mào)易辦事中闡揚(yáng)主要感化。
|