真正意義上的人工智能時(shí)代已經(jīng)來臨,
其中語音識別智能技術(shù)在其中扮演著重要的角色,
以最近阿里、谷歌等企業(yè)不斷發(fā)力的語音識別智能音箱為例,
有了這種語音識別音箱,
wq可以擺脫對各種按鈕和所謂的手機(jī)APP的依賴,
只需要通過“對話”就能夠?qū)ζ溥M(jìn)行操控,使用過程中可謂妙趣橫生。
事實(shí)上近兩年來,智能電視、智能手表等智能產(chǎn)品,
大多實(shí)現(xiàn)了語音識別操控。
在這種語音識別技術(shù)的實(shí)現(xiàn)過程中,
以YQ5969語音識別模組為代表的相關(guān)組件扮演了重要的角色,
該語音識別模組起著將語音轉(zhuǎn)化成被設(shè)備識別的信號的作用,
就相當(dāng)于人的耳朵和大腦。
YQ5969語音識別模組是一種最簡單的在傳統(tǒng)
HMM-GMM 系統(tǒng)中應(yīng)用神經(jīng)網(wǎng)絡(luò)的方法。
該語音識別模組使用神經(jīng)網(wǎng)路進(jìn)行特征學(xué)習(xí)。
這樣的方法不用修改已有的語音識別框架,
可以在不大改系統(tǒng)的基礎(chǔ)上提高系統(tǒng)的性能。
該語音識別模組利用DNN進(jìn)行串聯(lián) (tandem) 特征提取,
串聯(lián)特征首先使用神經(jīng)網(wǎng)絡(luò)分類器估算音素的后驗(yàn)概率,
然后將網(wǎng)絡(luò)輸出的向量通過 PCA 做正交化作為
HMM-GMM 系統(tǒng)輸入的特征。
這樣的串聯(lián)方法在串聯(lián)特征中使用了層次化的結(jié)構(gòu),
將原來單一的神經(jīng)網(wǎng)絡(luò)替換為多個(gè)神經(jīng)網(wǎng)絡(luò),
分別被訓(xùn)練為具有不同的功能而又層次化地組織在一起。
這種方法比原有單一神經(jīng)網(wǎng)絡(luò)的參數(shù)規(guī)模少,訓(xùn)練時(shí)間更短,
同時(shí)獲得了更好的性能。
值得一提的是,YQ5969語音識別模組還是一個(gè)“順風(fēng)耳”,
在5米甚至10米的距離內(nèi)能夠精準(zhǔn)識別出人的聲音,
在沒有網(wǎng)絡(luò)的情況下,
該語音識別模組也可以按照人們發(fā)出的語音執(zhí)行相關(guān)操作。
正是憑借著這一優(yōu)勢,
該語音識別模組在越來越多的智能設(shè)備中開始得以運(yùn)用。
http:///
肖先生 微信:dao91123