真正意義上的人工智能時代已經來臨,
其中語音識別智能技術在其中扮演著重要的角色,
以最近阿里、谷歌等企業不斷發力的語音識別智能音箱為例,
有了這種語音識別音箱,
wq可以擺脫對各種按鈕和所謂的手機APP的依賴,
只需要通過“對話”就能夠對其進行操控,使用過程中可謂妙趣橫生。
事實上近兩年來,智能電視、智能手表等智能產品,
大多實現了語音識別操控。
在這種語音識別技術的實現過程中,
以YQ5969語音識別模組為代表的相關組件扮演了重要的角色,
該語音識別模組起著將語音轉化成被設備識別的信號的作用,
就相當于人的耳朵和大腦。
YQ5969語音識別模組是一種最簡單的在傳統
HMM-GMM 系統中應用神經網絡的方法。
該語音識別模組使用神經網路進行特征學習。
這樣的方法不用修改已有的語音識別框架,
可以在不大改系統的基礎上提高系統的性能。
該語音識別模組利用DNN進行串聯 (tandem) 特征提取,
串聯特征首先使用神經網絡分類器估算音素的后驗概率,
然后將網絡輸出的向量通過 PCA 做正交化作為
HMM-GMM 系統輸入的特征。
這樣的串聯方法在串聯特征中使用了層次化的結構,
將原來單一的神經網絡替換為多個神經網絡,
分別被訓練為具有不同的功能而又層次化地組織在一起。
這種方法比原有單一神經網絡的參數規模少,訓練時間更短,
同時獲得了更好的性能。
值得一提的是,YQ5969語音識別模組還是一個“順風耳”,
在5米甚至10米的距離內能夠精準識別出人的聲音,
在沒有網絡的情況下,
該語音識別模組也可以按照人們發出的語音執行相關操作。
正是憑借著這一優勢,
該語音識別模組在越來越多的智能設備中開始得以運用。
http:///
肖先生 微信:dao91123