儀表保護(hù)箱如何分類及應(yīng)用(儀表保護(hù)箱如何分類及應(yīng)用圖片) 羊角梳子和牛角梳子哪個(gè)更好(銀梳子和牛角梳哪個(gè)好) 進(jìn)出口貿(mào)易怎么做(外貿(mào)出口流程) kingsoft是什么意思可以刪除嗎(kingsoft可以刪除) 淘寶試用攻略(淘寶試用攻略在哪里看) 嬰兒鬧夜有什么好辦法(嬰兒鬧夜有什么好辦法緩解) 如何重新激活淘寶店鋪及發(fā)布寶貝(如何重新激活淘寶店鋪及發(fā)布寶貝的權(quán)限) 沖鋒衣如何選購(gòu)全攻略(沖鋒衣購(gòu)買指南) 藍(lán)色生死戀演員表恩熙小時(shí)候(藍(lán)色生死戀演員表) QQ如何打開(kāi)電臺(tái)隨機(jī)播放(QQ音樂(lè)怎么開(kāi)電臺(tái)) 如何怎么下載安裝steam平臺(tái)(steam平臺(tái)游戲安裝教程) 大地保險(xiǎn)車險(xiǎn)報(bào)案電話(大地保險(xiǎn)車險(xiǎn)怎么樣) 武昌魚清蒸的做法(武昌魚清蒸的做法幾分鐘) 常用的招聘網(wǎng)站有哪些(現(xiàn)在招聘都用什么網(wǎng)站) 雨愛(ài)吉他譜彈唱原版(雨愛(ài)吉他譜簡(jiǎn)單版) 海帶打結(jié)的作用(海帶打結(jié)的作用原理) 電腦怎么制作表格新手 初學(xué)者(怎樣制作表格) 暴走英雄壇丐幫入門任務(wù)攻略流程(暴走英雄壇丐幫入門任務(wù)攻略流程視頻) 最簡(jiǎn)單的iPhone鈴聲設(shè)置方法(iphone鈴聲怎樣設(shè)置) 如何做好一個(gè)保險(xiǎn)律師(如何做好一個(gè)保險(xiǎn)律師助理) 手閱怎么進(jìn)行提現(xiàn)賬號(hào)設(shè)置(掌閱能提現(xiàn)嗎) 聯(lián)想A366T獲取Root權(quán)限詳細(xì)圖文教程 一個(gè)人筆仙游戲怎么玩(筆仙游戲怎么玩圖片) 手動(dòng)蝶閥怎么看開(kāi)關(guān)(手動(dòng)蝶閥怎么看開(kāi)關(guān)工具) 如何下載【武林外傳】(武林外傳在哪里可以免費(fèi)下載) 燙金字怎么做(燙金字) 如何讓茶樓加盟店生意更好?(如何讓茶樓加盟店生意更好些) 如何判斷qq是否隱身(怎么看QQ是否隱身) 80平米兩室一廳裝修(8度) 瓷磚的色彩應(yīng)該如何搭配?(瓷磚的色彩應(yīng)該如何搭配好看) 微觀經(jīng)濟(jì)學(xué)的定義是什么(微觀經(jīng)濟(jì)學(xué)的定義) 書包背帶怎么系(書包背帶怎么系不會(huì)掉) 研究發(fā)現(xiàn)與巴頓病有關(guān)的蛋白質(zhì)對(duì)于產(chǎn)生新的溶酶體至關(guān)重要 研究人員開(kāi)發(fā)了一種新型抗炎藥 NLRP1 和 NLRP3 炎癥小體抑制劑 聲明概述了心臟腫瘤護(hù)理和研究方面的不平等 全心全意為人民服務(wù)(全心全意) 360手機(jī)助手怎么下載(360手機(jī)助手怎么下載軟件到電腦) 懷孕期間使用 THC 與胎兒發(fā)育的變化有關(guān) 研究發(fā)現(xiàn)空氣質(zhì)量差會(huì)以多種方式影響心理健康 研究揭示了后來(lái)患上幼年特發(fā)性關(guān)節(jié)炎的兒童腸道細(xì)菌的差異 研究證明微生物群移植療法對(duì)干細(xì)胞移植和白血病患者的安全性 熱量:人體能承受多少熱量 了解甲型 乙型 丙型 丁型和戊型肝炎之間的區(qū)別 蜱蟲季節(jié)即將開(kāi)始 它們出現(xiàn)在新的地方 怎么做松鼠桂魚 漢語(yǔ)拼音的音節(jié)是什么(漢語(yǔ)拼音中什么叫音節(jié)) qq如何查看我的勛章墻(怎么看qq我的勛章墻) 牡丹鸚鵡的主要食物有哪些?(牡丹鸚鵡的主要食物有哪些呢) 求發(fā)財(cái)路子(求發(fā)財(cái)之路) 怎么在sci上發(fā)表文章(怎么能發(fā)表sci)
您的位置:首頁(yè) >綜合知識(shí) >

語(yǔ)音識(shí)別系統(tǒng)的原理是什么?

導(dǎo)讀 關(guān)于語(yǔ)音識(shí)別系統(tǒng)的原理是什么?這個(gè)問(wèn)題很多朋友還不知道,今天小六來(lái)為大家解答以上的問(wèn)題,現(xiàn)在讓我們一起來(lái)看看吧!1、我們可以設(shè)想,

關(guān)于語(yǔ)音識(shí)別系統(tǒng)的原理是什么?這個(gè)問(wèn)題很多朋友還不知道,今天小六來(lái)為大家解答以上的問(wèn)題,現(xiàn)在讓我們一起來(lái)看看吧!

1、我們可以設(shè)想,在不久的將來(lái)坐在辦公司里的經(jīng)理會(huì)對(duì)電腦說(shuō):“嗨!伙計(jì),幫我通知一下公司所有員工,今天下午3:00準(zhǔn)時(shí)開(kāi)會(huì)。

2、”這是科學(xué)家在幾十年前的設(shè)想,語(yǔ)音識(shí)別長(zhǎng)久以來(lái)一直是人們的美好愿望,讓計(jì)算機(jī)領(lǐng)會(huì)人所說(shuō)的話,實(shí)現(xiàn)人機(jī)對(duì)話是發(fā)展人機(jī)通信的主要目標(biāo)。

3、進(jìn)入2l世紀(jì),隨著計(jì)算機(jī)的日益普及,怎樣給不熟悉計(jì)算機(jī)的人提供一個(gè)友好而又簡(jiǎn)易的操作平臺(tái),是我們非常感興趣的問(wèn)題,而語(yǔ)音識(shí)別技術(shù)就是其中最直接的方法之一。

4、  20世紀(jì)80年代中期以來(lái),新技術(shù)的逐漸成熟和發(fā)展使語(yǔ)音識(shí)別技術(shù)有了實(shí)質(zhì)性的進(jìn)展,尤其是隱馬爾可夫模型(HMM)的研究和廣泛應(yīng)用,推動(dòng)了語(yǔ)音識(shí)別的迅速發(fā)展,同時(shí),語(yǔ)音識(shí)別領(lǐng)域也正處在一個(gè)黃金開(kāi)發(fā)的關(guān)鍵時(shí)期,各國(guó)的開(kāi)發(fā)人員正在向特定人到非特定人,孤立詞匯向連接詞,小詞匯量向大詞匯量來(lái)擴(kuò)展研究領(lǐng)域,可以毫不猶豫地說(shuō),語(yǔ)音識(shí)別會(huì)讓計(jì)算機(jī)變得“善解人意”,許多事情將不再是“對(duì)牛彈琴”,最終用戶的口述會(huì)取代鼠標(biāo),鍵盤這些傳統(tǒng)輸入設(shè)備,只需要用戶的嘴和麥克風(fēng)就能實(shí)現(xiàn)對(duì)計(jì)算機(jī)的絕對(duì)控制。

5、  隱馬爾可夫模型HMM的引入  現(xiàn)在假定HMM是一個(gè)輸出符號(hào)序列的統(tǒng)計(jì)模型,具有N個(gè)狀態(tài)S1,S2?Sn,在一個(gè)周期內(nèi)從一個(gè)狀態(tài)轉(zhuǎn)到另一個(gè)狀態(tài),每次轉(zhuǎn)移時(shí)輸出一個(gè)符號(hào),轉(zhuǎn)移到了哪個(gè)狀態(tài)以及輸出什么符號(hào),分別由狀態(tài)轉(zhuǎn)移概率和轉(zhuǎn)移時(shí)的輸出概率來(lái)決定,由于只能觀測(cè)到輸出符號(hào)序列,不能觀測(cè)到狀態(tài)轉(zhuǎn)移序列,因此成為隱藏的馬爾可夫模型。

6、  2、語(yǔ)音識(shí)別的特點(diǎn)  語(yǔ)音識(shí)別的意思是將人說(shuō)話的內(nèi)容和意思轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列等。

7、與說(shuō)話人的識(shí)別不同,后者主要是識(shí)別和確認(rèn)發(fā)出語(yǔ)音的人而非其中所包含的內(nèi)容。

8、語(yǔ)音識(shí)別的目的就是讓機(jī)器聽(tīng)懂人類口述的語(yǔ)言,包括了兩方面的含義:第一是逐字逐句聽(tīng)懂而不是轉(zhuǎn)化成書面的語(yǔ)言文字;第二是對(duì)作者簡(jiǎn)介:賈聰,中國(guó)地質(zhì)大學(xué)機(jī)械與電子信息學(xué)院。

9、口述語(yǔ)言中所包含的命令或請(qǐng)求加以領(lǐng)會(huì),做出正確回應(yīng),而不僅僅只是拘泥于所有詞匯的正確轉(zhuǎn)換。

10、  3、語(yǔ)音識(shí)別系統(tǒng)的工作流程  一般來(lái)說(shuō),一套完整的語(yǔ)音識(shí)別系統(tǒng)其工作過(guò)程分為7步:①對(duì)語(yǔ)音信號(hào)進(jìn)行分析和處理,除去冗余信息。

11、②提取影響語(yǔ)音識(shí)別的關(guān)鍵信息和表達(dá)語(yǔ)言含義的特征信息。

12、③緊扣特征信息,用最小單元識(shí)別字詞。

13、④按照不同語(yǔ)言的各自語(yǔ)法,依照先后次序識(shí)別字詞。

14、⑤把前后意思當(dāng)作輔助識(shí)別條件,有利于分析和識(shí)別。

15、⑥按照語(yǔ)義分析,給關(guān)鍵信息劃分段落,取出所識(shí)別出的字詞并連接起來(lái),同時(shí)根據(jù)語(yǔ)句意思調(diào)整句子構(gòu)成。

16、⑦結(jié)合語(yǔ)義,仔細(xì)分析上下文的相互聯(lián)系,對(duì)當(dāng)前正在處理的語(yǔ)句進(jìn)行適當(dāng)修正。

17、  4、音識(shí)別系統(tǒng)基本原理框圖及原理  語(yǔ)音識(shí)別系統(tǒng)基本原理結(jié)構(gòu)如圖1所示。

18、語(yǔ)音識(shí)別原理有三點(diǎn):①對(duì)語(yǔ)音信號(hào)中的語(yǔ)言信息編碼是按照幅度譜的時(shí)間變化來(lái)進(jìn)行;②由于語(yǔ)音是可以閱讀的,也就是說(shuō)聲學(xué)信號(hào)可以在不考慮說(shuō)話人說(shuō)話傳達(dá)的信息內(nèi)容的前提下用多個(gè)具有區(qū)別性的、離散的符號(hào)來(lái)表示;③語(yǔ)音的交互是一個(gè)認(rèn)知過(guò)程,所以絕對(duì)不能與語(yǔ)法、語(yǔ)義和用語(yǔ)規(guī)范等方面分裂開(kāi)來(lái)。

19、  預(yù)處理,其中就包括對(duì)語(yǔ)音信號(hào)進(jìn)行采樣、克服混疊濾波、去除部分由個(gè)體發(fā)音的差異和環(huán)境引起的噪聲影響,此外還會(huì)考慮到語(yǔ)音識(shí)別基本單元的選取和端點(diǎn)檢測(cè)問(wèn)題。

20、反復(fù)訓(xùn)練是在識(shí)別之前通過(guò)讓說(shuō)話人多次重復(fù)語(yǔ)音,從原始語(yǔ)音信號(hào)樣本中去除冗余信息,保留關(guān)鍵信息,再按照一定規(guī)則對(duì)數(shù)據(jù)加以整理,構(gòu)成模式庫(kù)。

21、再者是模式匹配,它是整個(gè)語(yǔ)音識(shí)別系統(tǒng)的核心部分,是根據(jù)一定規(guī)則以及計(jì)算輸入特征與庫(kù)存模式之間的相似度,進(jìn)而判斷出輸入語(yǔ)音的意思。

22、  前端處理,先對(duì)原始語(yǔ)音信號(hào)進(jìn)行處理,再進(jìn)行特征提取,消除噪聲和不同說(shuō)話人的發(fā)音差異帶來(lái)的影響,使處理后的信號(hào)能夠更完整地反映語(yǔ)音的本質(zhì)特征提取,消除噪聲和不同說(shuō)話人的發(fā)音差異帶來(lái)的影響,使處理后的信號(hào)能夠更完整地反映語(yǔ)音的本質(zhì)特征。

23、  5、當(dāng)前亟待解決的問(wèn)題  語(yǔ)音識(shí)別系統(tǒng)的性能受到許多因素的影響,包括不同說(shuō)話人的發(fā)音方式、說(shuō)話方式、環(huán)境噪音、傳輸信道衰落等等。

24、具體要解決的問(wèn)題有四點(diǎn):①增強(qiáng)系統(tǒng)的魯棒性,也就是說(shuō)如果條件狀況變得與訓(xùn)練時(shí)很不相同,系統(tǒng)的性能下降不能是突變的。

25、②增加系統(tǒng)的適應(yīng)能力,系統(tǒng)要能穩(wěn)定連續(xù)的適應(yīng)條件的變化,因?yàn)檎f(shuō)話人存在著年齡、性別、口音、語(yǔ)速、語(yǔ)音強(qiáng)度、發(fā)音習(xí)慣等方面的差異。

26、所以,系統(tǒng)應(yīng)該有能力排除掉這些差異。

27、達(dá)到對(duì)語(yǔ)音的穩(wěn)定識(shí)別。

28、③尋求更好的語(yǔ)言模型,系統(tǒng)應(yīng)該在語(yǔ)言模型中得到盡可能多的約束,從而解決由于詞匯量增長(zhǎng)所帶來(lái)的影響。

29、④進(jìn)行動(dòng)力學(xué)建模,語(yǔ)音識(shí)別系統(tǒng)提前假定片段和單詞是相互獨(dú)立的,但實(shí)際上詞匯和音素的線索要求對(duì)反映了發(fā)聲器官運(yùn)動(dòng)模型特點(diǎn)的整合。

30、所以,應(yīng)該進(jìn)行動(dòng)力學(xué)建模,從而將這些信息整合到語(yǔ)音識(shí)別系統(tǒng)中去。

31、  6、統(tǒng)的組成和分類  根據(jù)識(shí)別的對(duì)象不同語(yǔ)音識(shí)別大致上可分為3類:對(duì)孤立詞識(shí)別,對(duì)關(guān)鍵詞識(shí)別和對(duì)連續(xù)語(yǔ)音識(shí)別。

32、其中,孤立詞識(shí)別的任務(wù)是識(shí)別事先已知的孤立的詞;連續(xù)語(yǔ)音識(shí)別的任務(wù)則是識(shí)別任意的連續(xù)語(yǔ)音;連續(xù)語(yǔ)音流中的關(guān)鍵詞檢測(cè)針對(duì)的是連續(xù)語(yǔ)音,但它并不識(shí)別全③部文字,而只是檢測(cè)已知的若干關(guān)鍵詞在何處出現(xiàn),根據(jù)針對(duì)的發(fā)音人,可以把語(yǔ)音識(shí)別技術(shù)分為特定人語(yǔ)音識(shí)別和非特定人語(yǔ)音識(shí)別,前者只能識(shí)別一個(gè)或幾個(gè)人的語(yǔ)音,而后者則可以被任何人使用。

33、  7、語(yǔ)音識(shí)別技術(shù)應(yīng)用領(lǐng)域及前景展望  語(yǔ)音識(shí)別技術(shù)借助飛速發(fā)展的高速信息網(wǎng),可實(shí)現(xiàn)計(jì)算機(jī)的全球聯(lián)網(wǎng)和信息資源共享,因此被廣泛應(yīng)用的系統(tǒng)有:語(yǔ)音輸入和控制系統(tǒng),語(yǔ)音撥號(hào)系統(tǒng)、智能家電及玩具,智能電話查詢系統(tǒng),數(shù)據(jù)庫(kù)檢索等方面,在咨詢服務(wù)、教育等行業(yè),正潛移默化地改變和便利著我們的生活。

34、此外,語(yǔ)音識(shí)別系統(tǒng)還在多媒體手機(jī)、個(gè)人掌上電腦、車載導(dǎo)航器GPS等方面有著巨大的應(yīng)用和市場(chǎng)前景。

35、  8、結(jié)語(yǔ)  語(yǔ)音識(shí)別是非常有發(fā)展?jié)摿Φ囊婚T學(xué)科,你可以設(shè)想。

36、我們平時(shí)生活中很多地方都可以用到它,可以大大便利我們的生活和工作,比如智能手機(jī),智能空調(diào)及冰箱,電動(dòng)門,汽車導(dǎo)航,機(jī)器人控制,醫(yī)療設(shè)施,軍事設(shè)備等。

37、可以毫不夸張的說(shuō),21世紀(jì)將會(huì)是語(yǔ)音識(shí)別廣泛流行和普及的時(shí)代,而語(yǔ)音識(shí)別產(chǎn)品和設(shè)備也會(huì)以其獨(dú)特的魅力引領(lǐng)時(shí)代潮流,成為時(shí)代追逐的寵兒和焦點(diǎn)。

本文分享完畢,希望對(duì)大家有所幫助。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章