韩国资源视频一区二区三区,国语自产精品视频在线第100页

·1、簡介
·2、發(fā)展史

語音識別是一門交叉學(xué)科。近二十年來，語音識別技術(shù)取得顯著進步，開始從實驗室走向市場。人們預(yù)計，未來10年內(nèi)，語音識別技術(shù)將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。語音識別聽寫機在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計算機發(fā)展十件大事之一。很多專家都認(rèn)為語音識別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識別技術(shù)所涉及的領(lǐng)域包括：信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。

1、簡介

　　與機器進行語音交流，讓機器明白你說什么，這是人們長期以來夢寐以求的事情。中國物聯(lián)網(wǎng)校企聯(lián)盟形象得把語音識別[1] 比做為“機器的聽覺系統(tǒng)”[2] 。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)?！≌Z音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面。語音識別技術(shù)車聯(lián)網(wǎng)也得到了充分的引用，例如在翼卡車聯(lián)網(wǎng)中，只需按一鍵通客服人員口述即可設(shè)置目的地直接導(dǎo)航，安全、便捷。

2、發(fā)展史

　　1952年貝爾研究所Davis等人研究成功了世界上第一個能識別10個英文數(shù)字發(fā)音的實驗系統(tǒng)。

　　1960年英國的Denes等人研究成功了第一個計算機語音識別系統(tǒng)。

　　大規(guī)模的語音識別[3] 研究是在進入了70年代以后，在小詞匯量、孤立詞的識別方面取得了實質(zhì)性的進展。

　　進入80年代以后，研究的重點逐漸轉(zhuǎn)向大詞匯量、非特定人連續(xù)語音識別。在研究思路上也發(fā)生了重大變化，即由傳統(tǒng)的基于標(biāo)準(zhǔn)模板匹配的技術(shù)思路開始轉(zhuǎn)向基于統(tǒng)計模型 (HMM）的技術(shù)思路。此外，再次提出了將神經(jīng)網(wǎng)絡(luò)技術(shù)引入語音識別問題的技術(shù)思路。

　　進入90年代以后，在語音識別的系統(tǒng)框架方面并沒有什么重大突破。但是，在語音識別技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進展。

　　DARPA(Defense Advanced Research Projects Agency）是在70年代由美國國防部遠(yuǎn)景研究計劃局資助的一項10年計劃，其旨在支持語言理解系統(tǒng)的研究開發(fā)工作。

　　到了80年代，美國國防部遠(yuǎn)景研究計劃局又資助了一項為期10年的DARPA戰(zhàn)略計劃，其中包括噪聲下的語音識別和會話（口語）識別系統(tǒng)，識別任務(wù)設(shè)定為“（1000單詞）連續(xù)語音數(shù)據(jù)庫管理”。

　　到了90年代，這一DARPA計劃仍在持續(xù)進行中。其研究重點已轉(zhuǎn)向識別裝置中的自然語言處理部分，識別任務(wù)設(shè)定為“航空旅行信息檢索”。

　　日本也在1981年的第五代計算機計劃中提出了有關(guān)語音識別輸入-輸出自然語言的宏偉目標(biāo)，雖然沒能實現(xiàn)預(yù)期目標(biāo)，但是有關(guān)語音識別技術(shù)的研究有了大幅度的加強和進展。

　　1987年起，日本又?jǐn)M出新的國家項目---高級人機口語接口和自動電話翻譯系統(tǒng)。

中國發(fā)展

　　中國的語音識別研究起始于1958年，由中國科學(xué)院聲學(xué)所利用電子管電路識別10個元音。直至1973年才由中國科學(xué)院聲學(xué)所開始計算機語音識別。由于當(dāng)時條件的限制，中國的語音識別研究工作一直處于緩慢發(fā)展的階段。

　　進入80年代以后，隨著計算機應(yīng)用技術(shù)在中國逐漸普及和應(yīng)用以及數(shù)字信號技術(shù)的進一步發(fā)展，國內(nèi)許多單位具備了研究語音技術(shù)的基本條件。與此同時，國際上語音識別技術(shù)在經(jīng)過了多年的沉寂之后重又成為研究的熱點，發(fā)展迅速。就在這種形式下，國內(nèi)許多單位紛紛投入到這項研究工作中去。

　　1986年3月中國高科技發(fā)展計劃（863計劃）啟動，語音識別作為智能計算機系統(tǒng)研究的一個重要組成部分而被專門列為研究課題。在863計劃的支持下，中國開始了有組織的語音識別技術(shù)的研究，并決定了每隔兩年召開一次語音識別的專題會議。從此中國的語音識別技術(shù)進入了一個前所未有的發(fā)展階段。

識別模式

　　這一時期的語音識別方法基本上是采用傳統(tǒng)的模式識別策略。其中以蘇聯(lián)的Velichko和Zagoruyko、日本的迫江和千葉，以及當(dāng)時在美國的板倉等人的研究工作最具有代表性。

　　· 蘇聯(lián)的研究為模式識別應(yīng)用于語音識別這一領(lǐng)域奠定了基礎(chǔ)；

　　· 日本的研究則展示了如何利用動態(tài)規(guī)劃技術(shù)在待識語音模式與標(biāo)準(zhǔn)語音模式之間進行非線性時間匹配的方法；

　　·板倉的研究提出了如何將線性預(yù)測分析技術(shù)（LPC）加以擴展，使之用于語音信號的特征抽取的方法。

數(shù)據(jù)庫

　　在語音識別的研究發(fā)展過程中，相關(guān)研究人員根據(jù)不同語言的發(fā)音特點，設(shè)計和制作了以漢語（包括不同方言）、英語等各類語言的語音數(shù)據(jù)庫，這些語音數(shù)據(jù)庫可以為國內(nèi)外有關(guān)的科研單位和大學(xué)進行漢語連續(xù)語音識別算法研究、系統(tǒng)設(shè)計、及產(chǎn)業(yè)化工作提供充分、科學(xué)的訓(xùn)練語音樣本。例如：MIT Media lab Speech Dataset（麻省理工學(xué)院媒體實驗室語音數(shù)據(jù)集）、Pitch and Voicing Estimates for Aurora 2(Aurora2語音庫的基因周期和聲調(diào)估計）、Congressional speech data（國會語音數(shù)據(jù)）、Mandarin Speech Frame Data（普通話語音幀數(shù)據(jù)）、用于測試盲源分離算法的語音數(shù)據(jù)等。

技術(shù)發(fā)展

　　目前在大詞匯語音識別方面處于領(lǐng)先地位的IBM語音研究小組，就是在70年代開始了它的大詞匯語音識別研究工作的。AT&T的貝爾研究所也開始了一系列有關(guān)非特定人語音識別的實驗。這一研究歷經(jīng)10年，其成果是確立了如何制作用于非特定人語音識別的標(biāo)準(zhǔn)模板的方法。

　　這一時期所取得的重大進展有：

　?、烹[式馬爾科夫模型（HMM）技術(shù)的成熟和不斷完善成為語音識別的主流方法。

　　⑵以知識為基礎(chǔ)的語音識別的研究日益受到重視。在進行連續(xù)語音識別的時候，除了識別聲學(xué)信息外，更多地利用各種語言知識，諸如構(gòu)詞、句法、語義、對話背景方面等的知識來幫助進一步對語音作出識別和理解。同時在語音識別研究領(lǐng)域，還產(chǎn)生了基于統(tǒng)計概率的語言模型。

　?、侨斯ど窠?jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用研究的興起。在這些研究中，大部分采用基于反向傳播算法（BP算法）的多層感知網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)具有區(qū)分復(fù)雜的分類邊界的能力，顯然它十分有助于模式劃分。特別是在電話語音識別方面，由于其有著廣泛的應(yīng)用前景，成了當(dāng)前語音識別應(yīng)用的一個熱點。

　　另外，面向個人用途的連續(xù)語音聽寫機技術(shù)也日趨完善。這方面，最具代表性的是IBM的ViaVoice和Dragon公司的Dragon Dictate系統(tǒng)。這些系統(tǒng)具有說話人自適應(yīng)能力，新用戶不需要對全部詞匯進行訓(xùn)練，便可在使用中不斷提高識別率。

　　中國的語音識別技術(shù)的發(fā)展：?、旁诒本┯兄锌圃郝晫W(xué)所、自動化所、清華大學(xué)、北方交通大學(xué)等科研機構(gòu)和高等院校。另外，還有哈爾濱工業(yè)大學(xué)、中國科技大學(xué)、四川大學(xué)等也紛紛行動起來。

　?、片F(xiàn)在，國內(nèi)有不少語音識別系統(tǒng)已研制成功。這些系統(tǒng)的性能各具特色。

　　· 在孤立字大詞匯量語音識別方面，最具代表性的要數(shù)92年清華大學(xué)電子工程系與中國電子器件公司合作研制成功的THED-919特定人語音識別與理解實時系統(tǒng)。

　　· 在連續(xù)語音識別方面，91年12月四川大學(xué)計算機中心在微機上實現(xiàn)了一個主題受限的特定人連續(xù)英語——漢語語音翻譯演示系統(tǒng)。

　　·在非特定人語音識別方面，有清華大學(xué)計算機科學(xué)與技術(shù)系在87年研制的聲控電話查號系統(tǒng)并投入實際使用。

內(nèi)容來自百科網(wǎng)

語音識別技術(shù)

1、簡介

2、發(fā)展史

2、發(fā)展史