社會語言學(xué)(sociolinguistics)是一門語言學(xué)的分支學(xué)科,研究社會的各層面對語言運用的影響,包含文化準(zhǔn)則、社會規(guī)范或情境.
有人亦把后設(shè)語言學(xué)(metalinguistics,亦作“元語言學(xué)”)歸類為社會語言學(xué)的一部分.
研究范圍社會語言學(xué)研究的是語言的社會本質(zhì)和差別,以及他們的社會因素.在傳統(tǒng)的語言地理學(xué)中也有相同的研究,但是自社會語言學(xué)出現(xiàn)以后,這些內(nèi)容都算做社會語言學(xué)的范疇了.
對社會本質(zhì)的研究包括:
* 語言的社會本質(zhì)的特點及其規(guī)律
* 語言、意識、社會在起源上的相互關(guān)系
* 民族語言和民族形成的關(guān)系
* 民族共同語的形成與社會發(fā)展的關(guān)系
* 語言演變與社會演變的關(guān)系
對語言差異的研究包括:
* 標(biāo)準(zhǔn)語與方言、行話的差異o 發(fā)音差異o 用詞差異o 地位差異* 同一語言在不同國家、地區(qū)以及社會所產(chǎn)生的差異
o 例如:英語在不同國家或地區(qū)的傳播中產(chǎn)生了變異,出現(xiàn)了美式英語、港式英語、新加坡式英語等
* 同一國家或社會中通行幾種語言所造成的差異
o 例如:有兩種或兩種以上官方語言的國家或地區(qū),如加拿大(英語、法語)、新加坡(英語、中文、馬來語)
* 不同的語言使用者在語言運用上的差異
o 例如:性別差異導(dǎo)致男女使用有差異的語言.
* 社會場所不同所使用的語言的差異
o 例如:一般中國人在家庭環(huán)境中使用家鄉(xiāng)方言,在工作學(xué)習(xí)時用普通話.
研究方法調(diào)查研究法對各地區(qū)、各行業(yè)、各階層等人的語言運用進行考察.數(shù)學(xué)分析法對口語材料和文獻資料進行數(shù)學(xué)統(tǒng)計和數(shù)理分析.對比研究法分析社會因素、研究語言差異.實驗分析法用語音或心理實驗儀器對語言差異進行實驗分析,并作出定量和定性的描述.
語音識別技術(shù),也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。
與說話人識別及說話人確認不同,后者嘗試識別或確認發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。 語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。
語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語音到語音的翻譯。 語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
特定人語音識別的方法 目前,常用的說話人識別方法有模板匹配法、統(tǒng)計建模法、聯(lián)接主義法(即人工神經(jīng)網(wǎng)絡(luò)實現(xiàn))。考慮到數(shù)據(jù)量、實時性以及識別率的問題,筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結(jié)合的方法。
說話人識別的系統(tǒng)主要由語音特征矢量提取單元(前端處理)、訓(xùn)練單元、識別單元和后處理單元組成,其系統(tǒng)構(gòu)成如圖1所示。 由上圖也可以看出,每個司機在購買車后必須將自己的語音輸入系統(tǒng),也就是訓(xùn)練過程,當(dāng)然最好是在安靜、次數(shù)達到一定的數(shù)目。
從此在以后駕駛過程中就可以利用這個系統(tǒng)了。 所謂預(yù)處理是指對語音信號的特殊處理:預(yù)加重,分幀處理。
預(yù)加重的目的是提升高頻部分,使信號的頻譜變得平坦,以便于進行頻譜分析或聲道參數(shù)分析。用具有 6dB/倍頻程的提升高頻特性的預(yù)加重數(shù)字濾波器實現(xiàn)。
雖然語音信號是非平穩(wěn)時變的,但是可以認為是局部短時平穩(wěn)。故語音信號分析常分段或分幀來處理。
歷史 早在計算機發(fā)明之前,自動語音識別的設(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識別及合成的雛形。而1920年代生產(chǎn)的"Radio Rex"玩具狗可能是最早的語音識別器,當(dāng)這只狗的名字被呼喚的時候,它能夠從底座上彈出來。
最早的基于電子計算機的語音識別系統(tǒng)是由AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)字。其識別方法是跟蹤語音中的共振峰。
該系統(tǒng)得到了98%的正確率。到1950年代末,倫敦學(xué)院(Colledge of London)的Denes已經(jīng)將語法概率加入語音識別中。
1960年代,人工神經(jīng)網(wǎng)絡(luò)被引入了語音識別。這一時代的兩大突破是線性預(yù)測編碼Linear Predictive Coding (LPC), 及動態(tài)時間彎折Dynamic Time Warp技術(shù)。
語音識別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理,經(jīng)過Labiner等人的研究,卡內(nèi)基梅隆大學(xué)的李開復(fù)最終實現(xiàn)了第一個基于隱馬爾科夫模型的大詞匯量語音識別系統(tǒng)Sphinx。
[3]。此后嚴(yán)格來說語音識別技術(shù)并沒有脫離HMM框架。
盡管多年來研究人員一直嘗試將“聽寫機”推廣,語音識別技術(shù)在目前還無法支持無限領(lǐng)域,無限說話人的聽寫機應(yīng)用。 模型 目前,主流的大詞匯量語音識別系統(tǒng)多采用統(tǒng)計模式識別技術(shù)。
典型的基于統(tǒng)計模式識別方法的 語音識別系統(tǒng)由以下幾個基本模塊所構(gòu)成 信號處理及特征提取模塊。該模塊的主要任務(wù)是從輸入信號中提取特征,供聲學(xué)模型處理。
同時,它一般也包括了一些信號處理技術(shù),以盡可能降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。 統(tǒng)計聲學(xué)模型。
典型系統(tǒng)多采用基于一階隱馬爾科夫模型進行建模。 發(fā)音詞典。
發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實際提供了聲學(xué)模型建模單元與語言模型建模單元間的映射。
語言模型。語言模型對系統(tǒng)所針對的語言進行建模。
理論上,包括正則語言,上下文無關(guān)文法在內(nèi)的各種語言模型都可以作為語言模型,但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計的N元文法及其變體。 解碼器。
解碼器是語音識別系統(tǒng)的核心之一,其任務(wù)是對輸入的信號,根據(jù)聲學(xué)、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。 從數(shù)學(xué)角度可以更加清楚的了解上述模塊之間的關(guān)系。
首先,統(tǒng)計語音識別的最基本問題是,給定輸入信號或特征序列,符號集(詞典),求解符號串使得: W = argmaxP(W | O) 通過貝葉斯公式,上式可以改寫為 由于對于確定的輸入串O,P(O)是確定的,因此省略它并不會影響上式的最終結(jié)果,因此,一般來說語音識別所討論的問題可以用下面的公式來表示,可以將它稱為語音識別的基本公式。 W = argmaxP(O | W)P(W) 從這個角度來看,信號處理模塊提供了對輸入信號的預(yù)處理,也就是說,提供了從采集的語音信號(記為S)到 特征序列O的映射。
而聲學(xué)模型本身定義了一些更具推廣性的聲學(xué)建模單元,并且提供了在給定輸入特征下,估計P(O | uk)的方法。 為了將聲學(xué)模型建模單元串映射到符號集,就需要發(fā)音詞典發(fā)揮作用。
它實際上定義了映射的映射。為了表示方便,也可以定義一個由到U的全集的笛卡爾積,而發(fā)音詞典則是這個笛卡爾積的一個子集。
并且有: 最后,語言模型則提供了P(W)。這樣,基本公式就可以更加具體的寫成: 對于解碼器來所,就是要在由,,ui以及時間標(biāo)度t張成的搜索空間中,找到上式所指明的W。
語音識別是一門交叉學(xué)科,。
歷史比較語言學(xué)在西方具有悠久的歷史,在現(xiàn)代語言學(xué)確立之前,語言研究主要是歷史比較語言學(xué)方面的研究,其研究內(nèi)容也以語音研究為主。目前,漢語的語音史研究也逐漸開始使用歷史比較語言學(xué)的研究方法,同時還要考慮語言接觸的問題。
你在提問中指出“根據(jù)方言的差異來考察語音的歷史演變”,既然是方言差異,就不可能“以一種方言為例”,所以,“以一種方言為例,說明如何根據(jù)方言的差異來考察語音的歷史演變”是無法實現(xiàn)的。現(xiàn)在學(xué)界的研究方法,不但要比較多種方言的語音,還要參考日語、朝鮮語、越南語中漢語借詞的發(fā)音,在研究上古音的時候,還要分析漢字中的形聲字的讀音。也就是說,單純地比較方言語音并不能有效地考察語音的歷史演變。
就具體的操作方法來說,主要是考察方言間語音的對應(yīng)關(guān)系,而不是語音的相似性。利用語音對應(yīng)關(guān)系、語音發(fā)音的生理特點以及其他語言中的相類似的語音現(xiàn)象,可以挖掘出語音演變的脈絡(luò)。
你指的是TCL C10的方言識別技術(shù)吧!這款電視的語音助手小T目前支持普通話、四川話、廣東話、東北話、河南話、陜西話6種方言的識別,并且識別能力還挺精準(zhǔn)的,拾音效果也不錯。我也是看準(zhǔn)了這點,才給我爸媽買的,這樣他們就不用說著別扭的塑料普通話來語音控制了,直接可以說廣東話。話說,我爸平常動不動就喜歡調(diào)戲小T,估計真的是猴鐘意小T啊。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:2.733秒