常用的圖像特征有顏色特征、紋理特征、形狀特征、空間關(guān)系特征。
一 顏色特征 (一)特點(diǎn):顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點(diǎn)的特征,此時(shí)所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。
由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對(duì)象的局部特征。另外,僅使用顏色特征查詢時(shí),如果數(shù)據(jù)庫(kù)很大,常會(huì)將許多不需要的圖像也檢索出來(lái)。
顏色直方圖是最常用的表達(dá)顏色特征的方法,其優(yōu)點(diǎn)是不受圖像旋轉(zhuǎn)和平移變化的影響,進(jìn)一步借助歸一化還可不受圖像尺度變化的影響,基缺點(diǎn)是沒(méi)有表達(dá)出顏色空間分布的信息。(二)常用的特征提取與匹配方法 (1) 顏色直方圖 其優(yōu)點(diǎn)在于:它能簡(jiǎn)單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動(dòng)分割的圖像和不需要考慮物體空間位置的圖像。
其缺點(diǎn)在于:它無(wú)法描述圖像中顏色的局部分布及每種色彩所處的空間位置,即無(wú)法描述圖像中的某一具體的對(duì)象或物體。最常用的顏色空間:RGB顏色空間、HSV顏色空間。
顏色直方圖特征匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累加顏色直方圖法。(2) 顏色集 顏色直方圖法是一種全局顏色特征提取與匹配方法,無(wú)法區(qū)分局部顏色信息。
顏色集是對(duì)顏色直方圖的一種近似首先將圖像從 RGB顏色空間轉(zhuǎn)化成視覺(jué)均衡的顏色空間(如 HSV 空間),并將顏色空間量化成若干個(gè)柄。然后,用色彩自動(dòng)分割技術(shù)將圖像分為若干區(qū)域,每個(gè)區(qū)域用量化顏色空間的某個(gè)顏色分量來(lái)索引,從而將圖像表達(dá)為一個(gè)二進(jìn)制的顏色索引集。
在圖像匹配中,比較不同圖像顏色集之間的距離和色彩區(qū)域的空間關(guān)系 (3) 顏色矩 這種方法的數(shù)學(xué)基礎(chǔ)在于:圖像中任何的顏色分布均可以用它的矩來(lái)表示。此外,由于顏色分布信息主要集中在低階矩中,因此,僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達(dá)圖像的顏色分布。
(4) 顏色聚合向量 其核心思想是:將屬于直方圖每一個(gè)柄的像素分成兩部分,如果該柄內(nèi)的某些像素所占據(jù)的連續(xù)區(qū)域的面積大于給定的閾值,則該區(qū)域內(nèi)的像素作為聚合像素,否則作為非聚合像素。(5) 顏色相關(guān)圖 二 紋理特征 (一)特點(diǎn):紋理特征也是一種全局特征,它也描述了圖像或圖像區(qū)域所對(duì)應(yīng)景物的表面性質(zhì)。
但由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質(zhì)屬性,所以僅僅利用紋理特征是無(wú)法獲得高層次圖像內(nèi)容的。與顏色特征不同,紋理特征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。
在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無(wú)法匹配成功。作為一種統(tǒng)計(jì)特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對(duì)于噪聲有較強(qiáng)的抵抗能力。
但是,紋理特征也有其缺點(diǎn),一個(gè)很明顯的缺點(diǎn)是當(dāng)圖像的分辨率變化的時(shí)候,所計(jì)算出來(lái)的紋理可能會(huì)有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來(lái)的紋理不一定是3-D物體表面真實(shí)的紋理。
例如,水中的倒影,光滑的金屬面互相反射造成的影響等都會(huì)導(dǎo)致紋理的變化。由于這些不是物體本身的特性,因而將紋理信息應(yīng)用于檢索時(shí),有時(shí)這些虛假的紋理會(huì)對(duì)檢索造成“誤導(dǎo)”。
在檢索具有粗細(xì)、疏密等方面較大差別的紋理圖像時(shí),利用紋理特征是一種有效的方法。但當(dāng)紋理之間的粗細(xì)、疏密等易于分辨的信息之間相差不大的時(shí)候,通常的紋理特征很難準(zhǔn)確地反映出人的視覺(jué)感覺(jué)不同的紋理之間的差別。
(二)常用的特征提取與匹配方法 紋理特征描述方法分類 (1)統(tǒng)計(jì)方法統(tǒng)計(jì)方法的典型代表是一種稱為灰度共生矩陣的紋理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩陣中各種統(tǒng)計(jì)特征基礎(chǔ)上,通過(guò)實(shí)驗(yàn),得出灰度共生矩陣的四個(gè)關(guān)鍵特征:能量、慣量、熵和相關(guān)性。統(tǒng)計(jì)方法中另一種典型方法,則是從圖像的自相關(guān)函數(shù)(即圖像的能量譜函數(shù))提取紋理特征,即通過(guò)對(duì)圖像的能量譜函數(shù)的計(jì)算,提取紋理的粗細(xì)度及方向性等特征參數(shù) (2)幾何法 所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎(chǔ)上的一種紋理特征分析方法。
紋理基元理論認(rèn)為,復(fù)雜的紋理可以由若干簡(jiǎn)單的紋理基元以一定的有規(guī)律的形式重復(fù)排列構(gòu)成。在幾何法中,比較有影響的算法有兩種:Voronio 棋盤格特征法和結(jié)構(gòu)法。
(3)模型法 模型法以圖像的構(gòu)造模型為基礎(chǔ),采用模型的參數(shù)作為紋理特征。典型的方法是隨機(jī)場(chǎng)模型法,如馬爾可夫(Markov)隨機(jī)場(chǎng)(MRF)模型法和 Gibbs 隨機(jī)場(chǎng)模型法 (4)信號(hào)處理法 紋理特征的提取與匹配主要有:灰度共生矩陣、Tamura 紋理特征、自回歸紋理模型、小波變換等。
灰度共生矩陣特征提取與匹配主要依賴于能量、慣量、熵和相關(guān)性四個(gè)參數(shù)。Tamura 紋理特征基于人類對(duì)紋理的視覺(jué)感知心理學(xué)研究,提出6種屬性,即:粗糙度、對(duì)比度、方向度、線像度、規(guī)整度和粗略度。
自回歸紋理模型(simultaneous auto-regressive, SAR)是馬爾可夫隨機(jī)場(chǎng)(MRF)模型的一種。
數(shù)字信號(hào)處理是把信號(hào)用數(shù)字或符號(hào)表示成序列,通過(guò)計(jì)算機(jī)或通用(專用)信號(hào)處理設(shè)備,用數(shù)值計(jì)算方法進(jìn)行各種處理,達(dá)到提取有用信息便于應(yīng)用的目的。例如:濾波、檢測(cè)、變換、增強(qiáng)、估計(jì)、識(shí)別、參數(shù)提取、頻譜分析等。
一般地講,數(shù)字信號(hào)處理涉及三個(gè)步驟:
⑴模數(shù)轉(zhuǎn)換(A/D轉(zhuǎn)換):把模擬信號(hào)變成數(shù)字信號(hào),是一個(gè)對(duì)自變量和幅值同時(shí)進(jìn)行離散化的過(guò)程,基本的理論保證是采樣定理。
⑵數(shù)字信號(hào)處理(DSP):包括變換域分析(如頻域變換)、數(shù)字濾波、識(shí)別、合成等。
⑶數(shù)模轉(zhuǎn)換(D/A轉(zhuǎn)換):把經(jīng)過(guò)處理的數(shù)字信號(hào)還原為模擬信號(hào)。通常,這一步并不是必須的。 作為DSP的成功例子有很多,如醫(yī)用CT斷層成像掃描儀的發(fā)明。它是利用生物體的各個(gè)部位對(duì)X射線吸收率不同的現(xiàn)象,并利用各個(gè)方向掃描的投影數(shù)據(jù)再構(gòu)造出檢測(cè)體剖面圖的儀器。這種儀器中fft(快速傅里葉變換)起到了快速計(jì)算的作用。以后相繼研制出的還有:采用正電子的CT機(jī)和基于核磁共振的CT機(jī)等儀器,它們?yōu)獒t(yī)學(xué)領(lǐng)域作出了很大的貢獻(xiàn)。
信號(hào)處理的目的是:削弱信號(hào)中的多余內(nèi)容;濾出混雜的噪聲和干擾;或者將信號(hào)變換成容易處理、傳輸、分析與識(shí)別的形式,以便后續(xù)的其它處理。
主要有:地物邊界跟蹤法;形狀特征描述與提?。坏匚锟臻g關(guān)系特征描述與提取。
遙感圖像解譯,除了利用地物的光譜特征外,還需利用地物的形狀特征和空間關(guān)系特征,因此需要提取圖像的其他特征。
對(duì)于高分辨率遙感圖像,可以清楚地觀察到豐富的結(jié)構(gòu)信息,如城市是由許多街區(qū)組成的,每個(gè)街區(qū)又由多個(gè)巨星樓房構(gòu)成,其中人造地物具有明顯的形狀和結(jié)構(gòu)特征,如建筑物、廠房、農(nóng)田田埂,因此可以設(shè)法去提取這類地物的形狀特征及其空間關(guān)系特征,以作為結(jié)構(gòu)模式識(shí)別的依據(jù)
(1)提取簡(jiǎn)單,時(shí)間和空間復(fù)雜度低。
(2)區(qū)分能力強(qiáng),對(duì)圖像視覺(jué)內(nèi)容相似的圖像其特征描述之間也應(yīng)相近,反
之,對(duì)于視覺(jué)內(nèi)容不相似的圖像其特征描述之間應(yīng)有一定的差別。
(3)與人的視覺(jué)感知相近,對(duì)人的視覺(jué)感覺(jué)相近的圖像其特征描述之間也相
近,對(duì)人的視覺(jué)感知有差別的圖像其特征描述之間也有一定的差別。
(4)抗干擾能力強(qiáng),魯棒性好,對(duì)圖像大小,方向不敏感,具有幾何平移,
旋轉(zhuǎn)不變性。
**************************************************************
如果你對(duì)這個(gè)答案有什么疑問(wèn),請(qǐng)追問(wèn),
另外如果你覺(jué)得我的回答對(duì)你有所幫助,請(qǐng)千萬(wàn)別忘記采納喲!
**************************************************************
3.2 ECG特征點(diǎn)的提取方法 因?yàn)镻eak Detection VI的輸出中已包含有相應(yīng)點(diǎn)的幅值、二階導(dǎo)數(shù)及位置索引信息,在確定R峰點(diǎn)后,可進(jìn)一步根據(jù)ECG的特點(diǎn)確定出其它各特征點(diǎn)。完整的ECG特征點(diǎn)判別方法及步驟為: (1)幅值最大或二階導(dǎo)數(shù)最小(或兩者同時(shí)滿足)的波峰點(diǎn)判定為R峰點(diǎn);
(2)R峰點(diǎn)之前的第一個(gè)小于零的波谷點(diǎn)(Valley)為Q點(diǎn);
(3)R峰點(diǎn)之后第一個(gè)小于零的波谷點(diǎn)(Valley)為S點(diǎn);
(4)Q點(diǎn)之前合理時(shí)限內(nèi)的最大波峰點(diǎn)為P點(diǎn);
(5)S點(diǎn)之后合理時(shí)限內(nèi)的最大波峰點(diǎn)為T點(diǎn)。
(U波幅度較小且目前對(duì)其認(rèn)識(shí)還不清楚,本文不作討論。)4、基于虛擬儀器LabVIEW8.2的編程實(shí)現(xiàn) 按圖2流程編制LabVIEW8.2程序,考慮到實(shí)際ECG波形中存在干擾,閾值(Threshold)不宜取零。程序中采用本周期段數(shù)據(jù)中最小波谷點(diǎn)的0.02倍作為Valley點(diǎn)閾值,最大波峰點(diǎn)的0.03倍作為Peak點(diǎn)的閾值,這樣可將基線附近的絕大多數(shù)高頻干擾點(diǎn)避開(kāi),這些干擾點(diǎn)將不會(huì)出現(xiàn)在輸出序列中
特征提取
一、low-level,主要是MFCC,以及基于MFCC并對(duì)其優(yōu)化的一些方法。 1、MFCC
2、抗噪聲較優(yōu)的方法:
WMVDR:warped minimum variance distortionless response
Multitaper MFCC:思想是用multiple windows(tapers)來(lái)代替漢明窗。
MHEC:mean Hilbert envelope coefficients.此方法對(duì)抗汽車噪聲很有用。 3、對(duì)抗回聲較優(yōu)的方法(reverberant robustness):
FDLP: frequency domain linear prediction
4、融合MFCC的方法(fusion with MFCC):
SCF/SCM: spectral centroid frequency/magnitude
該方法的提出,是考慮到MFCC子帶中無(wú)法體現(xiàn)能量分布,而FM(frequency modulation)計(jì)算量太大。
FFV: fundamental frequency variation,該方法同時(shí)考慮到了MFCC和韻律(prosodic)
信息.
HSCC: Harmonic structure cepstral coefficient,該方法體現(xiàn)了能量分布,實(shí)現(xiàn)用到了
LDA。
二、high-level,主要是基于phone ,syllable ,word 一級(jí)。 1、韻律特征(prosodic features)
目前研究的有 pitch distribution和non-uniform extraction region features(NERFs) 2、音素特征(phonetic features)
建模可以用N-gram,也可以用SVM建模。 3、語(yǔ)法特征(lexical features)
詞一級(jí)的N-gram,建模的方法有LLR(log likelihood ration)和SVM.SVM的效果應(yīng)該更好一些。 4、cepstral-derived features
實(shí)現(xiàn)用最大似然線性回歸MLLR(maximum likelihood linear regression)
一些特征: MFCC
PLP 感知線性預(yù)測(cè) LPC 線性預(yù)測(cè)系數(shù) 過(guò)零率 LSP 短時(shí)能量 子帶流量比 亮度 基頻
頻譜峰值點(diǎn) SDC CEP 線譜對(duì) 頻譜能量
Delt(MFCC)
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:2.801秒