概述
21世紀(jì)是一個(gè)充滿信息的時(shí)代,圖像作為人類感知世界的視覺基礎(chǔ),是人類獲取信息、表達(dá)信息和傳遞信息的重要手段。數(shù)字圖像處理,即用計(jì)算機(jī)對(duì)圖像進(jìn)行處理,其發(fā)展歷史并不長(zhǎng)。數(shù)字圖像處理技術(shù)源于20世紀(jì)20年代,當(dāng)時(shí)通過海底電纜從英國(guó)倫敦到美國(guó)紐約傳輸了一幅照片,采用了數(shù)字壓縮技術(shù)。首先數(shù)字圖像處理技術(shù)可以幫助人們更客觀、準(zhǔn)確地認(rèn)識(shí)世界,人的視覺系統(tǒng)可以幫助人類從外界獲取3/4以上的信息,而圖像、圖形又是所有視覺信息的載體,盡管人眼的鑒別力很高,可以識(shí)別上千種顏色,但很多情況下,圖像對(duì)于人眼來說是模糊的甚至是不可見的,通過圖象增強(qiáng)技術(shù),可以使模糊甚至不可見的圖像變得清晰明亮。
在計(jì)算機(jī)中,按照顏色和灰度的多少可以將圖像分為二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。大多數(shù)圖像處理軟件都支持這四種類型的圖像。
中國(guó)物聯(lián)網(wǎng)校企聯(lián)盟認(rèn)為圖像處理將會(huì)是物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的重要支柱之一,它的具體應(yīng)用是指紋識(shí)別技術(shù)。
常用方法
1 )圖像變換:由于圖像陣列很大,直接在空間域中進(jìn)行處理,涉及計(jì)算量很大。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計(jì)算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進(jìn)行數(shù)字濾波處理)。目前新興研究的小波變換在時(shí)域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應(yīng)用。
2 )圖像編碼壓縮:圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比特?cái)?shù)),以便節(jié)省圖像傳輸、處理時(shí)間和減少所占用的存儲(chǔ)器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進(jìn)行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。
3 )圖像增強(qiáng)和復(fù)原:圖像增強(qiáng)和復(fù)原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提高圖像的清晰度等。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強(qiáng)化圖像高頻分量,可使圖像中物體輪廓清晰,細(xì)節(jié)明顯;如強(qiáng)化低頻分量可減少圖像中噪聲影響。圖像復(fù)原要求對(duì)圖像降質(zhì)的原因有一定的了解,一般講應(yīng)根據(jù)降質(zhì)過程建立“降質(zhì)模型”,再采用某種濾波方法,恢復(fù)或重建原來的圖像。
4 )圖像分割:圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識(shí)別、分析和理解的基礎(chǔ)。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法。因此,對(duì)圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點(diǎn)之一。
5 )圖像描述:圖像描述是圖像識(shí)別和理解的必要前提。作為最簡(jiǎn)單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對(duì)于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進(jìn)行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。
6 )圖像分類(識(shí)別):圖像分類(識(shí)別)屬于模式識(shí)別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。圖像分類常采用經(jīng)典的模式識(shí)別方法,有統(tǒng)計(jì)模式分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識(shí)別中也越來越受到重視。
圖像
二值圖像
一幅二值圖像的二維矩陣僅由0、1兩個(gè)值構(gòu)成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有0、1兩種可能,所以計(jì)算機(jī)中二值圖像的數(shù)據(jù)類型通常為1個(gè)二進(jìn)制位。二值圖像通常用于文字、線條圖的掃描識(shí)別(OCR)和掩膜圖像的存儲(chǔ)。
灰度圖像
灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為8位無符號(hào)整數(shù)的(int8),這就是人們經(jīng)常提到的256灰度圖像。“0”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色。在某些軟件中,灰度圖像也可以用雙精度數(shù)據(jù)類型(double)表示,像素的值域?yàn)閇0,1],0代表黑色,1代表白色,0到1之間的小數(shù)表示不同的灰度等級(jí)。二值圖像可以看成是灰度圖像的一個(gè)特例。
索引圖像
索引圖像的文件結(jié)構(gòu)比較復(fù)雜,除了存放圖像的二維矩陣外,還包括一個(gè)稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,如矩陣元素值域?yàn)閇0,255],則MAP矩陣的大小為256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三個(gè)元素分別指定該行對(duì)應(yīng)顏色的紅、綠、藍(lán)單色值,MAP中每一行對(duì)應(yīng)圖像矩陣像素的一個(gè)灰度值,如某一像素的灰度值為64,則該像素就與MAP中的第64行建立了映射關(guān)系,該像素在屏幕上的實(shí)際顏色由第64行的[RGB]組合決定。也就是說,圖像在屏幕上顯示時(shí),每一像素的顏色由存放在矩陣中該像素的灰度值作為索引通過檢索顏色索引矩陣MAP得到。索引圖像的數(shù)據(jù)類型一般為8位無符號(hào)整形(int8),相應(yīng)索引矩陣MAP的大小為256Ⅹ3,因此一般索引圖像只能同時(shí)顯示256種顏色,但通過改變索引矩陣,顏色的類型可以調(diào)整。索引圖像的數(shù)據(jù)類型也可采用雙精度浮點(diǎn)型(double)。索引圖像一般用于存放色彩要求比較簡(jiǎn)單的圖像,如Windows中色彩構(gòu)成比較簡(jiǎn)單的壁紙多采用索引圖像存放,如果圖像的色彩比較復(fù)雜,就要用到RGB真彩色圖像。
RGB彩色圖像
RGB圖像與索引圖像一樣都可以用來表示彩色圖像。與索引圖像一樣,它分別用紅(R)、綠(G)、藍(lán)(B)三原色的組合來表示每個(gè)像素的顏色。但與索引圖像不同的是,RGB圖像每一個(gè)像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由于每一像素的顏色需由R、G、B三個(gè)分量來表示,M、N分別表示圖像的行列數(shù),三個(gè)M x N的二維矩陣分別表示各個(gè)像素的R、G、B三個(gè)顏色分量。RGB圖像的數(shù)據(jù)類型一般為8位無符號(hào)整形,通常用于表示和存放真彩色圖像,當(dāng)然也可以存放灰度圖像。
數(shù)字化圖像數(shù)據(jù)有兩種存儲(chǔ)方式[6]:位圖存儲(chǔ)(Bitmap)和矢量存儲(chǔ)(Vector)
我們平常是以圖像分辨率(即像素點(diǎn))和顏色數(shù)來描述數(shù)字圖象的。例如一張分辨率為640*480,16位色的數(shù)字圖片,就由2^16=65536種顏色的307200(=640*480)個(gè)素點(diǎn)組成。
位圖圖像:位圖方式是將圖像的每一個(gè)象素點(diǎn)轉(zhuǎn)換為一個(gè)數(shù)據(jù),當(dāng)圖像是單色(只有黑白二色)時(shí),8個(gè)象素點(diǎn)的數(shù)據(jù)只占據(jù)一個(gè)字節(jié)(一個(gè)字節(jié)就是8個(gè)二進(jìn)制數(shù),1個(gè)二進(jìn)制數(shù)存放象素點(diǎn));16色(區(qū)別于前段“16位色”)的圖像每?jī)蓚€(gè)象素點(diǎn)用一個(gè)字節(jié)存儲(chǔ);256色圖像每一個(gè)象素點(diǎn)用一個(gè)字節(jié)存儲(chǔ)。這樣就能夠精確地描述各種不同顏色模式的圖像圖面。位圖圖像彌補(bǔ)了矢量式圖像的缺陷,它能夠制作出色彩和色調(diào)變化豐富的圖像,可以逼真地表現(xiàn)自然界的景象,同時(shí)也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優(yōu)點(diǎn);而其缺點(diǎn)則是它無法制作真正的3D圖像,并且圖像縮放和旋轉(zhuǎn)時(shí)會(huì)產(chǎn)生失真的現(xiàn)象,同時(shí)文件較大,對(duì)內(nèi)存和硬盤空間容量的需求也較高。位圖方式就是將圖像的每一像素點(diǎn)轉(zhuǎn)換為一個(gè)數(shù)據(jù)。如果用1位數(shù)據(jù)來記錄,那么它只能代表2種顏色(2^1=2);如果以8位來記錄,便可以表現(xiàn)出256種顏色或色調(diào)(2^8=256),因此使用的位元素越多所能表現(xiàn)的色彩也越多。通常我們使用的顏色有16色、256色、增強(qiáng)16位和真彩色24位。一般所說的真彩色是指24位(2^24)的位圖存儲(chǔ)模式適合于內(nèi)容復(fù)雜的圖像和真實(shí)照片。但隨著分辨率以及顏色數(shù)的提高,圖像所占用的磁盤空間也就相當(dāng)大;另外由于在放大圖像的過程中,其圖像勢(shì)必要變得模糊而失真,放大后的圖像像素點(diǎn)實(shí)際上變成了像素“方格”。 用數(shù)碼相機(jī)和掃描儀獲取的圖像都屬于位圖。
矢量圖像:矢量圖像存儲(chǔ)的是圖像信息的輪廓部分,而不是圖像的每一個(gè)象素點(diǎn)。例如,一個(gè)圓形圖案只要存儲(chǔ)圓心的坐標(biāo)位置和半徑長(zhǎng)度,以及圓的邊線和內(nèi)部的顏色即可。該存儲(chǔ)方式的缺點(diǎn)是經(jīng)常耗費(fèi)大量的時(shí)間做一些復(fù)雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會(huì)失真;圖像的存儲(chǔ)空間也要小得多。所以,矢量圖比較適合存儲(chǔ)各種圖表和工程
數(shù)據(jù)
圖像處理離不開海量、豐富的基礎(chǔ)數(shù)據(jù),包括視頻、靜態(tài)圖像等多種格式,如Berkeley分割數(shù)據(jù)集和基準(zhǔn)500 (BSDS500)、西門菲沙大學(xué)不同光照物體圖像數(shù)據(jù)庫、神經(jīng)網(wǎng)絡(luò)人臉識(shí)別數(shù)據(jù)、CBCL-MIT StreetScenes(麻省理工學(xué)院街景數(shù)據(jù)庫)等。
數(shù)字化
通過取樣和量化過程將一個(gè)以自然形式存在的圖像變換為適合計(jì)算機(jī)處理的數(shù)字形式。圖像在計(jì)算機(jī)內(nèi)部被表示為一個(gè)數(shù)字矩陣,矩陣中每一元素稱為像素。圖像數(shù)字化需要專門的設(shè)備,常見的有各種電子的和光學(xué)的掃描設(shè)備,還有機(jī)電掃描設(shè)備和手工操作的數(shù)字化儀。
圖像編碼
對(duì)圖像信息編碼,以滿足傳輸和存儲(chǔ)的要求。編碼能壓縮圖像的信息量,但圖像質(zhì)量幾乎不變。為此,可以采用模擬處理技術(shù),再通過模-數(shù)轉(zhuǎn)換得到編碼,不過多數(shù)是采用數(shù)字編碼技術(shù)。編碼方法有對(duì)圖像逐點(diǎn)進(jìn)行加工的方法,也有對(duì)圖像施加某種變換或基于區(qū)域、特征進(jìn)行編碼的方法。脈碼調(diào)制、微分脈碼調(diào)制、預(yù)測(cè)碼和各種變換都是常用的編碼技術(shù)。
圖像壓縮
由數(shù)字化得到的一幅圖像的數(shù)據(jù)量十分巨大,一幅典型的數(shù)字圖像通常由500×500或1000×1000個(gè)像素組成。如果是動(dòng)態(tài)圖像,其數(shù)據(jù)量更大。因此圖像壓縮對(duì)于圖像的存儲(chǔ)和傳輸都十分必要。
圖像壓縮有兩類壓縮算法,即無損壓縮和有損壓縮。最常用的無損壓縮算法取空間或時(shí)間上相鄰像素值的差,再進(jìn)行編碼。游程碼就是這類壓縮碼的例子。有損壓縮算法大都采用圖像交換的途徑,例如對(duì)圖像進(jìn)行快速傅里葉變換或離散的余弦變換。已作為圖像壓縮國(guó)際標(biāo)準(zhǔn)的JPEG和MPEG均屬于有損壓縮算法。前者用于靜態(tài)圖像,后者用于動(dòng)態(tài)圖像。它們都由芯片實(shí)現(xiàn)[2] 。
增強(qiáng)復(fù)原
圖像增強(qiáng)的目標(biāo)是改進(jìn)圖片的質(zhì)量,例如增加對(duì)比度,去掉模糊和噪聲,修正幾何畸變等;圖像復(fù)原是在假定已知模糊或噪聲的模型時(shí),試圖估計(jì)原圖像的一種技術(shù)。
圖像增強(qiáng)按所用方法可分成頻率域法和空間域法。前者把圖像看成一種二維信號(hào),對(duì)其進(jìn)行基于二維傅里葉變換的信號(hào)增強(qiáng)。采用低通濾波(即只讓低頻信號(hào)通過)法,可去掉圖中的噪聲;采用高通濾波法,則可增強(qiáng)邊緣等高頻信號(hào),使模糊的圖片變得清晰。具有代表性的空間域算法有局部求平均值法和中值濾波(取局部鄰域中的中間像素值)法等,它們可用于去除或減弱噪聲[3] 。
早期的數(shù)字圖像復(fù)原亦來自頻率域的概念?,F(xiàn)代采取的是一種代數(shù)的方法,即通過解一個(gè)大的方程組來復(fù)原理想的圖片。
以提高圖像質(zhì)量為目的的圖像增強(qiáng)和復(fù)原對(duì)于一些難以得到的圖片或者在拍攝條件十分惡劣情況下得到的圖片都有廣泛的應(yīng)用。例如從太空中拍攝到的地球或其他星球的照片,用電子顯微鏡或X光拍攝的生物醫(yī)療圖片等。
圖像增強(qiáng) 使圖像清晰或?qū)⑵滢D(zhuǎn)換為更適合人或機(jī)器分析的形式。與圖像復(fù)原不同,圖像增強(qiáng)并不要求忠實(shí)地反映原始圖像。相反,含有某種失真(例如突出輪廓線)的圖像可能比無失真的原始圖像更為清晰。常用的圖像增強(qiáng)方法有:①灰度等級(jí)直方圖處理:使加工后的圖像在某一灰度范圍內(nèi)有更好的對(duì)比度;②干擾抑制:通過低通濾波、多圖像平均、施行某類空間域算子等處理,抑制疊加在圖像上的隨機(jī)性干擾;③邊緣銳化:通過高通濾波、差分運(yùn)算或某種變換,使圖形的輪廓線增強(qiáng);④偽彩色處理:將黑白圖像轉(zhuǎn)換為彩色圖像,從而使人們易于分析和檢測(cè)圖像包含的信息。
圖像復(fù)原 除去或減少在獲得圖像過程中因各種原因產(chǎn)生的退化。這類原因可能是光學(xué)系統(tǒng)的像差或離焦、攝像系統(tǒng)與被攝物之間的相對(duì)運(yùn)動(dòng)、電子或光學(xué)系統(tǒng)的噪聲和介于攝像系統(tǒng)與被攝像物間的大氣湍流等。圖像復(fù)原常用二種方法。當(dāng)不知道圖像本身的性質(zhì)時(shí),可以建立退化源的數(shù)學(xué)模型,然后施行復(fù)原算法除去或減少退化源的影響。當(dāng)有了關(guān)于圖像本身的先驗(yàn)知識(shí)時(shí),可以建立原始圖像的模型,然后在觀測(cè)到的退化圖像中通過檢測(cè)原始圖像而復(fù)原圖像。
圖像分割將圖像劃分為一些互不重疊的區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集。通常采用把像素分入特定區(qū)域的區(qū)域法和尋求區(qū)域之間邊界的境界法。區(qū)域法根據(jù)被分割對(duì)象與背景的對(duì)比度進(jìn)行閾值運(yùn)算,將對(duì)象從背景中分割出來。有時(shí)用固定的閾值不能得到滿意的分割,可根據(jù)局部的對(duì)比度調(diào)整閾值,這稱為自適應(yīng)閾值。境界法利用各種邊緣檢測(cè)技術(shù),即根據(jù)圖像邊緣處具有很大的梯度值進(jìn)行檢測(cè)。這兩種方法都可以利用圖像的紋理特性實(shí)現(xiàn)圖像分割。
形態(tài)學(xué)
形態(tài)學(xué)一詞通常指生物學(xué)的一個(gè)分支,它用于處理動(dòng)物和植物的形狀和結(jié)構(gòu)。在數(shù)學(xué)形態(tài)學(xué)的語境中也使用該詞來作為提取圖像分量的一種工具,這些分量在表示和描述區(qū)域形狀(如邊界,骨骼和凸殼)時(shí)是很有用的。此外,我們還很關(guān)注用于預(yù)處理和后處理的形態(tài)學(xué)技術(shù),如形態(tài)學(xué)濾波、細(xì)化和裁剪。
數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算
數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算有4個(gè):腐蝕、膨脹、開啟和閉合。數(shù)學(xué)形態(tài)學(xué)方法利用一個(gè)稱作結(jié)構(gòu)元素的”探針”收集圖像的信息,當(dāng)探針在圖像中不斷移動(dòng)時(shí),便可考察圖像各個(gè)部分之間的相互關(guān)系,從而了解圖像的結(jié)構(gòu)特征。在連續(xù)空間中,灰度圖像的腐蝕、膨脹、開啟和閉合運(yùn)算分別表述如下。
腐蝕
腐蝕“收縮”或“細(xì)化”二值圖像中的對(duì)象。收縮的方式和程度由一個(gè)結(jié)構(gòu)元素控制。數(shù)學(xué)上,A被B腐蝕,記為AΘB,定義為:
換言之,A被B腐蝕是所有結(jié)構(gòu)元素的原點(diǎn)位置的集合,其中平移的B與A的背景并不疊加。
膨脹
膨脹是在二值圖像中“加長(zhǎng)”或“變粗”的操作。這種特殊的方式和變粗的程度由一個(gè)稱為結(jié)構(gòu)元素的集合控制。結(jié)構(gòu)元素通常用0和1的矩陣表示。數(shù)學(xué)上,膨脹定義為集合運(yùn)算。A被B膨脹,記為A⊕B,定義為:
其中,Φ為空集,B為結(jié)構(gòu)元素。總之,A被B膨脹是所有結(jié)構(gòu)元素原點(diǎn)位置組成的集合,其中映射并平移后的B至少與A的某些部分重疊。這種在膨脹過程中對(duì)結(jié)構(gòu)元素的平移類似于空間卷積。
膨脹滿足交換律,即A⊕B=B⊕A。在圖像處理中,我們習(xí)慣令A(yù)⊕B的第一個(gè)操作數(shù)為圖像,而第二個(gè)操作數(shù)為結(jié)構(gòu)元素,結(jié)構(gòu)元素往往比圖像小得多。
膨脹滿足結(jié)合律,即A⊕(B⊕C)=(A⊕B)⊕C。假設(shè)一個(gè)結(jié)構(gòu)元素B可以表示為兩個(gè)結(jié)構(gòu)元素B1和B2的膨脹,即B=B1⊕B2,則A⊕B=A⊕(B1⊕B2)=(A⊕B1)⊕B2,換言之,用B膨脹A等同于用B1先膨脹A,再用B2膨脹前面的結(jié)果。我們稱B能夠分解成B1和B2兩個(gè)結(jié)構(gòu)元素。結(jié)合律很重要,因?yàn)橛?jì)算膨脹所需要的時(shí)間正比于結(jié)構(gòu)元素中的非零像素的個(gè)數(shù)。通過結(jié)合律,分解結(jié)構(gòu)元素,然后再分別用子結(jié)構(gòu)元素進(jìn)行膨脹操作往往會(huì)實(shí)現(xiàn)很客觀的速度的增長(zhǎng)。
開啟
A被B的形態(tài)學(xué)開運(yùn)算可以記做A?B,這種運(yùn)算是A被B腐蝕后再用B來膨脹腐蝕結(jié)果,即:
開運(yùn)算的數(shù)學(xué)公式為:
其中,∪{·}指大括號(hào)中所有集合的并集。該公式的簡(jiǎn)單幾何解釋為:A?B是B在A內(nèi)完全匹配的平移的并集。形態(tài)學(xué)開運(yùn)算完全刪除了不能包含結(jié)構(gòu)元素的對(duì)象區(qū)域,平滑了對(duì)象的輪廓,斷開了狹窄的連接,去掉了細(xì)小的突出部分。
閉合
A被B形態(tài)學(xué)閉運(yùn)算記做A·B,它是先膨脹后腐蝕的結(jié)果:
從幾何學(xué)上講,A·B是所有不與A重疊的B的平移的并集。想開運(yùn)算一樣,形態(tài)學(xué)閉運(yùn)算會(huì)平滑對(duì)象的輪廓。然后,與開運(yùn)算不同的是,閉運(yùn)算一般會(huì)將狹窄的缺口連接起來形成細(xì)長(zhǎng)的彎口,并填充比結(jié)構(gòu)元素小的洞。
基于這些基本運(yùn)算可以推導(dǎo)和組合成各種數(shù)學(xué)形態(tài)學(xué)實(shí)用算法,用它們可以進(jìn)行圖像形狀和結(jié)構(gòu)的分析及處理,包括圖像分割、特征提取、邊界檢測(cè)、圖像降噪、圖像增強(qiáng)和恢復(fù)等。
圖像分析
從圖像中抽取某些有用的度量、數(shù)據(jù)或信息。目的是得到某種數(shù)值結(jié)果,而不是產(chǎn)生另一個(gè)圖像。圖像分析的內(nèi)容和模式識(shí)別、人工智能的研究領(lǐng)域有交叉,但圖像分析與典型的模式識(shí)別有所區(qū)別。圖像分析不限于把圖像中的特定區(qū)域按固定數(shù)目的類別加以分類,它主要是提供關(guān)于被分析圖像的一種描述。為此,既要利用模式識(shí)別技術(shù),又要利用關(guān)于圖像內(nèi)容的知識(shí)庫,即人工智能中關(guān)于知識(shí)表達(dá)方面的內(nèi)容。圖像分析需要用圖像分割方法抽取出圖像的特征,然后對(duì)圖像進(jìn)行符號(hào)化的描述。這種描述不僅能對(duì)圖像中是否存在某一特定對(duì)象作出回答,還能對(duì)圖像內(nèi)容作出詳細(xì)描述。
圖像處理的各個(gè)內(nèi)容是互相有聯(lián)系的。一個(gè)實(shí)用的圖像處理系統(tǒng)往往結(jié)合應(yīng)用幾種圖像處理技術(shù)才能得到所需要的結(jié)果。圖像數(shù)字化是將一個(gè)圖像變換為適合計(jì)算機(jī)處理的形式的第一步。圖像編碼技術(shù)可用以傳輸和存儲(chǔ)圖像。圖像增強(qiáng)和復(fù)原可以是圖像處理的最后目的,也可以是為進(jìn)一步的處理作準(zhǔn)備。通過圖像分割得出的圖像特征可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎(chǔ)。
圖像匹配、描述和識(shí)別對(duì)圖像進(jìn)行比較和配準(zhǔn),通過分制提取圖像的特征及相互關(guān)系,得到圖像符號(hào)化的描述,再把它同模型比較,以確定其分類。圖像匹配試圖建立兩張圖片之間的幾何對(duì)應(yīng)關(guān)系,度量其類似或不同的程度。匹配用于圖片之間或圖片與地圖之間的配準(zhǔn),例如檢測(cè)不同時(shí)間所拍圖片之間景物的變化,找出運(yùn)動(dòng)物體的軌跡。
從圖像中抽取某些有用的度量、數(shù)據(jù)或信息稱為圖像分析。圖像分析的基本步驟是把圖像分割成一些互不重疊的區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集,度量它們的性質(zhì)和關(guān)系,最后把得到的圖像關(guān)系結(jié)構(gòu)和描述景物分類的模型進(jìn)行比較,以確定其類型。識(shí)別或分類的基礎(chǔ)是圖像的相似度。一種簡(jiǎn)單的相似度可用區(qū)域特征空間中的距離來定義。另一種基于像素值的相似度量是圖像函數(shù)的相關(guān)性。最后一種定義在關(guān)系結(jié)構(gòu)上的相似度稱為結(jié)構(gòu)相似度。
以圖片分析和理解為目的的分割、描述和識(shí)別將用于各種自動(dòng)化的系統(tǒng),如字符和圖形識(shí)別、用機(jī)器人進(jìn)行產(chǎn)品的裝配和檢驗(yàn)、自動(dòng)軍事目標(biāo)識(shí)別和跟蹤、指紋識(shí)別、X光照片和血樣的自動(dòng)處理等。在這類應(yīng)用中,往往需綜合應(yīng)用模式識(shí)別和計(jì)算機(jī)視覺等技術(shù),圖像處理更多的是作為前置處理而出現(xiàn)的。
多媒體應(yīng)用的掀起,對(duì)圖像壓縮技術(shù)的應(yīng)用起了很大的推動(dòng)作用。圖像,包括錄像帶一類動(dòng)態(tài)圖像將轉(zhuǎn)為數(shù)字圖像,并和文字、聲音、圖形一起存儲(chǔ)在計(jì)算機(jī)內(nèi),顯示在計(jì)算機(jī)的屏幕上。它的應(yīng)用將擴(kuò)展到教育、培訓(xùn)和娛樂等新的領(lǐng)域。
應(yīng)用
攝影及印刷
衛(wèi)星圖像處理(Satellite image processing)
醫(yī)學(xué)圖像處理(Medical image processing)
面孔識(shí)別,特征識(shí)別(Face detection, feature detection, face identification)
顯微圖像處理(Microscope image processing)
汽車障礙識(shí)別(Car barrier detection)
常見軟件
Adobe Photoshop
軟件特點(diǎn):知名度以及使用率最高的圖像處理軟件。
軟件優(yōu)勢(shì):使用業(yè)界標(biāo)準(zhǔn)的Adobe PhotoshopCS軟件更加快速地獲取更好效果,同時(shí)為圖形和Web設(shè)計(jì)、攝影及視頻提供必不可少的新功能。
與同行軟件的比較:這回Adobe的確給設(shè)計(jì)師們帶來了很大的驚喜,Photoshop CS新增了許多強(qiáng)有力的功能,特別是對(duì)于攝影師來講,這次它大大突破了以往Photoshop系列產(chǎn)品更注重平面設(shè)計(jì)的局限性,對(duì)數(shù)碼暗房的支持功能有了極大的加強(qiáng)和突破。
近期版本:2016年11月2日,Adobe 公司更新了旗下 Photoshop CC 2017最新版。
Adobe Illustrator
軟件特點(diǎn):專業(yè)矢量繪圖工具,功能強(qiáng)大,界面友好。
軟件優(yōu)勢(shì):無論您是生產(chǎn)印刷出版線稿的設(shè)計(jì)者和專業(yè)插畫家、生產(chǎn)多媒體圖像的藝術(shù)家、還是互聯(lián)網(wǎng)頁或在線內(nèi)容的制作者,都會(huì)發(fā)現(xiàn)Illustrator不僅僅是一個(gè)藝術(shù)產(chǎn)品工具,能適合大部分小型設(shè)計(jì)到大型的復(fù)雜項(xiàng)目。
與同行軟件的比較:功能極其強(qiáng)大,操作相當(dāng)專業(yè)。與Adobe公司其它軟件如Photoshop、Primiere及Indesign等軟件可以良好的兼容,在專業(yè)領(lǐng)域優(yōu)勢(shì)比較明顯。
CorelDRAW
軟件特點(diǎn):界面設(shè)計(jì)友好,空間廣闊,操作精微細(xì)致。兼容性佳。
軟件優(yōu)勢(shì):非凡的設(shè)計(jì)能力廣泛地應(yīng)用于商標(biāo)設(shè)計(jì)、標(biāo)志制作、模型繪制、插圖描畫、排版及分色輸出等等諸多領(lǐng)域。市場(chǎng)領(lǐng)先的文件兼容性以及高質(zhì)量的內(nèi)容可幫助您將創(chuàng)意變?yōu)閷I(yè)作品。從與眾不同的徽標(biāo)和標(biāo)志到引人注目的營(yíng)銷材料以及令人賞心悅目的Web圖形,應(yīng)有盡有。
與同行軟件的比較:功能強(qiáng)大,兼容性極好,可生成各種與其它軟件相兼容的格式,操作較Illustrator簡(jiǎn)單,在國(guó)內(nèi)中小型廣告設(shè)計(jì)公司應(yīng)用率極高。
可牛影像
軟件特點(diǎn):可牛影像是新一代的圖片處理軟件,獨(dú)有美白祛痘、瘦臉瘦身、明星場(chǎng)景、多照片疊加等功能,更有50余種照片特效,數(shù)秒即可制作出影樓級(jí)的專業(yè)照片。
軟件優(yōu)勢(shì):圖片編輯、人像美容、場(chǎng)景日歷、添加水印飾品、添加各種藝術(shù)字體、制作動(dòng)感閃圖、搖頭娃娃、多圖拼接,使人能想到的功能,應(yīng)有盡有,而且簡(jiǎn)單易用。
與同行軟件的比較:場(chǎng)景日歷、動(dòng)感閃圖、搖頭娃娃等都是傳統(tǒng)圖像處理軟件所沒有的。有了可牛影像,不需要再像photoshop那樣,需要專業(yè)的技能才能處理照片。
光影魔術(shù)手
軟件特點(diǎn):“nEO iMAGING”〖光影魔術(shù)手〗是一個(gè)對(duì)數(shù)碼照片畫質(zhì)進(jìn)行改善及效果處理的軟件。簡(jiǎn)單、易用,不需要任何專業(yè)的圖像技術(shù),就可以制作出專業(yè)膠片攝影的色彩效果。
軟件優(yōu)勢(shì):模擬反轉(zhuǎn)片的效果,令照片反差更鮮明,色彩更亮麗,模擬反轉(zhuǎn)負(fù)沖的效果,色彩詭異而新奇,模擬多類黑白膠片的效果,在反差、對(duì)比方面,和數(shù)碼相片完全不同。
與同行軟件的比較:是一個(gè)照片畫質(zhì)改善和個(gè)性化處理的軟件。簡(jiǎn)單、易用,每個(gè)人都能制作精美相框、藝術(shù)照、專業(yè)膠片效果,而且完全免費(fèi)。
ACDSee
軟件特點(diǎn):不論您拍攝的相片是什么類型-家人與朋友的,或是作為業(yè)余愛好而拍攝的藝術(shù)照-您都需要相片管理軟件來輕松快捷地整理以及查看、修正和共享這些相片。
軟件優(yōu)勢(shì):ACDSee 9可以從任何存儲(chǔ)設(shè)備快速“獲取相片”,還可以使用受密碼保護(hù)的“隱私文件夾”這項(xiàng)新功能來存儲(chǔ)機(jī)密信息。
與同行軟件的比較:強(qiáng)大的電子郵件選項(xiàng)、幻燈放映、CD/DVD刻錄,還有讓共享相片變得輕而易舉的網(wǎng)絡(luò)相冊(cè)工具。使用紅眼消除、色偏消除、曝光調(diào)整以及“相片修復(fù)”工具等快速修正功能來改善相片。
Macromedia Flash
軟件特點(diǎn):一個(gè)可視化的網(wǎng)頁設(shè)計(jì)和網(wǎng)站管理工具,支持最新的Web技術(shù),包含HTML檢查、HTML格式控制、HTML格式化選項(xiàng)等。
軟件優(yōu)勢(shì):除了新的視頻和動(dòng)畫特性,還提供了新的繪圖效果和更好的腳本支持,同時(shí)也集成了流行的視頻輯和編碼工具,還提供軟件允許用戶測(cè)試移動(dòng)手機(jī)中的Flash內(nèi)容等新功能。
與同行軟件的比較:在編輯上你可以選擇可視化方式或者你喜歡的源碼編輯方式。
Ulead GIF Animator
軟件特點(diǎn):友立公司出版的動(dòng)畫GIF制作軟件,內(nèi)建的Plugin有許多現(xiàn)成的特效可以立即套用,可將AVI文件轉(zhuǎn)成動(dòng)畫GIF文件,而且還能將動(dòng)畫GIF圖片最佳化,能將你放在網(wǎng)頁上的動(dòng)畫GIF圖檔減肥,以便讓人能夠更快速的瀏覽網(wǎng)頁。
軟件優(yōu)勢(shì):這是一個(gè)很方便的GIF 動(dòng)畫制作軟件,由Ulead Systems.Inc 創(chuàng)作。Ulead GIF Animator 不但可以把一系列圖片保存為GIF 動(dòng)畫格式,還能產(chǎn)生二十多種2D 或3D 的動(dòng)態(tài)效果,足以滿足您制作網(wǎng)頁動(dòng)畫的要求。
與同行軟件的比較:與其它圖形文件格式不同的是, 一個(gè)GIF文件中可以儲(chǔ)存多幅圖片,這時(shí), GIF 將其中存儲(chǔ)的圖片像播放幻燈片一樣輪流顯示, 這樣就形成了一段動(dòng)畫。
內(nèi)容來自百科網(wǎng)