公務(wù)員期刊網(wǎng) 精選范文 計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

計(jì)算機(jī)視覺(jué)研究領(lǐng)域精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺(jué)研究領(lǐng)域主題范文,僅供參考,歡迎閱讀并收藏。

計(jì)算機(jī)視覺(jué)研究領(lǐng)域

第1篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

關(guān)鍵詞:計(jì)算機(jī)視覺(jué);定標(biāo)方法;應(yīng)用特點(diǎn)

中圖分類號(hào):TP319文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):16727800(2012)007014902

作者簡(jiǎn)介:許志雄(1968-),男,浙江紹興人,江漢石油鉆頭股份有限公司工程師,研究方向?yàn)橛?jì)算機(jī)多媒體。

0引言

計(jì)算機(jī)技術(shù)的應(yīng)用在諸多領(lǐng)域占據(jù)了主要位置,并得到了人們的極大重視。在此形勢(shì)下,攝像機(jī)的高清晰度亦成為了人們追逐的目標(biāo),而在計(jì)算機(jī)視覺(jué)中的定標(biāo)方法有各種不同的處理方式,從而為攝像機(jī)的發(fā)展提供了一個(gè)絕好的機(jī)會(huì)。由此,計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法成為當(dāng)今世界攝像機(jī)研究領(lǐng)域里至關(guān)重要的一個(gè)方面,以攝像機(jī)得到的圖像信息作為出發(fā)點(diǎn)來(lái)計(jì)算三維空間中自然場(chǎng)景的幾何信息成為計(jì)算機(jī)視覺(jué)的基本任務(wù)之一,并且它的應(yīng)用特點(diǎn)也得到了人們的密切關(guān)注。

1攝像機(jī)視覺(jué)投影原理

透鏡成像的原理利用了光的折射現(xiàn)象,而攝像機(jī)的視覺(jué)投影原理和透鏡的成像原理相差無(wú)幾,只不過(guò)在一些細(xì)節(jié)上進(jìn)行了相應(yīng)的改變,使成像更加清晰,以更好地滿足人們的需求。攝像機(jī)視覺(jué)投影原理就是利用鏡頭的光學(xué)原理進(jìn)行視覺(jué)成像,而其中又有許多理論支持,包含鏡頭與焦距和視角。焦距是指鏡頭的焦點(diǎn)之間的距離,對(duì)于攝像機(jī)而言,就是指從鏡頭的中心位置到攝像管,也可以說(shuō)是成像的位置之間的距離就是攝像機(jī)鏡頭的焦距,只有調(diào)整好了這兩者之間的距離,才能保證攝像機(jī)的攝像效果,這也是保證攝像機(jī)正常工作的首要任務(wù)。視角要受到鏡頭焦距的限制,由鏡頭焦距對(duì)攝像的大小情況而決定,攝影師們就是通過(guò)對(duì)焦距的不斷變換來(lái)改變對(duì)任務(wù)的造型,從而改變?nèi)藗兊囊曈X(jué)效果。對(duì)于拍攝相同距離的目標(biāo)而言,鏡頭焦距越大,攝像的水平視角就會(huì)變得越窄,這樣帶來(lái)的后果就是拍攝到的目標(biāo)的范圍就越小,使得拍攝效果大打折扣,從而給攝像機(jī)帶來(lái)不利的使用效益。因此,必須在兩者達(dá)到一個(gè)較好的組合效果之時(shí),才能夠充分發(fā)揮攝像機(jī)的作用,并將攝像藝術(shù)發(fā)揮到極致。由此可見(jiàn),計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法將會(huì)給攝像機(jī)的拍攝效果帶來(lái)巨大的轉(zhuǎn)變。

2計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法

2.1三維定標(biāo)法

在人們的平常思維中,凡是物體的影像必定是三維的,本文的理論研究也同樣基于這樣的想法。在討論單幅圖像的設(shè)計(jì)標(biāo)定之時(shí),我們所追求的理論基礎(chǔ)就是需要攝像機(jī)的定標(biāo)物是人們所追求的那種三維的效果,在此基礎(chǔ)上再進(jìn)行相關(guān)的理論研究,以達(dá)到相得益彰的效果。在此過(guò)程中,首先要準(zhǔn)確定位定標(biāo)物上一些比較重要的點(diǎn)的三維坐標(biāo),這樣才能夠?yàn)楹髞?lái)的工作提供方便;然后在與定標(biāo)物相對(duì)應(yīng)的成像上找到相應(yīng)的點(diǎn)的位置,這是至關(guān)重要的一步,這也決定了后面成像的具體設(shè)計(jì)方法;最后在那些比較重要的點(diǎn)的圖像上標(biāo)出其具體的三維坐標(biāo),達(dá)到定標(biāo)物的實(shí)際成像效果圖,這樣就可以完全解決攝像機(jī)的成像問(wèn)題了。這種定標(biāo)方法的基本原理就是充分分析定標(biāo)物的三維信息,同時(shí)與它的具體成像位置相關(guān)聯(lián),在這兩者之間形成一種具體的相對(duì)應(yīng)關(guān)系。由此我們可以充分利用計(jì)算機(jī)的快速運(yùn)算,實(shí)現(xiàn)攝像的功能,并適時(shí)進(jìn)行程序功能改進(jìn),優(yōu)化定標(biāo)物參數(shù)的獲取方法,從而達(dá)到增加攝像機(jī)清晰度的目標(biāo)。

2.2平面定標(biāo)法

與上面的定標(biāo)方法相對(duì)立的一種方法就是多幅圖像的設(shè)計(jì)標(biāo)定。在這樣的時(shí)代背景下,人們的要求應(yīng)盡可能得到滿足,因而理論研究者會(huì)在這個(gè)方面下足功夫,弄懂這里面的個(gè)中玄機(jī),利用多幅圖像對(duì)平面的定標(biāo)物來(lái)進(jìn)行物體的標(biāo)定工作,以達(dá)到攝像機(jī)定標(biāo)的目的。這樣的平面定標(biāo)方法就是充分利用平面物體的運(yùn)動(dòng)特性,在它和攝像機(jī)之間找到一個(gè)平衡點(diǎn),觀察兩者的相對(duì)運(yùn)動(dòng),這樣的定標(biāo)方法也給拍攝運(yùn)動(dòng)中的物體帶來(lái)了生機(jī)。此方法在實(shí)施之余也會(huì)帶給人們不一樣的感受,讓人們充分體會(huì)到攝像的魅力。當(dāng)然這種考慮運(yùn)動(dòng)的平面定標(biāo)法會(huì)受到特征點(diǎn)的增多的影響,隨著點(diǎn)的不斷增加,定標(biāo)情況就會(huì)越來(lái)越好,定標(biāo)物的精度也會(huì)不斷提高,于是在定標(biāo)物相同的前提下,平面定標(biāo)法自然就可以從定標(biāo)物上獲得更多的數(shù)據(jù)信息,為準(zhǔn)確對(duì)定標(biāo)物進(jìn)行定位測(cè)量提供了更多的依據(jù)。因此,這種方法的效果要比前面的方法好很多,得到推廣的力度也會(huì)大大增加,所得到的經(jīng)濟(jì)效益也會(huì)增加,設(shè)備的成本在原來(lái)的基礎(chǔ)上還有降低的趨勢(shì)。所以,理論研究者的研究領(lǐng)域就會(huì)逐漸向這一方面進(jìn)行轉(zhuǎn)變。

2.3兩步定標(biāo)法

有了前面的研究成果作支撐,攝像機(jī)定標(biāo)方法的進(jìn)一步研究就會(huì)顯得異常容易,人們的進(jìn)一步要求也會(huì)得到滿足,可謂一舉兩得。理論研究者們?cè)谟辛素S富的理論和實(shí)踐基礎(chǔ)之后,利用直接線性的定標(biāo)方法進(jìn)行攝像機(jī)參數(shù)的進(jìn)一步優(yōu)化提高,通過(guò)透視原理來(lái)修改以前的參數(shù),然后將修正的參數(shù)進(jìn)行初始值的確認(rèn),把它們作為現(xiàn)在研究階段的起點(diǎn),在這樣的起點(diǎn)之上綜合考慮各種外界因素,利用最優(yōu)化的計(jì)算機(jī)算法進(jìn)行攝像機(jī)成像程序的改進(jìn),把原來(lái)的程序進(jìn)行升級(jí)處理,使得定標(biāo)物的精確度得到進(jìn)一步的提高,這就是我們所提到的兩步定標(biāo)法。它的基本原理其實(shí)很簡(jiǎn)單,只不過(guò)是充分利用了原有的理論,并進(jìn)行了一定的創(chuàng)新而已。但就是這樣的創(chuàng)新步伐的邁出,給計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法帶來(lái)了新的生機(jī),也給攝像機(jī)鏡頭的優(yōu)化帶來(lái)了很多指導(dǎo)方法。在圖像中心到圖像點(diǎn)的距離保持不變的前提下,參數(shù)的數(shù)量會(huì)顯著減少,這樣不僅節(jié)省了材料的用量,而且還進(jìn)一步提高了攝像機(jī)的攝像清晰度,有效彌補(bǔ)了以前清晰度不高的缺點(diǎn)。這樣一來(lái),攝像機(jī)的成像效果大大改進(jìn),于是才有了現(xiàn)代攝像機(jī)的高清效果,確實(shí)讓人們享受到了科技帶來(lái)的福音。

3計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法的應(yīng)用特點(diǎn)

3.1建立于主動(dòng)視覺(jué)上的自我標(biāo)定

由于計(jì)算機(jī)視覺(jué)中攝像機(jī)定標(biāo)方法的不斷推廣,一些計(jì)算機(jī)技術(shù)在攝像機(jī)的制作過(guò)程中得到了較好的應(yīng)用。但是在這之中必不可少地存在一些制作人員或設(shè)計(jì)人員的主觀因素,這樣攝像機(jī)的標(biāo)定方法中就會(huì)形成形色各異的特點(diǎn),而且彼此之間可能會(huì)出現(xiàn)較大的不同,特別是在主動(dòng)視覺(jué)上的自我標(biāo)定。在主動(dòng)視覺(jué)中,我們所用到的攝像機(jī)可以在一個(gè)被控制的平臺(tái)上被人們固定,利用計(jì)算機(jī)的高運(yùn)算能力,計(jì)算機(jī)可以把平臺(tái)上所出現(xiàn)的參數(shù)精確地讀出來(lái),我們只需要利用控制攝像機(jī)的運(yùn)轉(zhuǎn)順序,讓攝像機(jī)作一定的周期運(yùn)動(dòng),就可以在這個(gè)過(guò)程中得到更多的圖像,然后再利用所成的圖像和固定的攝像機(jī)的運(yùn)動(dòng)參數(shù)來(lái)確定攝像機(jī)的運(yùn)動(dòng)情況。這種自我標(biāo)定方法比較簡(jiǎn)單,但是必須為人們提供精確控制攝像機(jī)運(yùn)動(dòng)的平臺(tái),這種以主觀意識(shí)為主的標(biāo)定特點(diǎn)強(qiáng)化了個(gè)人的主觀能動(dòng)性,讓人們更加易于接受。

3.2進(jìn)行有層次劃分的逐步標(biāo)定

近年來(lái),人們對(duì)攝像技術(shù)的理論研究已經(jīng)日趨成熟,并根據(jù)自己的意愿進(jìn)行相關(guān)的研究工作,把自己的想法融入到攝像機(jī)的設(shè)計(jì)中,真正做到有層次的逐步標(biāo)定,把所要的標(biāo)定物以逐個(gè)擊破的方式實(shí)現(xiàn)有層次的程序算法,從而讓人們?cè)谶壿嬌夏軌蛴兴J(rèn)識(shí),并且易于接受,從而達(dá)到有層次劃分的逐步標(biāo)定的目的。分層逐步標(biāo)定法已為標(biāo)定研究領(lǐng)域中普遍認(rèn)同的方法之一,在實(shí)際的應(yīng)用中逐漸取代了直接標(biāo)定的方法。因?yàn)檫M(jìn)行有層次劃分的逐步標(biāo)定是符合人們的想法的,而且這種方法的特點(diǎn)是以射影標(biāo)定作為基礎(chǔ),以某一幅圖像作為基準(zhǔn)圖像,進(jìn)行其它圖像的射影對(duì)齊工作,從而將攝相機(jī)中成像未知參數(shù)的數(shù)量減少,更易于為人們所接受??梢哉f(shuō),進(jìn)行有層次劃分的逐步標(biāo)定是人們?cè)趯?shí)踐中得出的一套符合大勢(shì)所趨的標(biāo)定方法,為世人所推崇。

4結(jié)語(yǔ)

綜上所述,計(jì)算機(jī)視覺(jué)中攝像機(jī)定標(biāo)方法在人們的不斷認(rèn)識(shí)中得以應(yīng)用和推廣,在時(shí)代的不斷進(jìn)步中逐漸向前發(fā)展。同時(shí),攝像機(jī)標(biāo)定方法的應(yīng)用特點(diǎn)也大相徑庭,各有千秋,從而實(shí)現(xiàn)百家爭(zhēng)鳴的態(tài)勢(shì),進(jìn)一步推動(dòng)計(jì)算機(jī)視覺(jué)中的攝像機(jī)研究工作的向前發(fā)展。

參考文獻(xiàn):

第2篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

【關(guān)鍵字】非線性濾波 概率密度 重采樣 粒子退化

一、引言

粒子濾波(PF)是一種在處理非線性非高斯系統(tǒng)狀態(tài)估計(jì)問(wèn)題時(shí)具有較好估計(jì)效果的方法,其原理是通過(guò)非參數(shù)蒙特卡洛方法實(shí)現(xiàn)貝葉斯濾波。其最早起源于Hammersley等人在20實(shí)際50年代末提出的順序重要性采樣(SIS)濾波思想。

但由于上述方法存在嚴(yán)重的樣本權(quán)值退化從而導(dǎo)致的粒子數(shù)匱乏現(xiàn)象,直到1993年Gordon等人將重采樣技術(shù)引入蒙特卡洛重要性采樣過(guò)程,提出一種Bootstrap濾波方法,從而奠定了粒子濾波算法的基礎(chǔ)。

二、基本粒子濾波算法

三、粒子濾波算法存在的主要問(wèn)題及改進(jìn)

對(duì)于SIS算法來(lái)說(shuō),容易出現(xiàn)粒子的退化問(wèn)題,目前存在的諸多對(duì)SIS算法的改進(jìn)中,能夠降低該現(xiàn)象影響的有效方法是選擇合適的重要性函數(shù)和采用重采樣方法。

針對(duì)狀態(tài)空間模型的改進(jìn)算法,如輔助變量粒子濾波算法(APF),局部線性化方法,代表的算法主要有EKF,UKF等。針對(duì)重采樣改進(jìn)方法,文獻(xiàn)通過(guò)將遺傳算法和進(jìn)化算法引入粒子濾波算法中,增加重采樣過(guò)程中粒子的多樣性。

然APF算法在過(guò)程噪聲較小時(shí),可獲得比標(biāo)準(zhǔn)粒子濾波更高的濾波精度,在過(guò)程噪聲較大時(shí),其效果則大大降低。采用局部線性化的方法EKF,UKF都是針對(duì)非線性系統(tǒng)的線性卡爾曼濾波方法的變形和改進(jìn),因此受到線性卡爾曼濾波算法的條件制約,而對(duì)于非高斯分布的狀態(tài)模型,其濾波性能變差。

將遺傳算法和進(jìn)化算法與粒子濾波結(jié)合的改進(jìn)粒子濾波算法,雖取得了較好的濾波效果,然而是以消耗過(guò)多計(jì)算資源為代價(jià)的。

四、粒子濾波的應(yīng)用

4.1 目標(biāo)跟蹤

對(duì)目標(biāo)進(jìn)行定位和跟蹤是典型的動(dòng)態(tài)系統(tǒng)狀態(tài)估計(jì)問(wèn)題,在諸如純角度跟蹤的運(yùn)動(dòng)模型中,采用粒子濾波方法進(jìn)行實(shí)現(xiàn)目標(biāo)跟蹤已獲得了較好的跟蹤精度,文獻(xiàn)研究了多目標(biāo)跟蹤與數(shù)據(jù)融合問(wèn)題,文獻(xiàn)給出了基于粒子濾波的群目標(biāo)跟蹤算法。

4.2 計(jì)算機(jī)視覺(jué)

近年來(lái),通過(guò)序列圖像對(duì)感興趣的區(qū)域進(jìn)行持續(xù)跟蹤問(wèn)題引起人們廣泛關(guān)注,Isard M率先將粒子濾波算法引用了計(jì)算機(jī)視覺(jué)領(lǐng)域,Maccormick J較系統(tǒng)的總結(jié)了粒子濾波方法在計(jì)算機(jī)視覺(jué)中的應(yīng)用,從中可了解粒子濾波算法在該領(lǐng)域中的應(yīng)用成果和發(fā)展趨勢(shì)。

第3篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

【關(guān)鍵詞】自動(dòng)控制技術(shù);農(nóng)業(yè)自動(dòng)化

由于歷史、觀念和技術(shù)等方面的原因, 我國(guó)傳統(tǒng)農(nóng)業(yè)機(jī)械與發(fā)達(dá)國(guó)家相比有很大差距,已遠(yuǎn)遠(yuǎn)不能適應(yīng)農(nóng)業(yè)的科技進(jìn)步。近些年來(lái), 自動(dòng)化的研究逐漸被人們所認(rèn)識(shí), 自動(dòng)控制在農(nóng)業(yè)上的應(yīng)用越來(lái)越受到重視。例如,把計(jì)算機(jī)技術(shù)、微處理技術(shù)、傳感與檢測(cè)技術(shù)、信息處理技術(shù)結(jié)合起來(lái), 應(yīng)用于傳統(tǒng)農(nóng)業(yè)機(jī)械, 極大地促進(jìn)了產(chǎn)品性能的提高。我國(guó)農(nóng)業(yè)部門(mén)總結(jié)了一些地區(qū)的農(nóng)業(yè)自動(dòng)化先進(jìn)經(jīng)驗(yàn)(如臺(tái)灣地區(qū)的農(nóng)業(yè)生產(chǎn)自動(dòng)化、漁業(yè)生產(chǎn)自動(dòng)化、畜牧業(yè)生產(chǎn)自動(dòng)化及農(nóng)產(chǎn)品貿(mào)易自動(dòng)化)的開(kāi)發(fā)與應(yīng)用情況, 同時(shí)也汲取了國(guó)外一些國(guó)家的先進(jìn)經(jīng)驗(yàn)、技術(shù),如日本的四行半喂人聯(lián)合收割機(jī)是計(jì)算機(jī)控制的自動(dòng)化裝置在半喂人聯(lián)合收割機(jī)中的應(yīng)用,英國(guó)通過(guò)對(duì)施肥機(jī)散播肥料的動(dòng)力測(cè)量來(lái)控制肥料的精確使用量。這些技術(shù)和方法是我國(guó)農(nóng)業(yè)機(jī)械的自動(dòng)化裝置得到了補(bǔ)充和新的發(fā)展,從而形成了一系列適合我國(guó)農(nóng)業(yè)特點(diǎn)的自動(dòng)化控制技術(shù)。

1.已有的農(nóng)業(yè)機(jī)械及裝置的部分自動(dòng)化控制

自動(dòng)化技術(shù)提高了已有農(nóng)業(yè)機(jī)械及裝置的作業(yè)性能和操作性能。浙江省把自動(dòng)化技術(shù)應(yīng)用于茶葉機(jī)械上,成功研制出6CRK-55型可編程控制加壓茶葉揉捻機(jī),它利用計(jì)算機(jī)控制電功加壓機(jī)構(gòu),能根據(jù)茶葉的具體情況編制最佳揉捻程序?qū)崿F(xiàn)揉捻過(guò)程的自動(dòng)控制,是機(jī)電一體化技術(shù)在茶葉機(jī)械上的首次成功應(yīng)用。

1.1應(yīng)用于拖拉機(jī)

在農(nóng)用拖拉機(jī)上已廣泛使用了機(jī)械油壓式三點(diǎn)聯(lián)結(jié)的位調(diào)節(jié)和力調(diào)節(jié)系統(tǒng)裝置, 現(xiàn)又在開(kāi)發(fā)和采用性能更完善的電子油壓式三點(diǎn)聯(lián)結(jié)裝置。

1.2應(yīng)用于施肥播種機(jī)

根據(jù)行駛速度和檢測(cè)種子粒數(shù)來(lái)確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。

1.3應(yīng)用于谷物干燥機(jī)

不受外界條件干擾, 能自動(dòng)維持熱風(fēng)溫度的裝置停電或干燥機(jī)過(guò)熱引起火災(zāi)時(shí),自動(dòng)掐斷燃料供給的裝置。

2.微灌自動(dòng)控制技術(shù)

我國(guó)從20世紀(jì)年50代就開(kāi)始進(jìn)行節(jié)水灌溉的研究與推廣據(jù)統(tǒng)計(jì)。到1992年,全國(guó)共有節(jié)水灌溉工程面積0.133億m2,其中噴灌面積80萬(wàn)m2, 農(nóng)業(yè)節(jié)水工程取得了巨大的進(jìn)展。灌溉管理自動(dòng)化是發(fā)展高效農(nóng)業(yè)的重要手段,高效農(nóng)業(yè)和精細(xì)農(nóng)業(yè)要求必須實(shí)現(xiàn)水資源的高效利用。采用遙感遙測(cè)等新技術(shù)監(jiān)測(cè)土壤墑性和作物生長(zhǎng)情況,對(duì)灌溉用水進(jìn)行動(dòng)態(tài)監(jiān)測(cè)預(yù)報(bào),實(shí)現(xiàn)灌溉用水管理的自動(dòng)化和動(dòng)態(tài)管理。在微灌技術(shù)領(lǐng)域,我國(guó)先后研制和改進(jìn)了等流量滴灌設(shè)備、微噴灌設(shè)備、微灌帶、孔口滴頭、壓力補(bǔ)償式滴頭、折射式和旋轉(zhuǎn)式微噴頭、過(guò)濾器和進(jìn)排氣閥等設(shè)備,總結(jié)出了一套基本適合我國(guó)國(guó)情的微灌設(shè)計(jì)參數(shù)和計(jì)算方法,建立了一批新的試驗(yàn)示范基地。在一些地區(qū)實(shí)現(xiàn)了自動(dòng)化灌溉系統(tǒng),可以長(zhǎng)時(shí)間地自動(dòng)啟閉水泵和自動(dòng)按一定的輪灌順序進(jìn)行灌溉。這種系統(tǒng)中應(yīng)用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。

3.自動(dòng)控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用

第4篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

提起數(shù)字媒體,人們通常會(huì)想到傳媒行業(yè),其實(shí)數(shù)字媒體的應(yīng)用絕不局限于傳媒。隨著寬帶網(wǎng)絡(luò)的普及,人們?cè)谌粘I(yè)務(wù)處理過(guò)程中,正面對(duì)越來(lái)越豐富的網(wǎng)上媒體和內(nèi)容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數(shù)字媒體方面的專家一起來(lái)分享這個(gè)繽紛的世界。

三維幾何建模與形狀表示

北京大學(xué)視覺(jué)與聽(tīng)覺(jué)信息處理國(guó)家重點(diǎn)實(shí)驗(yàn)室主任教育部長(zhǎng)江學(xué)者獎(jiǎng)勵(lì)計(jì)劃特聘教授 查紅彬

精彩問(wèn)答

在背景比較復(fù)雜、有干擾的情況下模型檢索的效果怎么樣?

在模型檢索的時(shí)候并沒(méi)有考慮背景,因?yàn)檫@是做模型檢索比較容易的部分。模型檢索一般是沒(méi)有背景的,但也可以做,但是要推廣到背景比較復(fù)雜的物體上識(shí)別可能有很大的問(wèn)題,因?yàn)檫@時(shí)候匹配不僅僅是局部匹配,而是兩個(gè)子集和子集的匹配問(wèn)題,到目前為止,我們只是做沒(méi)有背景的模型檢索。

為什么要重新談?wù)撊S形狀表示問(wèn)題?在多媒體信息處理領(lǐng)域里面,有兩個(gè)比較重要的方向,這也是計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域里兩個(gè)重要的方向,一個(gè)是計(jì)算機(jī)視覺(jué),一個(gè)是計(jì)算機(jī)圖形學(xué)。計(jì)算機(jī)視覺(jué)是從圖像中通過(guò)識(shí)別或重建處理,得到一個(gè)對(duì)對(duì)象物的描述。反過(guò)來(lái)說(shuō)圖形學(xué),是對(duì)一個(gè)對(duì)象和場(chǎng)景的描述,通過(guò)繪制和動(dòng)畫(huà)生成圖像和視頻。它們從處理過(guò)程來(lái)說(shuō)是逆過(guò)程,這兩個(gè)領(lǐng)域之間有密切的關(guān)聯(lián)。

我們現(xiàn)在考慮計(jì)算機(jī)三維建?;蚰P偷拿枋觯紤]的不僅僅是計(jì)算機(jī)視覺(jué)或計(jì)算機(jī)圖形學(xué)所包含的內(nèi)容。這里面簡(jiǎn)單列舉一下,比如基于模型的三維物體識(shí)別和場(chǎng)景識(shí)別,這兩個(gè)應(yīng)該是典型的計(jì)算機(jī)視覺(jué)里面考慮的應(yīng)用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設(shè)計(jì)、變形、動(dòng)畫(huà)等等。除了兩個(gè)單獨(dú)研究的應(yīng)用之外,還要想怎么把兩者結(jié)合起來(lái),把虛擬和真實(shí)的東西無(wú)縫連接到一起,這些都牽涉到三維模型。

我們考慮的三維模型跟以前相比,應(yīng)用領(lǐng)域大了很多,要達(dá)到這個(gè)要求,對(duì)模型的表達(dá)、形狀的表達(dá)也都有了更高的要求。

怎樣找到一些更新更有效地表達(dá)形式來(lái)符合這些要求呢?這里有四個(gè)方面,現(xiàn)在能不能建立一個(gè)形狀空間,把考慮的對(duì)象完整地在形狀空間里面表達(dá)出來(lái)。第二點(diǎn)就是針對(duì)形狀的特性,表達(dá)要具有柔性,對(duì)象物的表面不都是連續(xù)的,也有一些非連續(xù)性和不規(guī)律性,這些特性怎樣能夠進(jìn)行柔性處理。第三個(gè)是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個(gè)很好的結(jié)合方法。第四是在大量的計(jì)算當(dāng)中,包括變形和動(dòng)畫(huà)中有很多編輯的工具,所以我們要求對(duì)現(xiàn)在的形狀表達(dá)有一些比較高的要求。

在計(jì)算機(jī)視覺(jué)里面有一個(gè)老大難就是識(shí)別,已有模型,但是眼前看到的是一部分三維數(shù)據(jù),怎么用這部分?jǐn)?shù)據(jù)和模型數(shù)據(jù)匹配來(lái)識(shí)別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個(gè)模型,從大量的數(shù)據(jù)中建立一個(gè)模型庫(kù),并從中抽取很多特征,把這些特征進(jìn)行組織。這里面牽涉三個(gè)比較大的問(wèn)題,第一個(gè)是形狀空間怎么構(gòu)造,沒(méi)有很好的特征表達(dá)或整理的形式,后面的匹配以及其他的工作就很難做。第二個(gè)是怎么定義基于這種特征的相似度。第三個(gè)是怎樣在形狀空間當(dāng)中搜索到最優(yōu)的匹配。

針對(duì)這些問(wèn)題我們最近一兩年做了一些工作,最近提出一個(gè)廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點(diǎn),能不能在三維形狀表示過(guò)程當(dāng)中,找到一些最關(guān)鍵的描述指令,并從中找到相互關(guān)系,把整體和局部結(jié)合起來(lái)。如果把之間的關(guān)系描述出來(lái),就能把局部結(jié)構(gòu)性的信息用整體觀點(diǎn)加進(jìn)去,這兩件工作就是我們做這件事情的主要目的。

在形狀描述問(wèn)題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結(jié)合到一起。今后幾年要用更多的模式識(shí)別的辦法,來(lái)解決面臨的圖形學(xué)或虛擬現(xiàn)實(shí)和計(jì)算機(jī)視覺(jué)當(dāng)中的很多問(wèn)題。

生活中的計(jì)算機(jī)視覺(jué)

香港中文大學(xué)信息工程系終身教授

微軟亞洲研究院視覺(jué)計(jì)算組負(fù)責(zé)人 湯曉歐

精彩問(wèn)答

微軟亞洲研究院視覺(jué)計(jì)算組在原創(chuàng)思想這一塊,引領(lǐng)下一個(gè)方向有沒(méi)有什么考慮,您談到很多對(duì)人們?nèi)粘I钣绊懞艽蟮膽?yīng)用,但是在背后的更深層的考慮,更新的創(chuàng)意在哪里呢?

我們的研究者都很年輕,我本人也才工作七年的時(shí)間,很多的算法已經(jīng)發(fā)展這么多年了,所以在開(kāi)始的時(shí)候比較容易想出來(lái)的方法,現(xiàn)在已經(jīng)很難有那么多的原創(chuàng)內(nèi)容。我們的工作是去找一些非常原創(chuàng)的內(nèi)容,有的是理論上的,有的是新的發(fā)明,這可以有很大的影響。

圖像通過(guò)閃光燈的分割,前景和背景深度差會(huì)不會(huì)影響分割效果,距離會(huì)不會(huì)影響分割效果呢?

我們這個(gè)通過(guò)閃光燈對(duì)圖像進(jìn)行分割的技術(shù),會(huì)一定程度上受到光的強(qiáng)度和距離的影響。

我們主要的研究領(lǐng)域包括計(jì)算機(jī)視覺(jué)、模式識(shí)別、圖像處理和視頻處理。下面就為大家介紹幾個(gè)比較典型的應(yīng)用。

如何將圖片的前景和后景分離?我們現(xiàn)在照兩張圖片,一張打閃光燈,一張沒(méi)有打閃光燈,這樣拍出來(lái)的照片背景沒(méi)有變化,但前景變化很厲害。在開(kāi)閃光燈的情況下拍的照片,前景和后景可以利用一些技術(shù)很容易地分開(kāi)來(lái)。

把一個(gè)圖片的前景切割出來(lái)放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復(fù)剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區(qū)域,我們可以由一個(gè)算法,從其他的地方借過(guò)來(lái),再貼上去,經(jīng)過(guò)這樣的處理后,圖像基本上和原來(lái)沒(méi)有太大的區(qū)別。

如此的修修補(bǔ)補(bǔ)又有什么用呢?比如說(shuō),你對(duì)這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來(lái),然后利用一些技術(shù)將劃出來(lái)的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個(gè)選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補(bǔ)上,而且讓別人看不出來(lái)。

現(xiàn)在大家的電腦上都會(huì)有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個(gè)屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現(xiàn)在做的是可以隨機(jī)把照片放到桌面上,但是電腦會(huì)對(duì)每張照片上的重要信息進(jìn)行篩選,在放盡可能多的照片的同時(shí),讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來(lái)就更清楚了。這個(gè)算法就是怎么讓所有圖像均勻分布,同時(shí)把所有背景都要蓋上。我們可以對(duì)圖像進(jìn)行各種處理,同時(shí)我們也可以利用一些技術(shù)知道別人有沒(méi)有處理圖像,對(duì)圖像有沒(méi)有做過(guò)手腳。

現(xiàn)在我們來(lái)說(shuō)說(shuō)視頻方面。比如說(shuō)抖動(dòng)很厲害的圖像,怎么把物體移到中間?一個(gè)辦法是把除移動(dòng)圖像外的公共部分切出來(lái),但是移動(dòng)越大,公共部分就會(huì)越來(lái)越小,更好的辦法是用一些技術(shù)把空處填上。

現(xiàn)在MSN的功能已經(jīng)越來(lái)越豐富。比如說(shuō)一段電影,你看到一件比較中意的衣服,只要你把鼠標(biāo)移動(dòng)衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價(jià)格。如果你把鼠標(biāo)在那件衣服上輕點(diǎn),電腦就會(huì)直接跳轉(zhuǎn)到這個(gè)衣服的相關(guān)網(wǎng)站。

你在視頻聊天的時(shí)候如果不想讓對(duì)方看到你所處的環(huán)境,你就可以很輕松地把背景模糊掉。如果大家對(duì)自己的長(zhǎng)相不是那么有信心,我們可以幫你改變一下你的長(zhǎng)相。為自己添一幅酷酷的墨鏡,換上一個(gè)性感的大嘴巴,這些都能輕而易舉地完成。

多媒體傳感器網(wǎng)絡(luò)

北京郵電大學(xué)教授、博士生導(dǎo)師

智能通信軟件與多媒體北京市重點(diǎn)實(shí)驗(yàn)室主任 馬華東

傳感器研究是IT非常熱門(mén)的話題, 首先我為大家介紹一下多媒體傳感器網(wǎng)絡(luò)的基本概念。從早期的巨型機(jī)到今天的小型機(jī),生物芯片尺寸越來(lái)越小,但是效率越來(lái)越高;網(wǎng)絡(luò)設(shè)備聯(lián)網(wǎng)和數(shù)據(jù)交換的需求越來(lái)越大,設(shè)備之間的傳輸量也越來(lái)越大;從信息處理的角度來(lái)看,內(nèi)容逐漸占據(jù)了主導(dǎo)地位,由數(shù)據(jù)為中心轉(zhuǎn)到以內(nèi)容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。

傳感器網(wǎng)絡(luò)是一組傳感器節(jié)點(diǎn),由組織方式協(xié)作地感知采集和處理感知對(duì)象的信息,它的基本特點(diǎn)是造價(jià)低、能量敏感、通信能力有限、計(jì)算能力弱、動(dòng)態(tài)變化?,F(xiàn)在的需求是要求通信能力越來(lái)越強(qiáng),計(jì)算能力應(yīng)付節(jié)點(diǎn)的處理的要求。

右圖是目前主流的傳感器節(jié)點(diǎn)的配置,從配置來(lái)講還是比較低的,現(xiàn)在信息處理側(cè)重壓力、溫度、光、震動(dòng)等簡(jiǎn)單的數(shù)據(jù)或者是標(biāo)量數(shù)據(jù)。人類獲取信息80%是視覺(jué)信息,10%左右是聽(tīng)覺(jué)信息,也就是說(shuō)90%左右的信息是多媒體信息。傳感器網(wǎng)絡(luò)就是對(duì)音頻、視頻信息獲取后提供給使用者,使其對(duì)環(huán)境信息有一個(gè)全方位的了解,對(duì)傳感器網(wǎng)絡(luò)的應(yīng)用是非常廣泛的。

從網(wǎng)絡(luò)的結(jié)構(gòu)來(lái)講,基本結(jié)構(gòu)和原來(lái)傳感器網(wǎng)絡(luò)差別不是很大,這里面強(qiáng)調(diào)增加音頻、視頻獲取處理,網(wǎng)絡(luò)傳輸整個(gè)過(guò)程的各個(gè)環(huán)節(jié),同時(shí)這里面最好可以交互。有了這個(gè)概念以后,深入分析一下主要特點(diǎn),首先是網(wǎng)絡(luò)能力的增強(qiáng),這樣一個(gè)傳感器網(wǎng)絡(luò)應(yīng)該集信息的采集、處理傳輸、轉(zhuǎn)發(fā)、能量供應(yīng)等方面,除了傳統(tǒng)的標(biāo)量數(shù)據(jù),音頻、視頻的圖像數(shù)據(jù),都可以進(jìn)行采集處理。

現(xiàn)在多媒體傳感器網(wǎng)絡(luò)目前有哪些問(wèn)題呢?從需求來(lái)看,現(xiàn)在網(wǎng)絡(luò)是異構(gòu)的信息,媒體信息的格式,種類很多,并且差異非常大,數(shù)據(jù)量比較大,特別是音頻、視頻信息,格式比較復(fù)雜。這些信息傳輸過(guò)程中需要高速實(shí)時(shí)地傳輸,對(duì)網(wǎng)絡(luò)傳輸速率也提出了比較高的要求。媒體信息的安全問(wèn)題,也是網(wǎng)絡(luò)需要考慮的,還有服務(wù)質(zhì)量的問(wèn)題。針對(duì)這些需求,我們可以看到,通信資源和計(jì)算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問(wèn)題所在。

最后談一下多媒體傳感器網(wǎng)絡(luò)研究的挑戰(zhàn),首先是節(jié)點(diǎn)的芯片設(shè)計(jì),這是基礎(chǔ),這里面需要采用多種技術(shù),包括軟硬件協(xié)同設(shè)計(jì)的技術(shù),各種技術(shù)結(jié)合,降低成本、能耗、體積、提高運(yùn)算速度和可靠性。第二是三維場(chǎng)景的覆蓋問(wèn)題,方向性傳感模型是一個(gè)簡(jiǎn)單的二維圖形,實(shí)際上是三維圖形監(jiān)測(cè),這是一個(gè)三維場(chǎng)景方向的問(wèn)題,研究這個(gè)就復(fù)雜多了。還有一個(gè)問(wèn)題是服務(wù)質(zhì)量保證問(wèn)題,在新的網(wǎng)絡(luò)當(dāng)中服務(wù)質(zhì)量體系是什么樣,也是研究的方向。再一個(gè)是信息處理,為了使網(wǎng)絡(luò)傳輸數(shù)據(jù)量比較快,能不能在節(jié)點(diǎn)做信息處理的計(jì)算。當(dāng)然信息的安全也比較重要,用這些節(jié)點(diǎn)獲取多媒體信息怎么保證安全的質(zhì)量,使應(yīng)該看到的人看到這些信息,不應(yīng)該看到的人看不到這些信息。

在多媒體傳感器網(wǎng)絡(luò)中,我們還是做了一些工作,和一些同行學(xué)者也有一些交流,這里面也有一些質(zhì)疑,說(shuō)多媒體傳感網(wǎng)絡(luò)和原來(lái)傳感器網(wǎng)絡(luò)設(shè)計(jì)初衷是不是吻合的,原來(lái)沒(méi)有想讓它處理這么多信息,原來(lái)體積比較小,加上這些信息以后,無(wú)疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網(wǎng)絡(luò)研究有沒(méi)有必要性,如果有必要性可行不可行,這都是我們目前研究的問(wèn)題。

第5篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

關(guān)鍵詞: 人工智能 發(fā)展過(guò)程 研究熱點(diǎn) 應(yīng)用領(lǐng)域 未來(lái)發(fā)展

一、人工智能概述

人工智能(Artificial Intelligence,簡(jiǎn)稱AI),也稱機(jī)器智能,它是計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語(yǔ)言學(xué)等多種學(xué)科互相滲透而發(fā)展起來(lái)的一門(mén)綜合性學(xué)科。從計(jì)算機(jī)應(yīng)用系統(tǒng)角度來(lái)看,人工智能是研究如何制造出智能機(jī)器或智能系統(tǒng),實(shí)現(xiàn)模擬人類智能活動(dòng)的能力,以延伸人們智能的科學(xué)。人工智能是一門(mén)交叉學(xué)科,是一門(mén)涉及心理學(xué)、認(rèn)知科學(xué)、思維科學(xué)、信息科學(xué)、系統(tǒng)科學(xué)和生物科學(xué)等多學(xué)科的綜合性技術(shù)學(xué)科,目前已在知識(shí)處理、模式識(shí)別、自然語(yǔ)言處理、博弈、自動(dòng)定理證明、自動(dòng)程序設(shè)計(jì)、專家系統(tǒng)、知識(shí)庫(kù)、智能機(jī)器人等多個(gè)領(lǐng)域取得舉世矚目的成果,并形成了多元化的發(fā)展方向。

二、人工智能的發(fā)展過(guò)程

人工智能經(jīng)歷了三次飛躍階段:第一次是實(shí)現(xiàn)問(wèn)題求解,代替人完成部分邏輯推理工作,如機(jī)器定理證明和專家系統(tǒng);第二次是智能系統(tǒng)能夠和環(huán)境交互,從運(yùn)行的環(huán)境中獲取信息,代替人完成包括不確定性在內(nèi)的部分思維工作,通過(guò)自身的動(dòng)作,對(duì)環(huán)境施加影響,并適應(yīng)環(huán)境的變化,如智能機(jī)器人;第三次是智能系統(tǒng),具有類人的認(rèn)知和思維能力,能夠發(fā)現(xiàn)新的知識(shí),去完成面臨的任務(wù),如基于數(shù)據(jù)挖掘的系統(tǒng)。

三、人工智能的研究熱點(diǎn)

AI研究出現(xiàn)了新的,這一方面是因?yàn)樵谌斯ぶ悄芾碚摲矫嬗辛诵碌倪M(jìn)展,另一方面是因?yàn)橛?jì)算機(jī)硬件突飛猛進(jìn)地發(fā)展。隨著計(jì)算機(jī)速度的不斷提高、存儲(chǔ)容量的不斷擴(kuò)大、價(jià)格的不斷降低,以及網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,許多原來(lái)無(wú)法完成的工作現(xiàn)在已經(jīng)能夠?qū)崿F(xiàn)。目前人工智能研究的三個(gè)熱點(diǎn)是:智能接口、數(shù)據(jù)挖掘、主體及多主體系統(tǒng)。

1.智能接口技術(shù)是研究如何使人們能夠方便自然地與計(jì)算機(jī)交流。為了實(shí)現(xiàn)這一目標(biāo),要求計(jì)算機(jī)能夠看懂文字、聽(tīng)懂語(yǔ)言、說(shuō)話表達(dá),甚至能夠進(jìn)行不同語(yǔ)言之間的翻譯,而這些功能的實(shí)現(xiàn)又依賴于知識(shí)表示方法的研究。因此,智能接口技術(shù)的研究既有巨大的應(yīng)用價(jià)值,又有基礎(chǔ)的理論意義。目前,智能接口技術(shù)已經(jīng)取得了顯著成果,文字識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音合成、圖像識(shí)別、機(jī)器翻譯及自然語(yǔ)言理解等技術(shù)已經(jīng)開(kāi)始實(shí)用化。

2.數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但是又潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的研究目前已經(jīng)形成了三根強(qiáng)大的技術(shù)支柱:數(shù)據(jù)庫(kù)、人工智能和數(shù)理統(tǒng)計(jì)。主要研究?jī)?nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉(cāng)庫(kù)、可視化技術(shù)、定性定量互換模型、知識(shí)表示方法、發(fā)現(xiàn)知識(shí)的維護(hù)和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)及網(wǎng)上數(shù)據(jù)挖掘等。

3.主體系統(tǒng)是具有信念、愿望、意圖、能力、選擇、承諾等心智狀態(tài)的實(shí)體,比對(duì)象的粒度更大,智能性更高,而且具有一定的自主性。主體試圖自治、獨(dú)立地完成任務(wù),而且可以和環(huán)境交互,與其他主體通信,通過(guò)規(guī)劃達(dá)到目標(biāo)。多主體系統(tǒng)主要研究在邏輯上或物理上分離的多個(gè)主體之間進(jìn)行協(xié)調(diào)智能行為,最終實(shí)現(xiàn)問(wèn)題求解。多主體系統(tǒng)試圖用主體來(lái)模擬人的理,主要應(yīng)用在對(duì)現(xiàn)實(shí)世界和社會(huì)的模擬、機(jī)器人及智能機(jī)械等領(lǐng)域。目前對(duì)主體和多主體系統(tǒng)的研究主要集中在主體和多主體理論、主體的體系結(jié)構(gòu)和組織、主體語(yǔ)言、主體之間的協(xié)作和協(xié)調(diào)、通信和交互技術(shù)、多主體學(xué)習(xí)及多主體系統(tǒng)應(yīng)用等方面。

四、人工智能的應(yīng)用領(lǐng)域

1.專家系統(tǒng)

專家系統(tǒng)是一個(gè)具有大量專門(mén)知識(shí)與經(jīng)驗(yàn)的程序系統(tǒng),專家系統(tǒng)存儲(chǔ)著某個(gè)專門(mén)領(lǐng)域中經(jīng)過(guò)事先總結(jié)、分析并按某種模式表示的專家知識(shí),以及擁有類似于領(lǐng)域?qū)<医鉀Q實(shí)際問(wèn)題的推理機(jī)制。專家系統(tǒng)的開(kāi)發(fā)和研究是人工智能中最活躍的一個(gè)應(yīng)用研究領(lǐng)域,涉及社會(huì)各個(gè)方面。

2.知識(shí)庫(kù)系統(tǒng)

知識(shí)庫(kù)系統(tǒng)也叫數(shù)據(jù)庫(kù)系統(tǒng),是儲(chǔ)存某學(xué)科大量事實(shí)的計(jì)算機(jī)軟件系統(tǒng),它可以回答用戶提出的有關(guān)該學(xué)科的各種問(wèn)題。知識(shí)庫(kù)系統(tǒng)的設(shè)計(jì)是計(jì)算機(jī)科學(xué)的一個(gè)活躍的分支。為了有效地表示、儲(chǔ)存和檢索大量事實(shí),已經(jīng)發(fā)展出了許多技術(shù)。但是在設(shè)計(jì)智能信息檢索系統(tǒng)時(shí)還是遇到很多問(wèn)題,包括對(duì)自然語(yǔ)言的理解,根據(jù)儲(chǔ)存的事實(shí)演繹答案的問(wèn)題、理解詢問(wèn)和演繹答案所需要的知識(shí)都可能超出該學(xué)科領(lǐng)域數(shù)據(jù)庫(kù)所表示的知識(shí)。

3.物景分析

計(jì)算機(jī)視覺(jué)已從模式識(shí)別的一個(gè)研究領(lǐng)域發(fā)展為一門(mén)獨(dú)立的學(xué)科。視覺(jué)是感知問(wèn)題之一。整個(gè)感知問(wèn)題的要點(diǎn)是形成一個(gè)精練的表示,以表示難以處理的、極其龐大的未經(jīng)加工的輸入數(shù)據(jù)。最終表示的性質(zhì)和質(zhì)量取決于感知系統(tǒng)的目標(biāo)。機(jī)器視覺(jué)的前沿研究領(lǐng)域包括實(shí)時(shí)并行處理、主動(dòng)式定性視覺(jué)、動(dòng)態(tài)和時(shí)變視覺(jué)、三維景物的建模與識(shí)別、實(shí)時(shí)圖像壓縮傳送和復(fù)原、多光譜和彩色圖像的處理與解釋等。機(jī)器視覺(jué)已在機(jī)器人裝配、衛(wèi)星圖像處理、工業(yè)過(guò)程監(jiān)控、飛行器跟蹤和制導(dǎo)及電視實(shí)況轉(zhuǎn)播等領(lǐng)域獲得極為廣泛的應(yīng)用。

4.模式識(shí)別

模式識(shí)別就是識(shí)別出給定物體所模仿的標(biāo)本或標(biāo)識(shí)。計(jì)算機(jī)模式識(shí)別系統(tǒng)能夠彌補(bǔ)計(jì)算機(jī)對(duì)外部世界感知能力低下的缺陷,使計(jì)算機(jī)能夠通過(guò)感官接受外界信息,識(shí)別和理解周?chē)h(huán)境。模式識(shí)別在二維的文字、圖形和圖像的識(shí)別方面已取得許多成果,在三維景物、活動(dòng)目標(biāo)的識(shí)別和分析方面是目前研究的熱點(diǎn),同時(shí)它還是智能計(jì)算機(jī)和智能機(jī)器人研究的十分重要的基礎(chǔ)。此外,人工智能還在機(jī)器視覺(jué)、組合調(diào)度問(wèn)題、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)、博弈、定理證明等研究應(yīng)用領(lǐng)域發(fā)揮著重要作用??梢哉f(shuō)人工智能已深入各行各業(yè),對(duì)人類社會(huì)作出了巨大的貢獻(xiàn)。

5.機(jī)器人

機(jī)器人學(xué)所研究的問(wèn)題,從機(jī)器人手臂的最佳移動(dòng)到實(shí)現(xiàn)機(jī)器人目標(biāo)的動(dòng)作序列的規(guī)劃方法,無(wú)所不包。盡管已經(jīng)建立了一些比較復(fù)雜的機(jī)器人系統(tǒng),但是現(xiàn)在工業(yè)上運(yùn)行的機(jī)器人都是一些按預(yù)先編好的程序執(zhí)行某些重復(fù)作業(yè)的簡(jiǎn)單裝置,大多數(shù)工業(yè)機(jī)器人是“盲人”。機(jī)器人和機(jī)器人學(xué)的研究促進(jìn)了許多人工智能思想的發(fā)展。智能機(jī)器人的研究和應(yīng)用體現(xiàn)出廣泛的學(xué)科交叉,涉及眾多課題。機(jī)器人已在工業(yè)、農(nóng)業(yè)、商業(yè)、旅游業(yè)、空中和海洋及國(guó)防等多個(gè)領(lǐng)域獲得越來(lái)越普遍的應(yīng)用。

五、人工智能的未來(lái)發(fā)展

目前絕大多數(shù)人工智能系統(tǒng)都是建立在物理符號(hào)系統(tǒng)假設(shè)之上的。在尚未出現(xiàn)能與物理符號(hào)系統(tǒng)假設(shè)相抗衡的新的人工智能理論之前,無(wú)論從設(shè)計(jì)原理還是從已取得的實(shí)驗(yàn)結(jié)果來(lái)看,Soar在探討智能行為的一般特征和人類認(rèn)知的具體特征的艱難征途上都取得了有特色的進(jìn)展或成就,處在人工智能研究的前沿。上世紀(jì)80年代,以NewellA為代表的研究學(xué)者總結(jié)了專家系統(tǒng)的成功經(jīng)驗(yàn),吸收了認(rèn)知科學(xué)研究的最新成果,提出了作為通用智能基礎(chǔ)的體系結(jié)構(gòu)Soar。目前的Soar已經(jīng)顯示出強(qiáng)大的問(wèn)題求解能力。在Soar中已實(shí)現(xiàn)了30多種搜索方法,實(shí)現(xiàn)了若干知識(shí)密集型任務(wù)(專家系統(tǒng)),如RI等。對(duì)于人工智能未來(lái)的發(fā)展方向,專家們通過(guò)一些前瞻性研究可以看出未來(lái)人工智能可能會(huì)向以下幾個(gè)方面發(fā)展:模糊處理、并行化、神經(jīng)網(wǎng)絡(luò)及其情感。

目前,人工智能的推理功能已獲突破,學(xué)習(xí)及聯(lián)想功能正在研究之中,下一步就是模仿人類右腦的模糊處理功能和整個(gè)大腦的并行化處理功能。人工神經(jīng)網(wǎng)絡(luò)是未來(lái)人工智能應(yīng)用的新領(lǐng)域。未來(lái)智能計(jì)算機(jī)的構(gòu)成,可能就是作為主機(jī)的馮?諾依曼型機(jī)與作為智能的人工神經(jīng)網(wǎng)絡(luò)的結(jié)合。研究表明:情感是智能的一部分,而不是與智能相分離的,因此人工智能領(lǐng)域的下一個(gè)突破可能在于賦予計(jì)算機(jī)情感能力。情感能力對(duì)于計(jì)算機(jī)與人的自然交往至關(guān)重要。

根據(jù)這些前瞻性研究我們也可以通過(guò)想象模擬勾畫(huà)出人工智能未來(lái)發(fā)展的三個(gè)階段。

1.融合時(shí)期(2010―2020年)

(1)用語(yǔ)言操縱和控制的智能化設(shè)備十分普及,像遠(yuǎn)程醫(yī)療這樣的服務(wù)也更為完善。

(2)以計(jì)算機(jī)和互聯(lián)網(wǎng)為基礎(chǔ)的遠(yuǎn)程教育十分普及,在家就可以上大學(xué)。

(3)在身體里植入許多不同功能的芯片已不新奇。

(4)量子計(jì)算機(jī)和DNA計(jì)算機(jī)會(huì)有更大發(fā)展,新材料不斷問(wèn)世。

(5)抗病毒程序可以防止各種非自然因素引發(fā)災(zāi)難。

2.自信時(shí)期(2020―2030年)

(1)智能化計(jì)算機(jī)和互聯(lián)網(wǎng)既能自我修復(fù),也能自行進(jìn)行研究、生產(chǎn)產(chǎn)品。

(2)一些新型材料的出現(xiàn),促使智能化向更高層次發(fā)展。

(3)有了高水準(zhǔn)智能化技術(shù)的協(xié)助,人們“定居火星夢(mèng)”可能性大增。

3.非神秘時(shí)期(2030―2040年)

(1)新的全息模式世界將取代原有幾何模式的世界。

(2)人們對(duì)一些目前無(wú)法解釋的自然現(xiàn)象會(huì)有更完善的解釋。

(3)人工智能可以模仿人類的智能,因此會(huì)出現(xiàn)有關(guān)法律來(lái)規(guī)范這些行為。

第6篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

愛(ài)爾蘭都柏林大學(xué)(UCD)教授孫大文(Da-Wen Sun)的經(jīng)歷無(wú)疑就是這句話的具體詮釋。

2010年5月,孫大文當(dāng)選愛(ài)爾蘭皇家科學(xué)院院士。成立于1785的愛(ài)爾蘭皇家科學(xué)院是愛(ài)爾蘭自然科學(xué)、人文和社會(huì)科學(xué)的最高學(xué)術(shù)機(jī)構(gòu)。

2010年6月,國(guó)際農(nóng)業(yè)工程委員會(huì)(CIGR)第十七屆世界大會(huì)上,來(lái)自全球40多個(gè)國(guó)家的近1000位專家學(xué)者代表與會(huì)。會(huì)上,孫大文當(dāng)選為國(guó)際農(nóng)業(yè)工程委員會(huì)候任主席,任期從2011年1月開(kāi)始,并將于2013年起接任主席,為期2年。他成為國(guó)際農(nóng)業(yè)工程委員會(huì)自成立80年以來(lái)的首位華人主席。在這次大會(huì)上,孫大文還被授予國(guó)際農(nóng)業(yè)工程委員會(huì)會(huì)士榮譽(yù)稱號(hào)(CIGR Fellow Award),這是CIGR對(duì)國(guó)際農(nóng)業(yè)與生物系統(tǒng)工程領(lǐng)域獲得公認(rèn)卓越地位和作出杰出科學(xué)貢獻(xiàn)者的一項(xiàng)殊榮。

豐碩的成果是多年奮斗的收獲,從廣東潮安縣一路走來(lái),孫大文對(duì)于事業(yè)、人生都有自己的體會(huì)。

我的大學(xué)

2010年秋,在一個(gè)都柏林典型的陰天、大風(fēng)、細(xì)雨交替的日子,我們來(lái)到都柏林大學(xué)采訪孫大文教授。盡管前一天晚上他才從國(guó)外出差回來(lái),但早就訂好了會(huì)議室,并準(zhǔn)備了茶點(diǎn)。打開(kāi)電腦,題為《談?wù)勎以诤M獾膴^斗經(jīng)歷和體會(huì)》的PPT文檔圖文并茂地為我們一一細(xì)說(shuō)從前。

從當(dāng)年參加高考的準(zhǔn)考證、成績(jī)單,到出國(guó)留學(xué)的很多審批文件,再到后來(lái)獲得的多項(xiàng)獎(jiǎng)勵(lì)……這些無(wú)不透著孫大文的嚴(yán)謹(jǐn)和認(rèn)真,以及對(duì)于自己人生經(jīng)歷的珍視。

盡管我們?cè)?jīng)采訪過(guò)很多恢復(fù)高考后考上大學(xué)的留學(xué)人員,但真正看到一張1978年的高等學(xué)校準(zhǔn)考證、成績(jī)單,以及諸多的出國(guó)審批手續(xù)等批件,這還是第一次。

孫大文出生于廣東省潮安縣,讀書(shū)時(shí)他的學(xué)習(xí)成績(jī)一直名列全校前茅。1977年恢復(fù)高考時(shí),還在上高一的孫大文就被學(xué)校破格推薦參加全國(guó)高考。1978年,孫大文以優(yōu)異成績(jī)被全國(guó)重點(diǎn)大學(xué)華南工學(xué)院(現(xiàn)華南理工大學(xué))錄取。

為了對(duì)比當(dāng)年高考的難度,孫大文特地選用一組數(shù)據(jù)說(shuō)明:1978年全國(guó)參加高考人數(shù)為610萬(wàn)人,錄取人數(shù)40.2萬(wàn),錄取率為7%。而2009年全國(guó)參加高考人數(shù)1020萬(wàn)人,錄取人數(shù)629萬(wàn)人,錄取率高達(dá)62%。

恢復(fù)高考后,幾乎所有進(jìn)入大學(xué)的學(xué)子都如饑似渴地汲取著知識(shí)的營(yíng)養(yǎng),因?yàn)樗麄兩钌畹囟脵C(jī)會(huì)的來(lái)之不易,孫大文說(shuō):“我們的大學(xué)生活就是‘宿舍―飯?zhí)猫D課室’,‘三點(diǎn)一線’是對(duì)我們那時(shí)候生活的真實(shí)寫(xiě)照?!?/p>

和很多同學(xué)一樣,孫大文也缺乏英語(yǔ)基礎(chǔ),英語(yǔ)成為他學(xué)習(xí)上的瓶頸之一,為了學(xué)好英語(yǔ),他口袋里總是裝著單詞本,甚至連在飯?zhí)门抨?duì)打飯以及晚飯后散步的時(shí)間都在用功地背英語(yǔ),只是當(dāng)時(shí)的他并不知道英語(yǔ)將在今后為他打開(kāi)一扇更大的門(mén),讓他進(jìn)入一個(gè)更廣闊的世界。

回首往事,孫大文感慨道:“在我們那個(gè)年代,所有人都崇拜陳景潤(rùn),羨慕中國(guó)科技大學(xué)少年班的學(xué)生,家長(zhǎng)也以此來(lái)激勵(lì)自家孩子讀書(shū)。那時(shí)候上大學(xué),就是用心學(xué)習(xí)知識(shí),并且我們有一定要把知識(shí)學(xué)好的精神?!?/p>

在華南工學(xué)院本科畢業(yè)時(shí),按照當(dāng)時(shí)的政策,所有大學(xué)生畢業(yè)后都要服從分配。一直在南方長(zhǎng)大的孫大文沒(méi)想到自己竟然被分配到佳木斯,他當(dāng)時(shí)甚至不知道佳木斯在哪里,而研究生的入學(xué)通知書(shū)又讓他的命運(yùn)軌跡有了改變。1982年,孫大文以專業(yè)第一名的成績(jī)考上華南工學(xué)院的碩士研究生,研究方向?yàn)楦呔畚锪髯児こ淘?。?dāng)年全國(guó)在校碩士研究生為2.58萬(wàn)人,博士生約550人,博士生人數(shù)與碩士生人數(shù)之比為1∶47.2。

今天說(shuō)來(lái),這成了孫大文在廣州求學(xué)的一件軼事!“連我們老師也笑我,要是我當(dāng)時(shí)沒(méi)有考研并且成功考上的話,我就要去遙遠(yuǎn)的佳木斯了?!?/p>

到了研究生學(xué)習(xí)階段,孫大文的刻苦鉆研有了更多收獲,獲得多項(xiàng)科研獎(jiǎng)項(xiàng)。上個(gè)世紀(jì)80年代中期,國(guó)內(nèi)物價(jià)飛漲,腦體倒掛現(xiàn)象突出,“搞導(dǎo)彈的收入不如賣(mài)茶葉蛋的,拿手術(shù)刀的不如拿剃頭刀的”,這使得全國(guó)刮起下海經(jīng)商的風(fēng),很多人的價(jià)值取向由此也發(fā)生了巨大變化。1985年,碩士畢業(yè)的孫大文迎來(lái)了自己人生中的第一次選擇:工作還是繼續(xù)深造?幾經(jīng)考量,孫大文選擇了繼續(xù)在華南工學(xué)院攻讀博士研究生。那一年華南工學(xué)院總共招收5名博士生,孫大文是其中之一,他的研究方向轉(zhuǎn)為傳熱與節(jié)能。

在攻讀博士期間,他先后在《稀有金屬》等國(guó)際權(quán)威性雜志上發(fā)表了7篇論文并全部由科學(xué)引文索引(SCl)收錄,他的博士成果后來(lái)還相繼獲得廣州市和廣東省自然科學(xué)獎(jiǎng)。這在當(dāng)時(shí),對(duì)很多科研人員來(lái)說(shuō),也是有很大難度的。孫大文說(shuō):“我當(dāng)時(shí)看很多英文科研文章就想,這樣的文章我也可以寫(xiě),于是就將自己的科研成果寫(xiě)成文章投稿,沒(méi)想到都發(fā)表了。”

跨出國(guó)門(mén)

1988年,孫大文博士畢業(yè),他又一次面臨著人生的重要選擇:是畢業(yè)留校?還是出國(guó)深造?

當(dāng)時(shí)出國(guó)要?dú)v經(jīng)多項(xiàng)環(huán)節(jié),其過(guò)程是耐力、實(shí)力、心理的多項(xiàng)考驗(yàn):給國(guó)外寫(xiě)信聯(lián)系導(dǎo)師,向?qū)W校申請(qǐng)留學(xué),經(jīng)過(guò)政審、國(guó)家教委審批,然后集訓(xùn),再辦理護(hù)照和簽證,換取外匯……

孫大文說(shuō):“去海外深造是當(dāng)時(shí)很多人的向往,我也希望去國(guó)外進(jìn)一步深造。我已經(jīng)拿到了德國(guó)和日本的邀請(qǐng)函。但是,去德國(guó)還是日本?這個(gè)問(wèn)題讓我非常矛盾。鑒于當(dāng)時(shí)的國(guó)際形勢(shì)和意識(shí)形態(tài)差異,我還是選擇了去德國(guó)深造。”由于當(dāng)時(shí)很多情況不斷變化,孫大文臨時(shí)變更了機(jī)票,當(dāng)時(shí)他甚至來(lái)不及確認(rèn)自己在國(guó)外的聯(lián)系人是否收到了早先發(fā)去的電傳。帶著僅有的50美元,1989年6月,孫大文前往德國(guó)斯圖加特大學(xué)繼續(xù)深造,從事儲(chǔ)氫材料研究工作。

“國(guó)外的一切對(duì)我來(lái)說(shuō)都是那么新鮮。在德國(guó),我第一次接觸到Macintosh計(jì)算機(jī),第一次使用word軟件,第一次使用E-mail……”太多的第一次讓他甚至來(lái)不及適應(yīng)。在體驗(yàn)著新鮮刺激的國(guó)外生活的同時(shí),孫大文努力讓自己適應(yīng)新的環(huán)境,克服語(yǔ)言和文化上的障礙,潛心從事科研工作,在研究所,他是在那里學(xué)習(xí)的中國(guó)人中第一個(gè)的研究人員。

到德國(guó)工作1年后,由于需要在工作中用德語(yǔ)交流。孫大文想放棄學(xué)習(xí)了那么久的英語(yǔ)很可惜,考慮再三。1990年底,他在導(dǎo)師的指引下,前往英國(guó)貝爾法斯特女王大學(xué)擔(dān)任研究員。

此后幾年,孫大文先后于英國(guó)紐卡斯?fàn)柎髮W(xué)和謝菲爾德大學(xué)擔(dān)任研究員,也正是在紐卡斯?fàn)柎髮W(xué),孫大文的研究進(jìn)入了全新的領(lǐng)域。在那里,他還認(rèn)識(shí)了一位退休的中學(xué)校長(zhǎng),校長(zhǎng)很想學(xué)中文,于是孫大文每周一個(gè)晚上到他家里教他中文,也向他學(xué)習(xí)英文口語(yǔ),從不間斷,孫大文的英語(yǔ)口語(yǔ)水平有了很大的提高。孫大文說(shuō):“在紐克斯?fàn)柎髮W(xué)進(jìn)行的谷物干燥研究工作,為我日后在食品工程領(lǐng)域發(fā)展打下了堅(jiān)實(shí)的基礎(chǔ)。我改造了那里現(xiàn)有的實(shí)驗(yàn)設(shè)備并實(shí)現(xiàn)數(shù)據(jù)采集自動(dòng)化,并發(fā)表了6篇SCI論文。”

在科研之余,孫大文特別喜歡到英國(guó)的鄉(xiāng)村種菜,租一塊地,種上自己喜歡的蔬菜,耕作打理,期待著農(nóng)耕收獲的喜悅。沒(méi)想到有一次來(lái)到自己的菜地,發(fā)現(xiàn)上次離開(kāi)時(shí)已經(jīng)郁郁蔥蔥的菜地卻一片狼籍,孫大文心想難道是有人破壞?一次碰巧遇到一位在他旁邊種地的本地人,那位英國(guó)紳士慢條斯理地說(shuō):“你知道你的菜地出什么問(wèn)題了么?是蛞蝓(slug)搞得鬼……”孫大文才知道這種蟲(chóng)子專吃蔬菜,趕忙滅蟲(chóng)。

事業(yè)在都柏林騰飛

孫大事情喜歡制定明確的目標(biāo)和詳細(xì)的計(jì)劃,通過(guò)計(jì)劃,合理安排時(shí)間和任務(wù),從而達(dá)到目標(biāo),同時(shí)也使自己明確每一個(gè)任務(wù)的目的。他經(jīng)常跟學(xué)生說(shuō)做事情要通過(guò)制定計(jì)劃,腳踏實(shí)地、有步驟地去實(shí)現(xiàn)它。在學(xué)習(xí)、工作中不斷努力,不斷修正自己的行動(dòng),直到達(dá)成目標(biāo)。

在英國(guó),孫大文給自己定下的目標(biāo)是45歲之前要做到教授,但在英國(guó)的教育機(jī)制下,這并不容易。孫大文開(kāi)始留意別的機(jī)會(huì),1995年秋,他在英國(guó)的《衛(wèi)報(bào)》上看到愛(ài)爾蘭都柏林大學(xué)正在招聘大學(xué)教師,當(dāng)時(shí)愛(ài)爾蘭處于發(fā)展期,經(jīng)濟(jì)環(huán)境不斷好轉(zhuǎn),高技術(shù)產(chǎn)業(yè),特別是信息技術(shù)和軟件業(yè)發(fā)展很快,急需大量科研人員。孫大文決定離開(kāi)英國(guó),他順利在愛(ài)爾蘭都柏林大學(xué)找到職位。

正應(yīng)了中國(guó)那句古話“萬(wàn)事開(kāi)頭難”,當(dāng)時(shí),愛(ài)爾蘭的中國(guó)人很少,作為愛(ài)爾蘭都柏林大學(xué)第一位獲得教席的華人,諸多來(lái)自歐美等發(fā)達(dá)國(guó)家的學(xué)者、教授對(duì)孫大文的出現(xiàn)感到有些異樣。都柏林大學(xué)的同事甚至問(wèn)孫大文:“你為什么跑到這里來(lái)教書(shū)?你上課學(xué)生能聽(tīng)懂嗎?”孫大文知道自己必須盡快找到突破口并做出成績(jī)來(lái),安頓下來(lái)的孫大文開(kāi)始尋找研究方向和合作者,他一邊組建自己的科研團(tuán)隊(duì),一邊申請(qǐng)課題和科研經(jīng)費(fèi)。

孫大文決定在食品工程方面找突破口,考慮到自己初來(lái)乍到,必須要有合適的合作伙伴以及團(tuán)隊(duì),他幾經(jīng)周折,拿著自己寫(xiě)好的項(xiàng)目建議,到愛(ài)爾蘭國(guó)家食品中心找合作者。他說(shuō):“因?yàn)槿绻覇为?dú)申請(qǐng),成功率肯定比較低,但如果找到當(dāng)?shù)乇容^權(quán)威的專家,讓他做項(xiàng)目主持人,成功率會(huì)比較高?!?/p>

看到孫大文翔實(shí)的資料準(zhǔn)備以及項(xiàng)目建議,國(guó)家食品中心的專家同意合作,于是兩個(gè)人聯(lián)名申請(qǐng)的第一筆科研經(jīng)費(fèi)順利通過(guò)審批,這奠定了孫大文隨后科研的基礎(chǔ)。孫大文說(shuō):“在國(guó)外搞研究,你必須有好的課題。缺少經(jīng)費(fèi)的研究是非常艱難的,在申請(qǐng)到了經(jīng)費(fèi)后,一切就走向正規(guī),順利運(yùn)行起來(lái)了?!?/p>

此后十幾年間,孫大文一直奮戰(zhàn)在食品工程研究領(lǐng)域,在新興食品加工技術(shù),食品冷卻、冷凍、冷藏和保鮮技術(shù),食品快速檢測(cè)計(jì)算機(jī)視覺(jué)技術(shù),食品加工過(guò)程模擬、優(yōu)化和控制等多個(gè)領(lǐng)域走在全球食品工程研究領(lǐng)域的前沿。由于有著寬廣的學(xué)術(shù)積累,孫大文能從材料、加工、農(nóng)業(yè)工程等諸多領(lǐng)域進(jìn)行分析研究,并密切關(guān)注科研成果的社會(huì)轉(zhuǎn)化等,使得他可以從不同角度看待研究課題,從而找到最佳對(duì)接點(diǎn)。

孫大文在愛(ài)爾蘭這片陌生的土地上逐漸確立了自己的科研地位,他先后從歐盟、愛(ài)爾蘭政府的有關(guān)部門(mén)和企業(yè)界獲得了超過(guò)100萬(wàn)歐元的科研經(jīng)費(fèi),組建了自己的科研隊(duì)伍,并成立了食品冷凍及計(jì)算機(jī)化食品技術(shù)研究所。該研究所目前擁有4個(gè)專業(yè)實(shí)驗(yàn)室,配備有門(mén)類齊全的現(xiàn)代化科研設(shè)備與測(cè)試系統(tǒng),承擔(dān)著歐盟、愛(ài)爾蘭政府及企業(yè)的多項(xiàng)科研項(xiàng)目。

在歐洲,熟肉制品是以鮮畜禽肉為主要原料,經(jīng)選料、修整、腌制、調(diào)味、成型、熟化和包裝等工藝制成的肉類加工食品,為歐洲主要日常食品。歐洲食品安全條例極其嚴(yán)格,歐洲工業(yè)界為了減少浪費(fèi)和提高效率,通常加工生產(chǎn)重約5~7公斤的超大產(chǎn)品。由于肉制品具有極低的導(dǎo)熱系數(shù),采用目前通用的風(fēng)冷或水冷的冷卻方法根本無(wú)法達(dá)到歐洲食品安全條例的要求。于是,孫大文首次采用冷卻機(jī)理完全不同的真空冷卻方法,以蒸發(fā)相變傳熱過(guò)程取代傳統(tǒng)方法中以熱傳導(dǎo)傳熱模式為主的傳熱過(guò)程。由于水分蒸發(fā)潛熱很大,他所開(kāi)發(fā)的新型真空冷卻技術(shù)可以達(dá)到超快速冷卻效果,從根本上克服了傳統(tǒng)熱傳導(dǎo)傳熱模式所存在的低效率問(wèn)題。近年來(lái),由于即食食品具有方便和大眾化的優(yōu)點(diǎn),適合現(xiàn)代人快節(jié)奏生活,即食食品產(chǎn)業(yè)在歐洲得到大規(guī)模發(fā)展,因此歐盟對(duì)其冷卻時(shí)間具有極為嚴(yán)格的規(guī)定,孫大文開(kāi)發(fā)的真空冷卻技術(shù)對(duì)即食食品及其所含的眾多配料都具有極其明顯的超快速凍效果。

在計(jì)算機(jī)視覺(jué)領(lǐng)域,孫大文的研究也取得了世界領(lǐng)先的原創(chuàng)性成果。計(jì)算機(jī)視覺(jué)技術(shù)正越來(lái)越廣泛地用于食品工業(yè)產(chǎn)品質(zhì)量檢測(cè)和生產(chǎn)控制,它能有效地提高生產(chǎn)自動(dòng)化程度,提高產(chǎn)品質(zhì)量和生產(chǎn)效率。比薩餅是歐洲最主要的方便食品之一,顧客對(duì)外觀品質(zhì)尤為重視。但目前通用的外觀品質(zhì)檢測(cè)手段仍然采用費(fèi)時(shí)和客觀性差的肉眼觀察方法,從而導(dǎo)致產(chǎn)品質(zhì)量的波動(dòng)。比薩餅表面飾料多種多樣且分布復(fù)雜,孫大文提出了一種基于區(qū)域的圖象分割算法,汲取了常見(jiàn)的門(mén)限化、邊界分割法和區(qū)域分割法的優(yōu)點(diǎn),極大地改進(jìn)了傳統(tǒng)區(qū)域增長(zhǎng)算法,研制出適用于比薩餅外觀品質(zhì)快速檢測(cè)計(jì)算機(jī)圖像處理識(shí)別系統(tǒng)。這一系統(tǒng)很適合像比薩餅表面復(fù)雜的圖像處理,在對(duì)表面飾料包括青椒、火腿、番茄醬等數(shù)十種比薩餅和糕點(diǎn)的圖像分析表明,該視覺(jué)系統(tǒng)對(duì)餅基表面各種飾料的識(shí)別準(zhǔn)確率達(dá)到95%以上。在此基礎(chǔ)上,孫大文還把計(jì)算機(jī)視覺(jué)技術(shù)成功地運(yùn)用于干酪熔化特性量化測(cè)定和肉品品質(zhì)檢測(cè)與控制,以代替?zhèn)鹘y(tǒng)的儀器測(cè)量與感官評(píng)定手段。這一系列研究開(kāi)創(chuàng)了對(duì)食品,特別是比薩餅生產(chǎn)質(zhì)量和屬性進(jìn)行自動(dòng)檢測(cè)的應(yīng)用先例。英國(guó)著名的《新科學(xué)家》雜志等多家世界新聞媒體紛紛報(bào)道了這一最新成就。

為國(guó)效力

雖然在國(guó)外多年,但孫大文一直希望能有機(jī)會(huì)為祖國(guó)服務(wù)。近年來(lái),孫大文經(jīng)常利用自己的休假時(shí)間,回國(guó)講學(xué),與國(guó)內(nèi)科研機(jī)構(gòu)建立了長(zhǎng)期和密切的合作關(guān)系,他與華南理工大學(xué)共同建立研究基地,雙方聯(lián)手共同開(kāi)拓食品冷凍方面的科研新課題。孫大文與哈爾濱工業(yè)大學(xué)簽訂了5年的合作合同,每年為哈工大招收培養(yǎng)博士生,期間以哈工大為第一作者單位聯(lián)合發(fā)表了8篇SCI論文,并多次推薦和邀請(qǐng)?jiān)撔@蠋焻⒓訃?guó)際學(xué)術(shù)活動(dòng)。

孫大文與江南大學(xué)聯(lián)合培養(yǎng)的一位博士生,攻讀博士學(xué)位期間共在國(guó)際知名期刊上發(fā)表6篇論文并全部由SCI收錄。他與江南大學(xué)聯(lián)合開(kāi)發(fā)的基于豆類蛋白質(zhì)的無(wú)色無(wú)味透明的可食用膜用于水果和蔬菜保鮮可使產(chǎn)品的貨架期延長(zhǎng)了好幾個(gè)星期。如對(duì)獼猴桃的實(shí)驗(yàn)結(jié)果,顯示使用該涂膜保鮮可使獼猴桃貨架期從原先的2周延長(zhǎng)至37天,這一成果再次引起了工業(yè)界的高度重視。英國(guó)著名的《新科學(xué)家》雜志對(duì)這一成果報(bào)道后,世界各地傳媒也相繼報(bào)道了這一技術(shù)。

第7篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

關(guān)鍵詞:數(shù)據(jù)處理;數(shù)據(jù)挖掘;特征提??;聚類分析

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)31-0164-04

Abstract:With the rapid development of computer technology and Internet technology, the amount of data accumulated in the human gradually increased dramatically. For the vast amounts of data into useful information for the user to provide decision support, clustering algorithm has been widely attention and applied to all types of data processing and data mining applications. The project based on the analysis of visual features on the image, through the effective integration of color, texture and shape features of the image information, the use of K-Means algorithm to cluster. The proposed method can be carried out experiments on the acquired image data set, and has a good clustering effect .

Key words: data processing; data mining;feature extraction;cluster analysis

F今,互聯(lián)網(wǎng)上的圖像信息數(shù)量如海洋般龐大,我們雖可以通過(guò)眼睛獲取十分豐富的信息,然而人類可以接受的范圍是有限的,如何從海量的數(shù)據(jù)之中準(zhǔn)確、快速地將圖像進(jìn)行聚類,最終為人類社會(huì)的發(fā)展服務(wù),是當(dāng)前圖像特征提取領(lǐng)域的一個(gè)研究焦點(diǎn)。

圖像聚類就是運(yùn)用計(jì)算機(jī)對(duì)圖像庫(kù)中圖像進(jìn)行定量分析,再把圖像劃分到某一種特征類別中,以代替人類對(duì)圖像的視覺(jué)判別。圖像聚類的過(guò)程實(shí)質(zhì)上就是一個(gè)基于知識(shí)的圖像理解過(guò)程,同時(shí)也是人類對(duì)圖像的視覺(jué)判別的延續(xù)與發(fā)展。

基于視覺(jué)特征的圖像聚類研究是解決視覺(jué)圖像問(wèn)題的一條重要途徑,也是一個(gè)聚集了計(jì)算機(jī)視覺(jué)、圖像處理、數(shù)據(jù)挖掘等多個(gè)研究領(lǐng)域的交叉研究方向?,F(xiàn)如今,基于視覺(jué)特征的圖像分類研究已越來(lái)越受到國(guó)內(nèi)外研究者的關(guān)注,在近幾年舉辦的與該領(lǐng)域研究相關(guān)的一些頂級(jí)國(guó)際會(huì)議,如計(jì)算機(jī)視覺(jué)與圖像處理國(guó)際會(huì)議CVPR、數(shù)據(jù)挖掘國(guó)際會(huì)議KDD、ICDM等等,都有相關(guān)文獻(xiàn)發(fā)表。

文獻(xiàn)[2]中,孫君頂?shù)热嗽谛螤钐卣魈崛≈刑岢鲆环N新的圖像分塊形狀特征的描述方法,對(duì)圖像采用固定塊的分割方法。文獻(xiàn)[4]中,劉麗等人介紹了關(guān)于紋理特征的所有研究方法。文獻(xiàn)[6]中,趙書(shū)蓮在應(yīng)用研究過(guò)程中使用Hu不變矩算法進(jìn)行形狀特征的提取。在博士論文[11]中,朱蓉論述了所有視覺(jué)特征的提取方法。

隨著研究者在聚類技術(shù)上的不斷改進(jìn)和創(chuàng)新,許多新奇且高效的聚類算法層出不窮,針對(duì)特定的問(wèn)題和用戶,許多學(xué)者研究出了多種具有代表性的聚類算法,并且廣泛地應(yīng)用于模式識(shí)別、生物信息、圖像處理以及數(shù)據(jù)挖掘等領(lǐng)域。

文獻(xiàn)[7]中,臧少杰介紹了所有聚類算法,并且將這些算法進(jìn)行了比較。文獻(xiàn)[8]中,路晶等人針對(duì)非監(jiān)督學(xué)習(xí),在基于EM算法啟發(fā)式迭代優(yōu)化算法的框架下,提出了6種多例聚類算法。文獻(xiàn)[9]中,周俊祥對(duì)模糊C-均值聚類(FCM,全稱為Fuzzy C-Means Algorithm)算法進(jìn)行改進(jìn),有效地降低了孤立點(diǎn)對(duì)圖像數(shù)據(jù)聚類結(jié)果的影響。

1 特征提取

基于視覺(jué)特征的網(wǎng)絡(luò)圖像特征有三個(gè),分別為顏色、紋理、形狀。特征提取是將某一模式的一組測(cè)量值進(jìn)行變換,用以表現(xiàn)這一模式具有代表性特征的方法。通過(guò)影像分析和變換,以提取所需特征的方法。

1.1 顏色特征的提取

顏色特征的提取主要有四種方法,為顏色直方圖、顏色矩與顏色熵的研究、顏色相關(guān)圖的研究、

顏色聚合向量的研究。在這四種方法中,顏色矩與顏色熵的研究方法的分辨能力比較低,所以通常也必須和其他圖像特征結(jié)合起來(lái)進(jìn)行檢索。顏色相關(guān)圖的研究計(jì)算量很大,近些年來(lái)對(duì)于顏色相關(guān)圖的研究才剛剛起步,主要是結(jié)合其他方法一起來(lái)研究,在文獻(xiàn)[3]中作者介紹了一種基于顏色相關(guān)圖和小波變換的算法。顏色聚合向量的研究當(dāng)前也主要集中于與其他方法結(jié)合來(lái)進(jìn)行效果的改進(jìn)上,比如該文中作者在顏色直方圖的基礎(chǔ)之上采用了一種基于顏色聚合向量的方法從而提高了檢索的精度。而顏色直方圖具有相似度計(jì)算,有特征提取簡(jiǎn)潔和不隨圖像尺度、旋轉(zhuǎn)等變化而變化的特點(diǎn)。所以顏色直方圖相較于其他方法更適合于顏色特征的提取。具體方法如下:

1.2紋理特征的提取

紋理是指在圖像中重復(fù)出現(xiàn)的局部模式及其排列規(guī)則。紋理特征與顏色特征相似,同樣也是一個(gè)整體性的特征。近年來(lái),對(duì)紋理分析方法的種種理論或者方法在紋理特征提取中的實(shí)踐已然基本成形,Tuceryan和Jain將紋理特征提取的方法歸納為五大類,即結(jié)構(gòu)統(tǒng)計(jì)、 模型、信號(hào)處理、幾何和結(jié)構(gòu)家族。這種分類方法被大多學(xué)者所采納。

模型家族的方法能兼顧紋理局部的隨機(jī)性與整體上的規(guī)律性,而且有很強(qiáng)大的靈活性;主要優(yōu)勢(shì)是提供了用來(lái)表示空間上相關(guān)的隨機(jī)變量之間的相互作用的模型。它的不足在于模型系數(shù)的求解有難度,需要相當(dāng)大的計(jì)算量,往往需要迭代了數(shù)百次才能達(dá)到收斂。信號(hào)處理家族對(duì)紋理進(jìn)行多分辨描述,可以在更精準(zhǔn)的尺度之上分析紋理。但有有效性不佳和計(jì)算量大的缺陷。

而本文推薦使用的統(tǒng)計(jì)家族方法簡(jiǎn)便,容易實(shí)現(xiàn),特別是灰度共生矩陣(GLCM,全稱為Gray Level Co-occurrence Matrix)方法是世界公認(rèn)的有效方法,具有比較強(qiáng)的適應(yīng)性。

灰度共生矩陣是被廣泛使用的紋理提取的算法,也是分析圖像的基礎(chǔ),它運(yùn)用統(tǒng)計(jì)學(xué)當(dāng)中的概率來(lái)反映圖像灰度的有關(guān)方向和間隔等整體信息。其算法描述如下:

是圖像中任意一點(diǎn),是圖像中移動(dòng)后的另一點(diǎn),因此形成一個(gè)點(diǎn)對(duì), 是該點(diǎn)對(duì)的灰度值,即m是點(diǎn)的灰度值, n是點(diǎn)的灰度值。然后固定和,通過(guò)點(diǎn)的改動(dòng),來(lái)明確相應(yīng)的值,所以相應(yīng)灰度值的組合為(灰度值的級(jí)數(shù)為L(zhǎng))。對(duì)于研究的圖像,計(jì)算出值出現(xiàn)的頻率,化其積分為1,它的概率為,則灰度共生矩陣(灰度聯(lián)合概率密度)為。

對(duì)于有區(qū)別的紋理周期分布,就有不一樣的離差分值,即不一樣的與值。在紋理比較細(xì)致的情況下,選?。?,0),(0,1),(1,1),(-1,1)等小的差分值是非常有效果的。若與取值比較小,則表明紋理圖像變化情況遲緩,那么在灰度聯(lián)合概率矩陣對(duì)角線上的數(shù)值就相對(duì)較大,適合于做對(duì)角線分布;若與取值比較大,那么說(shuō)明紋理變化愈快,則在灰度聯(lián)合概率矩陣對(duì)角線上的數(shù)值就愈小,適合于做均勻分布。一系列的紋理特征的y計(jì)量能夠通過(guò)灰度共生矩陣而得到,其中常用的有以下8個(gè)紋理特征值。

(1)角二階矩

(2)對(duì)比度其中。

(3)灰度相關(guān)其中分別為與的標(biāo)準(zhǔn)差和準(zhǔn)值。

(4)熵

(5)逆差矩其中k為常數(shù)且。

(6)最大概率

(7)相異

(8)反差

1.3 形狀特征的提取

形狀特征提取表示方法有2種,一種是區(qū)域特性,它主要是針對(duì)于圖像的整個(gè)形狀區(qū)域;另一種是輪廓特性,它主要針對(duì)于物體的外邊界。前人關(guān)于形狀特征提取的典型方法有:邊界特征值法、幾何參數(shù)法、形狀不變矩法、傅里葉形狀描述法等。本文采用Hu不變矩算法來(lái)提取形狀特征。

Hu不變矩是由Hu在1962年提出來(lái)的。不變矩是一種經(jīng)過(guò)提取具有平移、旋轉(zhuǎn)與比例不變性的圖像特征,不變矩的中心思想是使用對(duì)變換不敏感的基于區(qū)域的幾個(gè)矩陣作為形狀特征,從而進(jìn)行圖像識(shí)別的方法。矩不變量因?yàn)榫哂胁浑S圖像的位置、大小與方向而變化的特點(diǎn),對(duì)于提取圖像中的形狀特征而言,是一個(gè)很常用的工具。

2 聚類分析

聚類是依據(jù)事物的某些屬性特性,將事物劃分成為不同類的過(guò)程,其目的是使得類間的相似性盡可能小,類內(nèi)的相似性盡可能大。在許多應(yīng)用當(dāng)中,聚類分析是一種數(shù)據(jù)預(yù)處理的過(guò)程,同時(shí)也是進(jìn)一步分析和處理數(shù)據(jù)的基礎(chǔ)。經(jīng)過(guò)恰當(dāng)?shù)木垲愃惴?,?duì)事物的特征數(shù)據(jù)進(jìn)行預(yù)處理,從而事物才便于研究,事物的內(nèi)部規(guī)律才可能被人類所掌握。

聚類算法大致可以分為以下幾種:劃分、層次、基于密度、基于網(wǎng)格和基于模型的聚類。

基于層次的聚類是將既定數(shù)據(jù)對(duì)象集合進(jìn)行層次的分解,雖然適用于任意形狀和任意屬性的數(shù)據(jù)集,但算法執(zhí)行時(shí)間長(zhǎng),不能回溯處理;基于密度的聚類是基于發(fā)現(xiàn)所有形狀的聚類結(jié)果,能夠用來(lái)過(guò)濾“噪聲”孤立點(diǎn)數(shù)據(jù),發(fā)現(xiàn)所有形狀的不同簇,但處理時(shí)間與每維空間所劃分的單元數(shù)相關(guān),一定程度上降低了聚類的質(zhì)量和準(zhǔn)確性;基于網(wǎng)格的聚類能夠處理所有類型的數(shù)據(jù),但這是以降低聚類的質(zhì)量和準(zhǔn)確度為代價(jià)的;基于模型的方法對(duì)每個(gè)簇假設(shè)了一個(gè)固定的模型,繼而找到對(duì)給定模型最佳擬合的數(shù)據(jù)?;谀P偷乃惴軌蚪?jīng)過(guò)搭建反映數(shù)據(jù)點(diǎn)空間分布的密度函數(shù)來(lái)確定聚類。

基于劃分的算法首先構(gòu)建一個(gè)初始的劃分,確定需要構(gòu)建的劃分?jǐn)?shù)目k。之后使用一種迭代的重定位技術(shù),通過(guò)對(duì)象在劃分間變動(dòng)來(lái)改進(jìn)劃分,使在相同的類中對(duì)象之間盡可能接近或相近,相反不同類中的對(duì)象盡可能闊別或有差別。為了能夠達(dá)到全局的最優(yōu),基于劃分的聚類會(huì)需要列舉所有可能的劃分。實(shí)際上,大部分應(yīng)用采用了K-均值算法(K-Means)和K-中心點(diǎn)算法這兩種較流行的啟發(fā)式算法。

這兩種啟發(fā)式聚類算法對(duì)在中小規(guī)模的數(shù)據(jù)庫(kù)中找到球狀簇非常適用。下面主要介紹本文所采用的K-均值算法。

2.1 K-均值算法

K-均值算法的過(guò)程:

1.隨機(jī)選取k個(gè)數(shù)據(jù)點(diǎn)作為初始的種子聚類中心。

2.計(jì)算每個(gè)數(shù)據(jù)點(diǎn)與各個(gè)中資聚類中心之間的距離,把每個(gè)數(shù)據(jù)點(diǎn)分配給距離它最近的聚類中心。聚類中心以及分配給它的數(shù)據(jù)點(diǎn)就代表一個(gè)聚類。

3.重復(fù)以上步驟,直至達(dá)到以下任一條件便會(huì)終止:

(1)沒(méi)有(或最小數(shù)目)數(shù)據(jù)點(diǎn)被重新分配給不同的聚類。

(2)沒(méi)有(或最小數(shù)目)聚類中心再發(fā)生變化。

3.2 特征提取實(shí)驗(yàn)

紋理特征提取:從圖像庫(kù)中選取100幅花朵類圖像,用統(tǒng)計(jì)家族的灰度共生矩陣(GLCM)提取其8維紋理特征。

形狀特征提?。簭膱D像庫(kù)中選取100幅花朵類圖像,選擇Hu不變矩方法提取其形狀特征。

3.3 具體分析過(guò)程

第一步:從圖像庫(kù)中選取兩組不同圖像,使用灰度共生矩陣和Hu不變矩提取各自的紋理和形狀特征;

第二步:利用K均值算法將這兩組圖像分別基于紋理和形狀特征進(jìn)行聚類,再?gòu)闹蟹謩e選取60幅得到聚類中心的范圍,求出平均值;

第三步:分別從花朵類和美食類圖像中選取40幅圖像,將每幅圖像的紋理和形狀特征數(shù)值與平均值進(jìn)行歐式距離計(jì)算,距離較小時(shí)可認(rèn)為屬于該類,而后計(jì)算兩組數(shù)據(jù)的準(zhǔn)確率。

1)紋理特征的聚類結(jié)果

測(cè)試集中40幅花朵類圖像的紋理特征數(shù)據(jù)與訓(xùn)練集中花朵類圖像紋理特征數(shù)據(jù)平均值的歐式距離全都小于和訓(xùn)練集中美食類圖像紋理特征數(shù)據(jù)平均值的歐式距離,故實(shí)驗(yàn)準(zhǔn)確率達(dá)到100.0%;測(cè)試集中40幅美食類圖像的紋理特征數(shù)據(jù)與訓(xùn)練集中美食類圖像紋理特征數(shù)據(jù)平均值的歐式距離全都小于和訓(xùn)練集中花朵類圖像紋理特征數(shù)據(jù)平均值的歐式距離,故實(shí)驗(yàn)準(zhǔn)確率達(dá)到100.0%。紋理特征的比較結(jié)果如表1所示:

2)形狀特征的聚類結(jié)果

測(cè)試集中40幅花朵類圖像的形狀特征數(shù)據(jù)與訓(xùn)練集中花朵類圖像形狀特征數(shù)據(jù)平均值的歐式距離有28幅圖像的數(shù)值小于和訓(xùn)練集中美食類圖像形狀特征數(shù)據(jù)平均值的歐式距離,故實(shí)驗(yàn)準(zhǔn)確率達(dá)到70.0%。測(cè)試集中40幅美食類圖像的形狀特征數(shù)據(jù)與訓(xùn)練集中美食類圖像形狀特征數(shù)據(jù)平均值的歐式距離有30幅圖像的數(shù)值小于和訓(xùn)練集中花朵類圖像形狀特征數(shù)據(jù)平均值的歐式距離,故實(shí)驗(yàn)準(zhǔn)確率達(dá)到75.0%。形狀特征的比較結(jié)果如表2所示:

綜上所述:

1)花朵類圖像和美食類圖像在紋理上的有很大的相似性,因?yàn)榛ǘ漕悎D像的紋理較細(xì)致,其基元較小,因而空間頻率較高,而美食類圖像的紋理較粗糙,其基元較大,空間頻率較低。

2)花朵類圖像和美食類圖像在形狀上的^別比較小,由于某些花朵的形狀與某些美食的形狀有相似性,如帶有花邊圖案的盤(pán)子所盛的美食的圖像和擺盤(pán)呈花型的美食圖像與花朵類圖像有很大的相似度,如圖1中的(a)圖與圖2中的(c)圖,會(huì)有較低的準(zhǔn)確率。而圖2中(a)圖的美食呈長(zhǎng)方形,則會(huì)與花朵類圖像有很大的區(qū)別。

4 總結(jié)

基于視覺(jué)特征的圖像聚類研究中,花朵類圖像和美食類圖像在紋理和形狀上的聚類都有一定的準(zhǔn)確率,特別是在紋理的聚類上本次研究有著100.0%的準(zhǔn)確率。同時(shí)也有不足之處,本次研究并未融入顏色特征,針對(duì)特定的圖像也還需要進(jìn)一步研究具有區(qū)分度的特征。本文所用的K-均值算法只能應(yīng)用于那些均值能夠被定義的數(shù)據(jù)上。因此,它很難應(yīng)用到范疇數(shù)據(jù)上,且對(duì)于異常值異常敏感。所以現(xiàn)在所用的聚類算法未來(lái)要繼續(xù)改進(jìn),比如聚類中心的計(jì)算能夠?qū)崿F(xiàn)自適應(yīng)等。

基于視覺(jué)特征的圖像聚類方法研究涉及圖像搜索引擎、數(shù)字照片的個(gè)性化管理、敏感圖像的識(shí)別與過(guò)濾、藝術(shù)圖像鑒別等等,具有十分重要的現(xiàn)實(shí)意義,相關(guān)研究領(lǐng)域的最新知識(shí)與研究成果都可以創(chuàng)新性地應(yīng)用到解決各方面的問(wèn)題中,以促進(jìn)圖像聚類技術(shù)的快速發(fā)展。

參考文獻(xiàn):

[1] 高進(jìn)樂(lè),康耀紅,伍小芹.基于顏色特征圖像檢索方法的研究[J] .信息技術(shù),2008(11):4-7.

[2] 孫君頂,趙珊.圖像底層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2009:49-85.

[3] 張篤振.基于顏色特征與LBP的圖像檢索算法研究[J] .微計(jì)算機(jī)應(yīng)用,2009,30(6):35-38.

[4] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國(guó)圖象圖形學(xué)報(bào),2009(4).

[5] 王志瑞,閆彩良.圖像特征提取方法的綜述[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2011(6).

[6] 趙書(shū)蓮.形狀分類及其在圖像檢索系統(tǒng)中的應(yīng)用研究[D].山東:山東師范大學(xué),2006.

[7] 臧少杰.基于視覺(jué)的聚類算法研究及應(yīng)用[D].山東.山東師范大學(xué),2008:1-49.

[8] 路晶等.基于多例學(xué)習(xí)的WEB圖像聚類[J].計(jì)算機(jī)研究與發(fā)展,2009,46(9):1462-1470.

[9] 周俊祥.改進(jìn)FCM的圖像聚類方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2011,20(7).

[10] 劉康苗.基于視覺(jué)與語(yǔ)義融合特征的階段式圖像聚類[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2008,42(12).

[11] 朱蓉.基于語(yǔ)義的WEB圖像分類研究[D].浙江大學(xué),2011.

[12] 張建萍,劉希玉.基于聚類分析的K-means算法研究及應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2007(5).

[13] 張講社,徐宗本.基于視覺(jué)系統(tǒng)的聚類:原理與算法[J].工程數(shù)學(xué)學(xué)報(bào),2000(5).

第8篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

關(guān)鍵詞:人機(jī)大戰(zhàn);人工智能;發(fā)展前景

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

0.引言

2016年3月15日,備受矚目的“人機(jī)大戰(zhàn)”終于落下帷幕,最終Google公司開(kāi)發(fā)的“AlphaGo”以4∶1戰(zhàn)勝了韓國(guó)九段棋手李世h。毫無(wú)疑問(wèn),這是人工智能歷史上一個(gè)具有里程碑式的大事件。大家一致認(rèn)為,人工智能已經(jīng)上升到了一個(gè)新的高度。

這次勝利與1997年IBM公司的“深藍(lán)”戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅不同。主要表現(xiàn)在兩個(gè)方面:

(1)AlphaGo的勝利并非僅僅依賴強(qiáng)悍的計(jì)算能力和龐大的棋譜數(shù)據(jù)庫(kù)取勝,而是AlphaGo已經(jīng)擁有了深度學(xué)習(xí)的能力,能夠?qū)W習(xí)已經(jīng)對(duì)弈過(guò)的棋盤(pán),并在練習(xí)和實(shí)戰(zhàn)中不斷學(xué)習(xí)和積累經(jīng)驗(yàn)。

(2)圍棋比國(guó)際象棋更加復(fù)雜,圍棋棋盤(pán)有361個(gè)點(diǎn),其分支因子無(wú)窮無(wú)盡,19×19格圍棋的合法棋局?jǐn)?shù)的所有可能性是冪為171的指數(shù),這樣的計(jì)算量相當(dāng)巨大。英國(guó)圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡(jiǎn)單的規(guī)則加深了棋局的復(fù)雜性”。因此,進(jìn)入圍棋領(lǐng)域一直被認(rèn)為是目前人工智能的最大挑戰(zhàn)。

簡(jiǎn)而言之,AlphaGo取得勝利的一個(gè)很重要的方面就是它擁有強(qiáng)大的“學(xué)習(xí)”能力。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,得益于大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)。本文就從人工智能的發(fā)展歷程與現(xiàn)狀入手,在此基礎(chǔ)上分析了人工智能的未來(lái)發(fā)展前景。

1.人工智能的發(fā)展歷程

AlphaGo的勝利表明,人工智能發(fā)展到今天,已經(jīng)取得了很多卓越的成果。但是,其發(fā)展不是一帆風(fēng)順的,人工智能是一個(gè)不斷進(jìn)步,并且至今仍在取得不斷突破的學(xué)科。回顧人工智能的發(fā)展歷程,可大致分為孕育、形成、暗淡、知識(shí)應(yīng)用和集成發(fā)展五大時(shí)期。

孕育期:1956年以前,數(shù)學(xué)、邏輯、計(jì)算機(jī)等理論和技術(shù)方面的研究為人工智能的出現(xiàn)奠定了基礎(chǔ)。德國(guó)數(shù)學(xué)家和哲學(xué)家萊布尼茨把形式邏輯符號(hào)化,奠定了數(shù)理邏輯的基礎(chǔ)。英國(guó)數(shù)學(xué)家圖靈在1936年創(chuàng)立了自動(dòng)機(jī)理論(亦稱圖靈機(jī)),1950年在其著作《計(jì)算機(jī)與智能》中首次提出“機(jī)器也能思維”,被譽(yù)為“人工智能之父”??傊?,這些人為人工智能的孕育和產(chǎn)生做出了巨大的貢獻(xiàn)。

形成期:1956年夏季,在美國(guó)達(dá)特茅斯大學(xué)舉辦了長(zhǎng)達(dá)2個(gè)多月的研討會(huì),熱烈地討論用機(jī)器模擬人類智能的問(wèn)題。該次會(huì)議首次使用了“人工智能”這一術(shù)語(yǔ)。這是人類歷史上第一次人工智能研討會(huì),標(biāo)志著人工智能學(xué)科的誕生。其后的十幾年是人工智能的黃金時(shí)期。在接下來(lái)的幾年中,在眾多科學(xué)家的努力下,人工智能取得了矚目的突破,也在當(dāng)時(shí)形成了廣泛的樂(lè)觀思潮。

暗淡期:20世紀(jì)70年代初,即使最杰出的AI程序也只能解決問(wèn)題中最簡(jiǎn)單的部分,發(fā)展遇到瓶頸也就是說(shuō)所有的AI程序都只是“玩具”,無(wú)法解決更為復(fù)雜的問(wèn)題。隨著AI遭遇批評(píng),對(duì)AI提供資助的機(jī)構(gòu)也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。

知識(shí)應(yīng)用期:在80年代,“專家系統(tǒng)”(Expect System)成為了人工智能中一個(gè)非常主流的分支?!皩<蚁到y(tǒng)”是一種程序,為計(jì)算機(jī)提供特定領(lǐng)域的專門(mén)知識(shí)和經(jīng)驗(yàn),計(jì)算機(jī)就能夠依據(jù)一組從專門(mén)知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問(wèn)題。不同領(lǐng)域的專家系統(tǒng)基本都是由知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、推理機(jī)、解釋機(jī)制、知識(shí)獲取等部分組成。

集成發(fā)展期:得益于互聯(lián)網(wǎng)的蓬勃發(fā)展、計(jì)算機(jī)性能的突飛猛進(jìn)、分布式系統(tǒng)的廣泛應(yīng)用以及人工智能多分支的協(xié)同發(fā)展,人工智能在這一階段飛速發(fā)展。尤其是隨著深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)研究的不斷深入,人工智能在近幾十年中取得了長(zhǎng)足的進(jìn)步,取得了令人矚目的成就。

人工智能發(fā)展到今天,出現(xiàn)了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個(gè)里程碑。當(dāng)前人工智能的研究熱點(diǎn)主要集中在自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

2.人工智能l展現(xiàn)狀與前景

人工智能當(dāng)前有很多重要的研究領(lǐng)域和分支。目前,越來(lái)越多的AI項(xiàng)目依賴于分布式系統(tǒng),而當(dāng)前研究的普遍熱點(diǎn)則集中于自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。

自然語(yǔ)言處理:自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP),是語(yǔ)言學(xué)與人工智能的交叉學(xué)科,其主要功能就是實(shí)現(xiàn)讓機(jī)器明白人類的語(yǔ)言,這需要將人類的自然語(yǔ)言轉(zhuǎn)化為計(jì)算機(jī)能夠處理的機(jī)器語(yǔ)言。

自然語(yǔ)言處理主要包括詞法分析、句法分析和語(yǔ)義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對(duì)自然語(yǔ)言中句子的結(jié)構(gòu)、語(yǔ)法進(jìn)行分析如辨別疑問(wèn)句和感嘆句等。而語(yǔ)義分析則注重情感分析和整個(gè)段落的上下文分析,辨別一些字詞在不同的上下文定的語(yǔ)義和情感態(tài)度。

當(dāng)前自然語(yǔ)言的處理主要有兩大方向。一種是基于句法-語(yǔ)義規(guī)則的理性主義理論,該理論認(rèn)為需要為計(jì)算機(jī)制定一系列的規(guī)則,計(jì)算機(jī)在規(guī)則下進(jìn)行推理與判斷。因此其技術(shù)路線是一系列的人為的語(yǔ)料建設(shè)與規(guī)則制定。第二種是基于統(tǒng)計(jì)學(xué)習(xí)的經(jīng)驗(yàn)主義理論,這種理論在最近受到普遍推崇。該理論讓計(jì)算機(jī)自己通過(guò)學(xué)習(xí)并進(jìn)行統(tǒng)計(jì)推斷的方式不停地從數(shù)據(jù)中“學(xué)習(xí)”語(yǔ)言,試圖刻畫(huà)真實(shí)世界的語(yǔ)言現(xiàn)象,從數(shù)據(jù)中統(tǒng)計(jì)語(yǔ)言的規(guī)律。

機(jī)器學(xué)習(xí):機(jī)器學(xué)習(xí)(Machine Learning)是近20年來(lái)興起的人工智能一大重要領(lǐng)域。其主要是指通過(guò)讓計(jì)算機(jī)在數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,從而獲取“自我學(xué)習(xí)”的能力,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行判斷和預(yù)測(cè)的方法。

機(jī)器學(xué)致可以分為有監(jiān)督的學(xué)習(xí)和無(wú)監(jiān)督的學(xué)習(xí)。有監(jiān)督的學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中練出一個(gè)函數(shù)和目標(biāo),當(dāng)有新的數(shù)據(jù)到來(lái)時(shí),可以由訓(xùn)練得到函數(shù)預(yù)測(cè)目標(biāo)。有監(jiān)督的學(xué)習(xí)要求訓(xùn)練集同時(shí)有輸入和輸出,也就是所謂的特征和目標(biāo)。而依據(jù)預(yù)測(cè)的結(jié)果是離散的還是連續(xù)的,將有監(jiān)督的學(xué)習(xí)分為兩大問(wèn)題,即統(tǒng)計(jì)分類問(wèn)題和回歸分析問(wèn)題。統(tǒng)計(jì)分類的預(yù)測(cè)結(jié)果是離散的,如腫瘤是良性還是惡性等;而回歸分析問(wèn)題目標(biāo)是連續(xù)的,如天氣、股價(jià)等的預(yù)測(cè)。

無(wú)監(jiān)督學(xué)習(xí)的訓(xùn)練集則沒(méi)有人為標(biāo)注的結(jié)果,這就需要計(jì)算機(jī)去發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系并用來(lái)分類等。一種常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)是聚類分析(Cluster Analysis),它是將相似的對(duì)象通過(guò)靜態(tài)分類的方法分成不同的組別或者是特定的子集,讓同一個(gè)子集中的數(shù)據(jù)對(duì)象都有一些相似的屬性,比較常用的聚類方法是簡(jiǎn)潔并快速的“K-均值”聚類算法。它基于K個(gè)中心并對(duì)距離這些中心最近的數(shù)據(jù)對(duì)象進(jìn)行分類。

機(jī)器學(xué)習(xí)還包括如半監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)等類別??偠灾?,機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來(lái)模擬人類學(xué)習(xí)活動(dòng)的一門(mén)學(xué)科,而其應(yīng)用隨著人工智能研究領(lǐng)域的深入也變得越來(lái)越廣泛,如模式識(shí)別、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、推薦算法等領(lǐng)域越來(lái)越廣泛地應(yīng)用到了機(jī)器學(xué)習(xí)中。

人工神經(jīng)網(wǎng)絡(luò):在腦神經(jīng)科學(xué)領(lǐng)域,人們認(rèn)為人類的意識(shí)及智能行為,都是通過(guò)巨大的神經(jīng)網(wǎng)絡(luò)傳遞的,每個(gè)神經(jīng)細(xì)胞通過(guò)突出與其他神經(jīng)細(xì)胞連接,當(dāng)通過(guò)突觸的信號(hào)強(qiáng)度超過(guò)某個(gè)閾值時(shí),神經(jīng)細(xì)胞便會(huì)進(jìn)入激活狀態(tài),向所連接的神經(jīng)細(xì)胞一層層傳遞信號(hào)。于1943年提出的基于生物神經(jīng)元的M-P模型的主要思想就是將神經(jīng)元抽象為一個(gè)多輸入單輸出的信息處理單元,并通過(guò)傳遞函數(shù)f對(duì)輸入x1,x2…,xn進(jìn)行處理并模擬神經(jīng)細(xì)胞的激活模式。主要的傳遞函數(shù)有階躍型、線性型和S型。

在此基礎(chǔ)上,對(duì)神經(jīng)網(wǎng)絡(luò)算法的研究又有諸多進(jìn)展。日本的福島教授于1983年基于視覺(jué)認(rèn)知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型。通過(guò)學(xué)習(xí)訓(xùn)練獲取到卷積運(yùn)算中所使用的卷積系數(shù),并通過(guò)不同層次與自由度的變化,可以得到較為優(yōu)化的計(jì)算結(jié)果。而AlphaGo也正是采用了這種深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型,提高了AlphaGo的視覺(jué)分類能力,也就是所謂的“棋感”,增強(qiáng)了其對(duì)全盤(pán)決策和把握的能力。

3.人工智能的發(fā)展前景

總體來(lái)看,人工智能的應(yīng)用經(jīng)歷了博弈、感知、決策和反饋這幾個(gè)里程碑。在以上4個(gè)領(lǐng)域中,既是縱向發(fā)展的過(guò)程,也是橫向不斷改進(jìn)的過(guò)程。

人工智能在博弈階段,主要是實(shí)現(xiàn)邏輯推理等功能,隨著計(jì)算機(jī)處理能力的進(jìn)步以及深度學(xué)習(xí)等算法的改進(jìn),機(jī)器擁有了越來(lái)越強(qiáng)的邏輯與對(duì)弈能力。在感知領(lǐng)域,隨著自然語(yǔ)言處理的進(jìn)步,機(jī)器已經(jīng)基本能對(duì)人類的語(yǔ)音與語(yǔ)言進(jìn)行感知,并且能夠已經(jīng)對(duì)現(xiàn)實(shí)世界進(jìn)行視覺(jué)上的感知?;诖髷?shù)據(jù)的處理和機(jī)器學(xué)習(xí)的發(fā)展,機(jī)器已經(jīng)能夠?qū)χ車(chē)沫h(huán)境進(jìn)行認(rèn)知,例如微軟的Kinect就能夠準(zhǔn)確的對(duì)人的肢體動(dòng)作進(jìn)行判斷。該領(lǐng)域的主要實(shí)現(xiàn)還包括蘋(píng)果的Siri,谷歌大腦以及無(wú)人駕駛汽車(chē)中的各種傳感器等。在以上兩個(gè)階段的基礎(chǔ)上,機(jī)器擁有了一定的決策和反饋的能力。無(wú)人駕駛汽車(chē)的蓬勃發(fā)展就是這兩個(gè)里程碑很好的例證。Google的無(wú)人駕駛汽車(chē)通過(guò)各種傳感器對(duì)周?chē)沫h(huán)境進(jìn)行感知并處理人類的語(yǔ)言等指令,利用所收集的信息進(jìn)行最后的決策,比如操作方向盤(pán)、剎車(chē)等。

人工智能已經(jīng)滲透到生活中的各個(gè)領(lǐng)域。機(jī)器已經(jīng)能識(shí)別語(yǔ)音、人臉以及視頻內(nèi)容等,從而實(shí)現(xiàn)各種人際交互的場(chǎng)景。在醫(yī)學(xué)領(lǐng)域,人工智能可以實(shí)現(xiàn)自動(dòng)讀片和輔助診斷以及個(gè)性化t療和基因排序等功能。在教育領(lǐng)域,機(jī)器也承擔(dān)了越來(lái)越多的輔助教育,智能交互的功能。在交通領(lǐng)域,一方面無(wú)人車(chē)的發(fā)展表明無(wú)人駕駛是一個(gè)可以期待的未來(lái),另一方面人工智能能夠帶來(lái)更加通暢和智能的交通。另外人工智能在安防、金融等領(lǐng)域也有非常廣闊的發(fā)展前景??傊?,人工智能在一些具有重復(fù)性的和具備簡(jiǎn)單決策的領(lǐng)域已經(jīng)是一種非常重要的工具,用來(lái)幫助人們解決問(wèn)題,創(chuàng)造價(jià)值。

參考文獻(xiàn)

[1]阮曉東.從AlphaGo的勝利看人工智能的未來(lái)[J].新經(jīng)濟(jì)導(dǎo)刊,2016 (6):69-74.

第9篇:計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文

關(guān)鍵詞:PCB;圖像處理;視覺(jué)檢測(cè)

中圖分類號(hào):TP277文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)07-1648-06

當(dāng)今世界科技發(fā)展日新月異,電子產(chǎn)業(yè)的發(fā)展直接制約著國(guó)民經(jīng)濟(jì)的騰飛與否,而PCB電路板制作工藝的提高對(duì)促進(jìn)電子產(chǎn)業(yè)的發(fā)展至關(guān)重要,能否有效精確地檢測(cè)PCB電路板的缺陷一直都是電子行業(yè)的研究熱點(diǎn)。國(guó)外的印刷電路板自動(dòng)檢測(cè)技術(shù)一直領(lǐng)先于國(guó)內(nèi),國(guó)內(nèi)的很多廠家不得不采用昂貴的外國(guó)技術(shù),雖然近年國(guó)內(nèi)的印刷電路板自動(dòng)檢測(cè)技術(shù)發(fā)展迅速,但大都沒(méi)有取得令人非常滿意的結(jié)果。加入研究這一領(lǐng)域的熱潮,趕超外國(guó)的先進(jìn)技技水平,打斷外國(guó)壟斷技術(shù),對(duì)于發(fā)展國(guó)民經(jīng)濟(jì)具有十分重要的意義。

1 PCB檢測(cè)系統(tǒng)的硬件設(shè)計(jì)

1.1 PCB檢測(cè)系統(tǒng)的硬件組成框圖

雖然本文所做的工作主要是軟件方面,但對(duì)于硬件系統(tǒng)的設(shè)計(jì)也是至關(guān)重要的,它對(duì)于建立有效的計(jì)算機(jī)視覺(jué)識(shí)別檢測(cè)系統(tǒng),起著決定性作用。因此,必須在綜合考慮系統(tǒng)性價(jià)比和系統(tǒng)性能的基礎(chǔ)上,設(shè)計(jì)出合理的硬件系統(tǒng)[9]。PCB檢測(cè)系統(tǒng)的硬件組成框圖如圖1所示:圖1 PCB檢測(cè)系統(tǒng)硬件組成框圖

1.2系統(tǒng)的硬件組成

系統(tǒng)的硬件組成[10]主要包括:計(jì)算機(jī)主機(jī)、CCD攝像機(jī)、圖像采集卡、照明系統(tǒng)及相關(guān)的設(shè)備。

2 PCB電路板缺陷檢測(cè)識(shí)別

PCB電路板在電子工業(yè)中的應(yīng)用越來(lái)越廣泛,如何降低電路板的故障率、提高電路板的質(zhì)量直接影響到整個(gè)產(chǎn)業(yè)的發(fā)展。因此,對(duì)于PCB電路板缺陷的識(shí)別技術(shù)的發(fā)展至關(guān)重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過(guò)焊等等,由于實(shí)驗(yàn)室設(shè)備限制和個(gè)人水平所限,本文主要研究的內(nèi)容是PCB電路板短路與斷路的檢測(cè)識(shí)別

近年來(lái)出現(xiàn)了很多圖像檢測(cè)算法,這些算法大致可分為三大類:有參考算法、無(wú)參考算法以及混合型算法。有參考算法分為兩大類:圖像對(duì)比法和模型對(duì)比法。無(wú)參考算法是一種不需要標(biāo)準(zhǔn)圖像的檢測(cè)算法,它是基于一定的設(shè)計(jì)規(guī)則來(lái)進(jìn)行檢測(cè)的?;旌闲头椒ㄊ菍⒂袇⒖妓惴ㄅc無(wú)參考算法混合使用,從而發(fā)揮出各自的優(yōu)點(diǎn)。比如,模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用,或者連接表方法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用等。本文中短路與斷路的檢測(cè)識(shí)別采取了圖像對(duì)比法,即將經(jīng)過(guò)一定處理后的圖像進(jìn)行相減,從而分析相應(yīng)的結(jié)果;而對(duì)焊點(diǎn)缺陷的識(shí)別主要采用模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用。

2.1 PCB電路板缺陷檢測(cè)識(shí)別的主要流程圖

圖2為子程序流程圖;圖3為主程序流程圖。

2.2 PCB電路板短路與斷路的檢測(cè)識(shí)別

2.2.1邊緣檢測(cè)

在對(duì)圖像進(jìn)行基本的處理過(guò)后可以將圖像與背景分割開(kāi)來(lái)。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中的基本問(wèn)題,邊緣檢測(cè)的目的是標(biāo)識(shí)數(shù)字圖像中亮度變化明顯的點(diǎn)。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。

這些包括:深度上的不連續(xù);表面方向不連續(xù);物質(zhì)屬性變化;場(chǎng)景照明變化。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中,尤其是特征提取中的一個(gè)研究領(lǐng)域。

圖像邊緣檢測(cè)大幅度地減少了數(shù)據(jù)量,并且剔除了可以認(rèn)為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性。有許多方法用于邊緣檢測(cè),它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類?;诓檎业姆椒ㄍㄟ^(guò)尋找圖像一階導(dǎo)數(shù)中的最大和最小值來(lái)檢測(cè)邊界,通常是將邊界定位在梯度最大的方向?;诹愦┰降姆椒ㄍㄟ^(guò)尋找圖像二階導(dǎo)數(shù)零穿越來(lái)尋找邊界,通常是Laplacian過(guò)零點(diǎn)或者非線性差分表示的過(guò)零點(diǎn)。

1)Roberts算子

邊緣,是指周?chē)袼鼗叶扔须A躍變化或屋頂?shù)茸兓哪切┫袼氐募?。圖像的邊緣對(duì)應(yīng)著圖像灰度的不連續(xù)性。顯然圖像的邊緣很少是從一個(gè)灰度跳到另一個(gè)灰度這樣的理想狀況。真實(shí)圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡?tīng)?。邊緣的銳利程度由圖像灰度的梯度決定。梯度是一個(gè)向量,?f指出灰度變化的最快的方向和數(shù)量,如式2-1所示。

?f=(決定的。

因此最簡(jiǎn)單的邊緣檢測(cè)算子是用圖像的垂直和水平差分來(lái)逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)

因此當(dāng)我們想尋找邊緣的時(shí)候,最簡(jiǎn)單的方法是對(duì)每一個(gè)像素計(jì)算出(2,4)的向量,然后求出他的絕對(duì)值,然后進(jìn)行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。

R(i,j)=

(式2-5)

它是一個(gè)兩個(gè)2×2模板作用的結(jié)果。

2)Sobel算子

該算法通過(guò)2個(gè)3*3的模板,對(duì)選定的二維圖像中同樣大小窗口進(jìn)行卷積,通常是一個(gè)模板對(duì)一個(gè)邊緣響應(yīng)大,另一個(gè)模板對(duì)水平邊緣響應(yīng)大,兩個(gè)卷積值對(duì)最大值作為該點(diǎn)對(duì)輸出。對(duì)于圖像上的任意點(diǎn)(i,j)進(jìn)行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。

用sobel算子檢測(cè)階躍邊緣得到的邊緣寬度至少為兩個(gè)寬度。3)Laplacian邊緣檢測(cè)算子

Laplacian算子定義由式2-9所示。

Δ2f(x,y)=

(式2-9)它的差分形式由式2-10所示。

Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}

=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)

Laplacian算子是一種各向同性算子,在只關(guān)心邊緣的位置而不考慮其周?chē)幕叶认笏夭钪禃r(shí)時(shí)比較合適,Laplacian算子對(duì)孤立象素的響應(yīng)要比對(duì)邊緣或線的響應(yīng)更要強(qiáng)烈,因此只適用于無(wú)噪聲圖像。

原圖像與用三種邊緣檢測(cè)算子處理后的圖像如下所示:圖6 Sobel邊緣檢測(cè)圖7 Laplacian邊緣檢測(cè)

從上面四幅圖分析比較可得出結(jié)論:用Roberts邊緣檢測(cè)得出的圖像較之其他方法更為清晰,噪點(diǎn)更少,圖像更為連續(xù),所以本文中采用Roberts算子來(lái)進(jìn)行邊緣檢測(cè)。

2.2.2閾值分割

閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過(guò)設(shè)定不同的特征閾值,把圖像象素點(diǎn)分為若干類。常用的特征包括:直接來(lái)自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設(shè)原始圖像為f(x,y),按照一定的準(zhǔn)則f(x,y)中找到特征值T,將圖像分割為兩個(gè)部分,分割后的圖像為:

若?。篵0=0(黑),b1=1(白),即為我們通常所說(shuō)的圖像二值化。

在數(shù)字化的圖像數(shù)據(jù)中,無(wú)用的背景數(shù)據(jù)和對(duì)象物的數(shù)據(jù)經(jīng)常放在一起,同時(shí),圖像中還含有各種噪聲,因此可以根據(jù)圖像的統(tǒng)計(jì)性質(zhì),從概率的角度來(lái)選擇合適的閾值。

1)最大方差閾值法

把待處理圖像的直方圖在某一閾值處分割為兩組,當(dāng)被分割成的兩組間的方差最大時(shí),便可以決定閾值了。

設(shè)灰度圖像f(x,y)的灰度級(jí)為0-L,灰度級(jí)I的像素為Ni,則圖中:

總象素?cái)?shù)N=∑j=0 i=LNi(式2-11)灰度級(jí)i出現(xiàn)的概率Pi= 1-ω(K)(式2-16)則兩組間的數(shù)學(xué)期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)

ρ2(k)是K的函數(shù),計(jì)算k取從0,1,2…L時(shí)ρ2(k)的值,當(dāng)多的值為最大時(shí),K即為閾值。

2)雙峰法

根據(jù)圖像的直方圖具有背景和對(duì)象物的兩個(gè)峰,分割兩個(gè)區(qū)域的閾值由兩個(gè)峰值之間的谷所對(duì)應(yīng)的灰度值決定。設(shè)灰度圖像f(x,y)的灰度級(jí)為0-L,灰度i的像素為Pi,分別計(jì)算

因?yàn)閷?shí)際PCB電路板有著許多的劃痕、污點(diǎn)等,使用最大方差閾值法時(shí),會(huì)在處理后的圖像上產(chǎn)生許多誤點(diǎn),而影響實(shí)際結(jié)果的分析,而雙峰法能夠順利地濾除這些干擾,這個(gè)結(jié)論在分析對(duì)比以上圖像時(shí)也可得出。所以本文選用了雙峰法來(lái)進(jìn)行閾值分割。

2.2.3粒子分析與圖像對(duì)比

經(jīng)過(guò)邊緣檢測(cè)和閾值分割的圖像中會(huì)存在許多瑕點(diǎn),這些點(diǎn)會(huì)影響到最后的圖像識(shí)別與分析,有可能會(huì)增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進(jìn)行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析

將標(biāo)準(zhǔn)PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。

將缺陷PCB圖片減去標(biāo)準(zhǔn)PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。

3結(jié)束語(yǔ)

利用LABVIEW來(lái)進(jìn)行PCB電路板缺陷的識(shí)別與檢測(cè)是一項(xiàng)非常好的課題,它在近些年已經(jīng)得到了一定的發(fā)展,并將得到更大的進(jìn)步。限于本人能力和時(shí)間,本文的研究還未涉及很深的領(lǐng)域,可以在以下方面加以改進(jìn):

1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設(shè)計(jì)可以再利用其他語(yǔ)言如VISUAL BASIC,C++等編程語(yǔ)言加以輔助設(shè)計(jì),相信可以取得更加令人滿意的結(jié)果。

2)由于實(shí)驗(yàn)設(shè)備等其他因素,本文中只重點(diǎn)研究了PCB電路板短路與斷路的檢測(cè)識(shí)別,PCB電路板的其他缺陷還有待于進(jìn)一步的分析研究、分類和總結(jié),并設(shè)計(jì)出更好的檢測(cè)方法,以真正滿足PCB電路板檢測(cè)的需求。

3)照明設(shè)備的限制在很大程度上影響到了圖像的檢測(cè)效果,為取得PCB缺陷檢測(cè)的進(jìn)一步進(jìn)展,在照明設(shè)備的選擇上必須重視,并且設(shè)計(jì)出更好的圖像采集系統(tǒng)。

4)在識(shí)別與檢測(cè)手段上,可以引入更新更好的方法,而不要局限于在傳統(tǒng)的方法中分析比較,例如基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別檢測(cè),圖像的模糊決策等將有待于進(jìn)一步研究。

總之,基于LABVIEW的機(jī)器視覺(jué)檢測(cè)系統(tǒng)已經(jīng)取得了不錯(cuò)的進(jìn)展,高速發(fā)展的PCB制造技術(shù)和計(jì)算機(jī)技術(shù)對(duì)于PCB缺陷的檢測(cè)提出了更高的要求,同時(shí)也大大地促進(jìn)了PCB缺陷檢測(cè)技術(shù)的發(fā)展。利用機(jī)器視覺(jué)檢測(cè)在未來(lái)的較長(zhǎng)的一段時(shí)間內(nèi)將占據(jù)檢測(cè)行業(yè)的半壁江山,相信在未來(lái)會(huì)取得更大的發(fā)展。

參考文獻(xiàn):

[1]程學(xué)慶,房曉溪.LabVIEW圖形化編程與實(shí)例應(yīng)用[M].北京:中國(guó)鐵道出版社,2005.

[2]胡仲波.基于虛擬儀器技術(shù)的PCB視覺(jué)檢測(cè)系統(tǒng)[D].南京:南京理工大學(xué)碩士學(xué)位論文,2006.

[3]段峰,王耀南.機(jī)器視覺(jué)技術(shù)及其應(yīng)用綜述[J].自動(dòng)化博覽,2002,19(3).

[4]周長(zhǎng)發(fā).精通Visual C++圖像處理編程[M].北京:電子工業(yè)出版社,2004.

[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設(shè)計(jì)從入門(mén)到精通[M].北京:清華大學(xué)出版社,2007.

[6]鄭偉.圖像法檢測(cè)印刷電路板缺陷[M].西安:西安理工大學(xué),2002.

[7] National Instruments,IMAQ User Manual Concepts[Z].1999.

[8]李強(qiáng).PCB板缺陷自動(dòng)檢測(cè)技術(shù)的分析研究[D].合肥:合肥工業(yè)大學(xué),2002.

[9]傅茂名.基于形態(tài)邊緣檢測(cè)算法的一種改進(jìn)[J].電子科技大學(xué)學(xué)報(bào),2005(2).

[10]王思華.計(jì)算機(jī)視覺(jué)新技術(shù)及其在IC標(biāo)記質(zhì)量檢驗(yàn)系統(tǒng)設(shè)計(jì)中的應(yīng)用[J].電子技術(shù)應(yīng)用,2000(9).

[11]岳永哲.圖像處理技術(shù)在閱卷系統(tǒng)中的應(yīng)用[D].北京:北京工業(yè)大學(xué),2006.

[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.

[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.

[14]高育鵬,楊俊,何廣軍.基于圖像識(shí)別的自動(dòng)閱卷系統(tǒng)研究[J].現(xiàn)代電子期刊,2006(22).

[15]楊青燕,彭延軍.基于灰度圖像的答題卡識(shí)別技術(shù)[J].山東科技大學(xué)學(xué)報(bào):自然科學(xué)版,2009(3).

[16]周海濤,韓曉軍.基于數(shù)字圖像處理的答題卡識(shí)別方法研究[J].電腦知識(shí)與技術(shù),2008(28).

[17]周萬(wàn)珍,鄭廣,王建霞,等.數(shù)字圖像處理技術(shù)在客觀題閱卷中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006(8).

[18]王勝春.基于SVM的信息卡識(shí)別系統(tǒng)[D].長(zhǎng)沙:湖南師范大學(xué),2008.

[19]吳志明.SMT系統(tǒng)中焊點(diǎn)位置的檢測(cè)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2006.

[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點(diǎn)信息的自動(dòng)獲取[J].焊接學(xué)報(bào),2005,39(6).