公務(wù)員期刊網(wǎng) 精選范文 計算機(jī)視覺的研究方向范文

計算機(jī)視覺的研究方向精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺的研究方向主題范文,僅供參考,歡迎閱讀并收藏。

第1篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞 計算機(jī)視覺;立體匹配;研究情況

中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)07-0001-01

隨著科學(xué)技術(shù)的快速發(fā)展,計算機(jī)技術(shù)也得到了飛速的發(fā)展。將計算機(jī)技術(shù)應(yīng)用于人類的視覺系統(tǒng),并輔助人們觀察到一些眼睛難以看到的東西,已經(jīng)逐漸成為一門大家所熱捧和追逐的技術(shù)。隨著人們對視覺傳感器技術(shù)越來越多的探索,人們也逐漸實(shí)現(xiàn)了古代時想擁有千里眼的夢想。目前,人們已經(jīng)把視覺傳感器技術(shù)和計算機(jī)技術(shù)良好的結(jié)合在一起,并把這些技術(shù)應(yīng)用到食品、建筑、醫(yī)藥、電子、航天航空等眾多領(lǐng)域當(dāng)中。而該項(xiàng)技術(shù)的快速發(fā)展,也幫助人們解決了一些日常工作當(dāng)中人類視覺存在盲區(qū)的問題,保證了人們工作過程的安全。視覺技術(shù)與IT技術(shù)的完美結(jié)合使得人們的生活變得更加便利,讓人們親身體會到了IT技術(shù)給人們生活帶來的便捷。

1 雙目立體視覺概述

雙目立體視覺又稱雙目視覺技術(shù),是目前計算機(jī)視覺應(yīng)用領(lǐng)域的重要研究內(nèi)容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應(yīng)用功能的不同,組成也都各不相同。

雙目立體視覺的實(shí)現(xiàn)原理是基于人眼的視網(wǎng)膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實(shí)現(xiàn)清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據(jù)匹配的結(jié)果,獲取同一個物體不同偏差位置的信息。最后在依據(jù)三角測量技術(shù),根據(jù)已經(jīng)獲得的這些偏差信息從而獲得這些不同點(diǎn)對應(yīng)的距離信息,并最終獲得這些實(shí)際物體的具體坐標(biāo)位置信息。

視差測距技術(shù)告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達(dá)到拍攝同一個物體的目的。根據(jù)同一個物體在兩個觀察物當(dāng)中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設(shè)備、圖像預(yù)處理設(shè)備、攝像機(jī)標(biāo)定設(shè)備、立體匹配設(shè)備、根據(jù)二維信息實(shí)現(xiàn)三維重構(gòu)設(shè)備等五個重要設(shè)備。

2 雙目立體視覺技術(shù)的原理

立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術(shù)。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術(shù)或者通過合理的觀察手段和觀察設(shè)備,就可以看到一組秩序井然的美妙圖片。

三維立體圖是一組重復(fù)的二維圖片有序的堆積積累而成,因此可以呈現(xiàn)出立體效果。人體觀察物體的原理大致如下:當(dāng)人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當(dāng)左右眼重新聚焦或者在觀察畫面的時候呈現(xiàn)一定的層次感,則人類的左右眼觀察到的一組重復(fù)案在經(jīng)過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。

雙目立體視覺技術(shù)正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標(biāo)圖像的信息,并經(jīng)過一定的處理獲得三維重建的物體立體信息的技術(shù)。

雙目立體視覺在計算機(jī)技術(shù)中實(shí)現(xiàn)三維重建的大致流程

如下。

1)攝像機(jī)定位,并通過單片機(jī)計算得到要獲取圖像信息需要的外部的參數(shù)的大概值,并根據(jù)這些參數(shù)值設(shè)定攝像機(jī)。

2)用設(shè)定參數(shù)的攝像機(jī)拍攝目標(biāo)場景的畫面,并采集這些畫面的二維圖的信息。

3)通過計算機(jī)技術(shù)實(shí)現(xiàn)雙目匹配,并判定采集畫面中的二維圖像中的不同點(diǎn)之間的對應(yīng)關(guān)系。

4)在第三步中若得到兩組二維圖像的關(guān)系是稠密的時候,則生成三維視差圖。如果不是則進(jìn)一步采集圖片信息。

5)根據(jù)得到的視差圖最終實(shí)現(xiàn)場景的三維圖形的重建。

3 雙目立體匹配技術(shù)的研究難點(diǎn)和未來的發(fā)展方向

盡管目前有很多學(xué)者都投身到雙目立體匹配技術(shù)的研究和開發(fā)當(dāng)中,直至目前為止也解決了很多關(guān)于視覺理論當(dāng)中存在的很多缺陷問題。但是視覺問題是一個復(fù)雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術(shù)的難點(diǎn)已經(jīng)成為限制將雙目技術(shù)應(yīng)用到計算機(jī)技術(shù)當(dāng)中的重要瓶頸。

立體匹配的主要手段就是找到計算機(jī)采集到兩幅和多副圖片的中像素的對應(yīng)關(guān)系,然后根據(jù)這些像素關(guān)系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現(xiàn)在以下幾個方面。

1)由于視角的問題或者觀察物體存在遮擋問題,導(dǎo)致采集回來的圖片信息存在盲點(diǎn),這樣子更難找到圖片的匹配區(qū)域。

2)場景中的一些深度不連續(xù)的區(qū)域大都處在場景當(dāng)中的邊界位置,這些位置容易出現(xiàn)像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。

3)場景當(dāng)中的低紋理的圖片匹配特征和匹配關(guān)系較少,而且該位置的每個像素點(diǎn)極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結(jié)果,而這些匹配結(jié)果當(dāng)中有一大部分是錯誤的。這樣子的結(jié)果勢必會導(dǎo)致最終的圖像匹配正確率極為低下。

從以上的分析,我們可以看出立體匹配技術(shù)存在很多技術(shù)上的難點(diǎn),這些都在很大程度上限制雙目立體匹配技術(shù)在計算機(jī)當(dāng)中的應(yīng)用發(fā)展。如何才能設(shè)計出有效、準(zhǔn)確、快速、通用性強(qiáng)的立體匹配算法將會是以后雙目立體匹配計算發(fā)展的重要方向。也只有通過設(shè)計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術(shù)在計算機(jī)視覺當(dāng)中得到廣泛的應(yīng)用。

4 結(jié)束語

人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠(yuǎn)近。因此人類視覺感知系統(tǒng)就是一個雙目的立體感知系統(tǒng)。本文講述的計算機(jī)中的雙目立體匹配技術(shù)正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機(jī)采集獲得兩幅二維圖像的信息進(jìn)行分析,并結(jié)合計算機(jī)的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術(shù)與計算機(jī)技術(shù)的完美結(jié)合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項(xiàng)技術(shù)應(yīng)用于人類的視網(wǎng)膜當(dāng)中,以幫助一些視網(wǎng)膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。

參考文獻(xiàn)

[1]高文,陳熙霖.計算機(jī)視覺算法與系統(tǒng)原理[M].北京:清華大學(xué)出版社,2002.

[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學(xué),2008.

[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準(zhǔn)則及其快速算法[J].電路與系統(tǒng)學(xué)報,2007,12(4):137-14.

[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學(xué),2012.

第2篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞:計算機(jī)視覺;定標(biāo)方法;應(yīng)用特點(diǎn)

中圖分類號:TP319文獻(xiàn)標(biāo)識碼:A文章編號:16727800(2012)007014902

作者簡介:許志雄(1968-),男,浙江紹興人,江漢石油鉆頭股份有限公司工程師,研究方向?yàn)橛嬎銠C(jī)多媒體。

0引言

計算機(jī)技術(shù)的應(yīng)用在諸多領(lǐng)域占據(jù)了主要位置,并得到了人們的極大重視。在此形勢下,攝像機(jī)的高清晰度亦成為了人們追逐的目標(biāo),而在計算機(jī)視覺中的定標(biāo)方法有各種不同的處理方式,從而為攝像機(jī)的發(fā)展提供了一個絕好的機(jī)會。由此,計算機(jī)視覺中的攝像機(jī)定標(biāo)方法成為當(dāng)今世界攝像機(jī)研究領(lǐng)域里至關(guān)重要的一個方面,以攝像機(jī)得到的圖像信息作為出發(fā)點(diǎn)來計算三維空間中自然場景的幾何信息成為計算機(jī)視覺的基本任務(wù)之一,并且它的應(yīng)用特點(diǎn)也得到了人們的密切關(guān)注。

1攝像機(jī)視覺投影原理

透鏡成像的原理利用了光的折射現(xiàn)象,而攝像機(jī)的視覺投影原理和透鏡的成像原理相差無幾,只不過在一些細(xì)節(jié)上進(jìn)行了相應(yīng)的改變,使成像更加清晰,以更好地滿足人們的需求。攝像機(jī)視覺投影原理就是利用鏡頭的光學(xué)原理進(jìn)行視覺成像,而其中又有許多理論支持,包含鏡頭與焦距和視角。焦距是指鏡頭的焦點(diǎn)之間的距離,對于攝像機(jī)而言,就是指從鏡頭的中心位置到攝像管,也可以說是成像的位置之間的距離就是攝像機(jī)鏡頭的焦距,只有調(diào)整好了這兩者之間的距離,才能保證攝像機(jī)的攝像效果,這也是保證攝像機(jī)正常工作的首要任務(wù)。視角要受到鏡頭焦距的限制,由鏡頭焦距對攝像的大小情況而決定,攝影師們就是通過對焦距的不斷變換來改變對任務(wù)的造型,從而改變?nèi)藗兊囊曈X效果。對于拍攝相同距離的目標(biāo)而言,鏡頭焦距越大,攝像的水平視角就會變得越窄,這樣帶來的后果就是拍攝到的目標(biāo)的范圍就越小,使得拍攝效果大打折扣,從而給攝像機(jī)帶來不利的使用效益。因此,必須在兩者達(dá)到一個較好的組合效果之時,才能夠充分發(fā)揮攝像機(jī)的作用,并將攝像藝術(shù)發(fā)揮到極致。由此可見,計算機(jī)視覺中的攝像機(jī)定標(biāo)方法將會給攝像機(jī)的拍攝效果帶來巨大的轉(zhuǎn)變。

2計算機(jī)視覺中的攝像機(jī)定標(biāo)方法

2.1三維定標(biāo)法

在人們的平常思維中,凡是物體的影像必定是三維的,本文的理論研究也同樣基于這樣的想法。在討論單幅圖像的設(shè)計標(biāo)定之時,我們所追求的理論基礎(chǔ)就是需要攝像機(jī)的定標(biāo)物是人們所追求的那種三維的效果,在此基礎(chǔ)上再進(jìn)行相關(guān)的理論研究,以達(dá)到相得益彰的效果。在此過程中,首先要準(zhǔn)確定位定標(biāo)物上一些比較重要的點(diǎn)的三維坐標(biāo),這樣才能夠?yàn)楹髞淼墓ぷ魈峁┓奖悖蝗缓笤谂c定標(biāo)物相對應(yīng)的成像上找到相應(yīng)的點(diǎn)的位置,這是至關(guān)重要的一步,這也決定了后面成像的具體設(shè)計方法;最后在那些比較重要的點(diǎn)的圖像上標(biāo)出其具體的三維坐標(biāo),達(dá)到定標(biāo)物的實(shí)際成像效果圖,這樣就可以完全解決攝像機(jī)的成像問題了。這種定標(biāo)方法的基本原理就是充分分析定標(biāo)物的三維信息,同時與它的具體成像位置相關(guān)聯(lián),在這兩者之間形成一種具體的相對應(yīng)關(guān)系。由此我們可以充分利用計算機(jī)的快速運(yùn)算,實(shí)現(xiàn)攝像的功能,并適時進(jìn)行程序功能改進(jìn),優(yōu)化定標(biāo)物參數(shù)的獲取方法,從而達(dá)到增加攝像機(jī)清晰度的目標(biāo)。

2.2平面定標(biāo)法

與上面的定標(biāo)方法相對立的一種方法就是多幅圖像的設(shè)計標(biāo)定。在這樣的時代背景下,人們的要求應(yīng)盡可能得到滿足,因而理論研究者會在這個方面下足功夫,弄懂這里面的個中玄機(jī),利用多幅圖像對平面的定標(biāo)物來進(jìn)行物體的標(biāo)定工作,以達(dá)到攝像機(jī)定標(biāo)的目的。這樣的平面定標(biāo)方法就是充分利用平面物體的運(yùn)動特性,在它和攝像機(jī)之間找到一個平衡點(diǎn),觀察兩者的相對運(yùn)動,這樣的定標(biāo)方法也給拍攝運(yùn)動中的物體帶來了生機(jī)。此方法在實(shí)施之余也會帶給人們不一樣的感受,讓人們充分體會到攝像的魅力。當(dāng)然這種考慮運(yùn)動的平面定標(biāo)法會受到特征點(diǎn)的增多的影響,隨著點(diǎn)的不斷增加,定標(biāo)情況就會越來越好,定標(biāo)物的精度也會不斷提高,于是在定標(biāo)物相同的前提下,平面定標(biāo)法自然就可以從定標(biāo)物上獲得更多的數(shù)據(jù)信息,為準(zhǔn)確對定標(biāo)物進(jìn)行定位測量提供了更多的依據(jù)。因此,這種方法的效果要比前面的方法好很多,得到推廣的力度也會大大增加,所得到的經(jīng)濟(jì)效益也會增加,設(shè)備的成本在原來的基礎(chǔ)上還有降低的趨勢。所以,理論研究者的研究領(lǐng)域就會逐漸向這一方面進(jìn)行轉(zhuǎn)變。

2.3兩步定標(biāo)法

有了前面的研究成果作支撐,攝像機(jī)定標(biāo)方法的進(jìn)一步研究就會顯得異常容易,人們的進(jìn)一步要求也會得到滿足,可謂一舉兩得。理論研究者們在有了豐富的理論和實(shí)踐基礎(chǔ)之后,利用直接線性的定標(biāo)方法進(jìn)行攝像機(jī)參數(shù)的進(jìn)一步優(yōu)化提高,通過透視原理來修改以前的參數(shù),然后將修正的參數(shù)進(jìn)行初始值的確認(rèn),把它們作為現(xiàn)在研究階段的起點(diǎn),在這樣的起點(diǎn)之上綜合考慮各種外界因素,利用最優(yōu)化的計算機(jī)算法進(jìn)行攝像機(jī)成像程序的改進(jìn),把原來的程序進(jìn)行升級處理,使得定標(biāo)物的精確度得到進(jìn)一步的提高,這就是我們所提到的兩步定標(biāo)法。它的基本原理其實(shí)很簡單,只不過是充分利用了原有的理論,并進(jìn)行了一定的創(chuàng)新而已。但就是這樣的創(chuàng)新步伐的邁出,給計算機(jī)視覺中的攝像機(jī)定標(biāo)方法帶來了新的生機(jī),也給攝像機(jī)鏡頭的優(yōu)化帶來了很多指導(dǎo)方法。在圖像中心到圖像點(diǎn)的距離保持不變的前提下,參數(shù)的數(shù)量會顯著減少,這樣不僅節(jié)省了材料的用量,而且還進(jìn)一步提高了攝像機(jī)的攝像清晰度,有效彌補(bǔ)了以前清晰度不高的缺點(diǎn)。這樣一來,攝像機(jī)的成像效果大大改進(jìn),于是才有了現(xiàn)代攝像機(jī)的高清效果,確實(shí)讓人們享受到了科技帶來的福音。

3計算機(jī)視覺中的攝像機(jī)定標(biāo)方法的應(yīng)用特點(diǎn)

3.1建立于主動視覺上的自我標(biāo)定

由于計算機(jī)視覺中攝像機(jī)定標(biāo)方法的不斷推廣,一些計算機(jī)技術(shù)在攝像機(jī)的制作過程中得到了較好的應(yīng)用。但是在這之中必不可少地存在一些制作人員或設(shè)計人員的主觀因素,這樣攝像機(jī)的標(biāo)定方法中就會形成形色各異的特點(diǎn),而且彼此之間可能會出現(xiàn)較大的不同,特別是在主動視覺上的自我標(biāo)定。在主動視覺中,我們所用到的攝像機(jī)可以在一個被控制的平臺上被人們固定,利用計算機(jī)的高運(yùn)算能力,計算機(jī)可以把平臺上所出現(xiàn)的參數(shù)精確地讀出來,我們只需要利用控制攝像機(jī)的運(yùn)轉(zhuǎn)順序,讓攝像機(jī)作一定的周期運(yùn)動,就可以在這個過程中得到更多的圖像,然后再利用所成的圖像和固定的攝像機(jī)的運(yùn)動參數(shù)來確定攝像機(jī)的運(yùn)動情況。這種自我標(biāo)定方法比較簡單,但是必須為人們提供精確控制攝像機(jī)運(yùn)動的平臺,這種以主觀意識為主的標(biāo)定特點(diǎn)強(qiáng)化了個人的主觀能動性,讓人們更加易于接受。

3.2進(jìn)行有層次劃分的逐步標(biāo)定

近年來,人們對攝像技術(shù)的理論研究已經(jīng)日趨成熟,并根據(jù)自己的意愿進(jìn)行相關(guān)的研究工作,把自己的想法融入到攝像機(jī)的設(shè)計中,真正做到有層次的逐步標(biāo)定,把所要的標(biāo)定物以逐個擊破的方式實(shí)現(xiàn)有層次的程序算法,從而讓人們在邏輯上能夠有所認(rèn)識,并且易于接受,從而達(dá)到有層次劃分的逐步標(biāo)定的目的。分層逐步標(biāo)定法已為標(biāo)定研究領(lǐng)域中普遍認(rèn)同的方法之一,在實(shí)際的應(yīng)用中逐漸取代了直接標(biāo)定的方法。因?yàn)檫M(jìn)行有層次劃分的逐步標(biāo)定是符合人們的想法的,而且這種方法的特點(diǎn)是以射影標(biāo)定作為基礎(chǔ),以某一幅圖像作為基準(zhǔn)圖像,進(jìn)行其它圖像的射影對齊工作,從而將攝相機(jī)中成像未知參數(shù)的數(shù)量減少,更易于為人們所接受??梢哉f,進(jìn)行有層次劃分的逐步標(biāo)定是人們在實(shí)踐中得出的一套符合大勢所趨的標(biāo)定方法,為世人所推崇。

4結(jié)語

綜上所述,計算機(jī)視覺中攝像機(jī)定標(biāo)方法在人們的不斷認(rèn)識中得以應(yīng)用和推廣,在時代的不斷進(jìn)步中逐漸向前發(fā)展。同時,攝像機(jī)標(biāo)定方法的應(yīng)用特點(diǎn)也大相徑庭,各有千秋,從而實(shí)現(xiàn)百家爭鳴的態(tài)勢,進(jìn)一步推動計算機(jī)視覺中的攝像機(jī)研究工作的向前發(fā)展。

參考文獻(xiàn):

第3篇:計算機(jī)視覺的研究方向范文

國內(nèi)人工智能產(chǎn)業(yè)鏈解構(gòu)

基礎(chǔ)技術(shù)、人工智能技術(shù)和人工智能應(yīng)用構(gòu)成了人工智能產(chǎn)業(yè)鏈的三個核心環(huán)節(jié),我們將主要從這三個方面對國內(nèi)人工智能產(chǎn)業(yè)進(jìn)行梳理,并對其中的人工智能應(yīng)用進(jìn)行重點(diǎn)解構(gòu)。

人工智能的基礎(chǔ)技術(shù)主要依賴于大數(shù)據(jù)管理和云計算技術(shù),經(jīng)過近幾年的發(fā)展,國內(nèi)大數(shù)據(jù)管理和云計算技術(shù)已從一個嶄新的領(lǐng)域逐步轉(zhuǎn)變?yōu)榇蟊娀?wù)的基礎(chǔ)平臺。而依據(jù)服務(wù)性質(zhì)的不同,這些平臺主要集中于三個服務(wù)層面,即基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)?;A(chǔ)技術(shù)提供平臺為人工智能技術(shù)的實(shí)現(xiàn)和人工智能應(yīng)用的落地提供基礎(chǔ)的后臺保障,也是一切人工智能技術(shù)和應(yīng)用實(shí)現(xiàn)的前提。

對于許多中小型企業(yè)來說,SaaS 是采用先進(jìn)技術(shù)的最好途徑,它消除了企業(yè)購買、構(gòu)建和維護(hù)基礎(chǔ)設(shè)施和應(yīng)用程序的需要;而 IaaS通過三種不同形態(tài)服務(wù)的提供(公有云、私有云和混合云)可以更快地開發(fā)應(yīng)用程序和服務(wù),縮短開發(fā)和測試周期;作為 SaaS 和 IaaS 中間服務(wù)的 PaaS 則為二者的實(shí)現(xiàn)提供了云環(huán)境中的應(yīng)用基礎(chǔ)設(shè)施服務(wù)。

人工智能技術(shù)平臺

與基礎(chǔ)技術(shù)提供平臺不同,人工智能技術(shù)平臺主要專注于機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互三項(xiàng)與人工智能應(yīng)用密切相關(guān)的技術(shù),所涉及的領(lǐng)域包括機(jī)器視覺、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別、掌紋識別、專家系統(tǒng)、自動規(guī)劃、智能搜索、定理證明、博弈、自動程序設(shè)計、智能控制、機(jī)器人學(xué)習(xí)、語言和圖像理解和遺傳編程等。

機(jī)器學(xué)習(xí):通俗的說就是讓機(jī)器自己去學(xué)習(xí),然后通過學(xué)習(xí)到的知識來指導(dǎo)進(jìn)一步的判斷。我們用大量的標(biāo)簽樣本數(shù)據(jù)來讓計算機(jī)進(jìn)行運(yùn)算并設(shè)計懲罰函數(shù),通過不斷的迭代,機(jī)器就學(xué)會了怎樣進(jìn)行分類,使得懲罰最小。這些學(xué)到的分類規(guī)則可以進(jìn)行預(yù)測等活動,具體應(yīng)用覆蓋了從通用人工智能應(yīng)用到專用人工智能應(yīng)用的大多數(shù)領(lǐng)域,如:計算機(jī)視覺、自然語言處理、生物特征識別、證券市場分析和DNA 測序等。

模式識別:模式識別就是通過計算機(jī)用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀,它偏重于對信號、圖像、語音、文字、指紋等非直觀數(shù)據(jù)方面的處理,如語音識別,人臉識別等,通過提取出相關(guān)的特征來實(shí)現(xiàn)一定的目標(biāo)。文字識別、語音識別、指紋識別和圖像識別等都屬于模式識別的場景應(yīng)用。

人機(jī)交互:人機(jī)交互是一門研究系統(tǒng)與用戶之間交互關(guān)系的學(xué)問。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計算機(jī)化的系統(tǒng)和軟件。在應(yīng)用層面,它既包括人與系統(tǒng)的語音交互,也包含了人與機(jī)器人實(shí)體的物理交互。

而在國內(nèi),人工智能技術(shù)平臺在應(yīng)用層面主要聚焦于計算機(jī)視覺、語音識別和語言技術(shù)處理領(lǐng)域,其中的代表企業(yè)包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應(yīng)用

人工智能應(yīng)用涉及到專用應(yīng)用和通用應(yīng)用兩個方面,這也是機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互這三項(xiàng)人工智能技術(shù)的落地實(shí)現(xiàn)形式。其中,專用領(lǐng)域的應(yīng)用涵蓋了目前國內(nèi)人工智能應(yīng)用的大多數(shù)應(yīng)用,包括各領(lǐng)域的人臉和語音識別以及服務(wù)型機(jī)器人等方面;而通用型則側(cè)重于金融、醫(yī)療、智能家居等領(lǐng)域的通用解決方案,目前國內(nèi)人工智能應(yīng)用正處于由專業(yè)應(yīng)用向通用應(yīng)用過度的發(fā)展階段。

(1)計算機(jī)視覺在國內(nèi)計算機(jī)視覺領(lǐng)域,動靜態(tài)圖像識別和人臉識別是主要研究方向

圖像識別:是計算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。識別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。

人臉識別:是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。

目前,由于動態(tài)檢測與識別的技術(shù)門檻限制,靜態(tài)圖像識別與人臉識別的研究暫時處于領(lǐng)先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數(shù)據(jù)整合的互聯(lián)網(wǎng)公司,也有三星中國技術(shù)研究院、微軟亞洲研究院、Intel中國研究院這類的傳統(tǒng)硬件與技術(shù)服務(wù)商;同時,類似于 Face++ 和FaceID 這類的新興技術(shù)公司也在各自專業(yè)技術(shù)和識別準(zhǔn)確率上取得了不錯的突破。

而在難度最大的動態(tài)視覺檢測領(lǐng)域,格靈深瞳、東方網(wǎng)力和 Video++ 等企業(yè)的著力點(diǎn)主要在企業(yè)和家庭安防,在一些常見的應(yīng)用場景也與人臉識別技術(shù)聯(lián)動使用。

(2)語音/語義識別

語音識別的關(guān)鍵基于大量樣本數(shù)據(jù)的識別處理,因此,國內(nèi)大多數(shù)語音識別技術(shù)商都在平臺化的方向上發(fā)力,希望通過不同平臺以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識別準(zhǔn)確率。

在通用識別率上,各企業(yè)的成績基本維持在 95% 左右,真正的差異化在于對垂直領(lǐng)域的定制化開發(fā)。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術(shù)、數(shù)據(jù)積累占據(jù)在市場前列的位置,并且通過軟硬件服務(wù)的開發(fā)不斷進(jìn)化著自身的服務(wù)能力;此外,在科大訊飛之后國內(nèi)第二家語音識別公有云的云知聲在各項(xiàng)通用語音服務(wù)技術(shù)的提供上也占據(jù)著不小的市場空間。值得注意的是,不少機(jī)器人和通用硬件制造商在語音、語義的識別上也取得了不錯的進(jìn)展,例如智臻智能推出的小 i 機(jī)器人的語義識別、圖靈機(jī)器人的個性化語音助手機(jī)器人和服務(wù)、被 Google 投資的出門問問的軟硬件服務(wù)。

(3)智能機(jī)器人

由于工業(yè)發(fā)展和智能化生活的需要,目前國內(nèi)智能機(jī)器人行業(yè)的研發(fā)主要集中于家庭機(jī)器人、工業(yè)企業(yè)服務(wù)和智能助手三個方面其中,工業(yè)及企業(yè)服務(wù)類的機(jī)器人研發(fā)企業(yè)依托政策背景和市場需要處于較為發(fā)達(dá)的發(fā)展階段,代表性企業(yè)包括依托中科院沈陽自動化研究所的新松機(jī)器人、聚焦智能醫(yī)療領(lǐng)域的博實(shí)股份,以及大疆、優(yōu)愛寶機(jī)器人、Slamtec 這類專注工業(yè)生產(chǎn)和企業(yè)服務(wù)的智能機(jī)器人公司。在以上三個分類中,從事家庭機(jī)器人和智能助手的企業(yè)占據(jù)著絕大多數(shù)比例,涉及到的國內(nèi)企業(yè)近 300 家。

(4)智能家居

與家庭機(jī)器人不同,智能家居和物聯(lián)企業(yè)的主要著力點(diǎn)在于智能設(shè)備和智能中控兩個方面。在這其中,以海爾和美的為代表的傳統(tǒng)家電企業(yè)依托自身渠道、技術(shù)和配套產(chǎn)品優(yōu)勢建立起了實(shí)體化智能家居產(chǎn)品生態(tài). 而以阿里、騰訊、京東、小米和樂視等互聯(lián)網(wǎng)企業(yè)為代表的公司則通過各自平臺內(nèi)的數(shù)據(jù)和終端資源提供不同的軟硬件服務(wù)。

值得關(guān)注的是,科沃斯、broadlink、感居物聯(lián)、風(fēng)向標(biāo)科技、歐瑞博、物聯(lián)傳感和華為等技術(shù)解決方案商在通用硬件和技術(shù)、系統(tǒng)級解決方案上已成為諸多智能家居和物聯(lián)企業(yè)的合作伙伴。綜合來看,智能家居和物聯(lián)企業(yè)由于市場分類、技術(shù)種類和數(shù)據(jù)積累的不同各自提供著差異化的解決方案。在既定市場中,沒有絕對意義上的排斥競爭,各企業(yè)之間的合作融合度較強(qiáng)。

(5)智能醫(yī)療

目前國內(nèi)智能醫(yī)療領(lǐng)域的研究主要集中于醫(yī)療機(jī)器人、醫(yī)療解決方案和生命科學(xué)領(lǐng)域。由于起步較晚和技術(shù)門檻的限制,目前國內(nèi)醫(yī)用機(jī)器人的研發(fā)水平和普及率相較于國際一線水平仍存在一定的差距,從事企業(yè)主要集中與手術(shù)機(jī)器人和康復(fù)機(jī)器人兩大領(lǐng)域,以新松機(jī)器人、博實(shí)股份、妙手機(jī)器人、和技創(chuàng)等企業(yè)為代表。

在醫(yī)療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過和政府、醫(yī)療機(jī)構(gòu)的合作,為腦科學(xué)、疾病防治與醫(yī)療信息數(shù)據(jù)等領(lǐng)域提供智能解決方案。而在生命科學(xué)領(lǐng)域,研究的著眼點(diǎn)在以基因和細(xì)胞檢測為代表的前沿研究領(lǐng)域。

綜合來看,國內(nèi)人工智能產(chǎn)業(yè)鏈的基礎(chǔ)技術(shù)鏈條已經(jīng)構(gòu)建成熟,人工智能技術(shù)和應(yīng)用則集中在人臉和圖像識別、語音助手、智能生活等專用領(lǐng)域的場景化解決方案上。就趨勢來看,未來國內(nèi)人工智能領(lǐng)域的差異化競爭和突破將主要集中在人工智能相關(guān)技術(shù)的突破和應(yīng)用場景升級兩個層面。

未來國內(nèi)人工智能行業(yè)發(fā)展的五大趨勢

(1)機(jī)器學(xué)習(xí)與場景應(yīng)用將迎來下一輪爆發(fā)

根據(jù) Venture Scanner 的統(tǒng)計,截至 2015 年 9 月,全球人工智能領(lǐng)域獲得投資的公司中,按照平均融資額度排名的五大業(yè)務(wù)依次是:機(jī)器學(xué)習(xí)(應(yīng)用類)、智能機(jī)器人、計算機(jī)視覺(研發(fā)類)、機(jī)器學(xué)習(xí)(研發(fā)類)和視頻內(nèi)容識別等。

自 2009 年以來,人工智能已經(jīng)吸引了超過 170 億美元的投資。過去四年間,人工智能領(lǐng)域的民間投資以平均每年 62% 的增長速率增加,這一速率預(yù)計還會持續(xù)下去。而在 2015 年,全球人工智能領(lǐng)域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競爭領(lǐng)域仍處于落后位置。

目前中國地區(qū)人工智能領(lǐng)域獲得投資最多的五大細(xì)分領(lǐng)域是計算機(jī)視覺(研發(fā)類)、自然語言處理、私人虛擬助理、智能機(jī)器人和語音識別。從投資領(lǐng)域和趨勢來看,未來國內(nèi)人工智能行業(yè)的資本將主要涌向機(jī)器學(xué)習(xí)與場景應(yīng)用兩大方向。

(2)專用領(lǐng)域的智能化仍是發(fā)展核心

基于 GPU(圖形處理器)計算速度(每半年性能增加一倍)和基礎(chǔ)技術(shù)平臺的飛速發(fā)展,企業(yè)對于人工智能神經(jīng)網(wǎng)絡(luò)的構(gòu)建取得了前所未有的突破。但是,由于人工智能各領(lǐng)域技術(shù)和算法的復(fù)雜性,未來 20 年內(nèi)人工智能的應(yīng)用仍將集中于人臉和圖像識別、語音助手和智能家居等專用領(lǐng)域。

通過上述產(chǎn)業(yè)鏈環(huán)節(jié)構(gòu)成和投資分類可以看出,優(yōu)勢企業(yè)的核心競爭力主要集中于特定領(lǐng)域的專用技術(shù)研發(fā);其中,計算機(jī)視覺和語音識別領(lǐng)域的研發(fā)和應(yīng)用已處于國際一流水平,專業(yè)應(yīng)用機(jī)器人的研發(fā)也有望近 10 年內(nèi)迎來突破性發(fā)展??梢灶A(yù)見的是,在由專業(yè)領(lǐng)域向通用領(lǐng)域過渡的過程中,自然語言處理與計算機(jī)視覺兩個方向?qū)蔀槿斯ぶ悄芡ㄓ脩?yīng)用最大的兩個突破口。

(3)產(chǎn)業(yè)分工日漸明晰,企業(yè)合作大于競爭

隨著專用領(lǐng)域應(yīng)用開發(fā)的成熟和差異化技術(shù)門檻的存在,國內(nèi)人工智能產(chǎn)業(yè)將逐漸分化為底層基礎(chǔ)構(gòu)建、通用場景應(yīng)用和專用應(yīng)用研發(fā)三個方向。

在底層基礎(chǔ)構(gòu)建方面,騰訊、阿里巴巴、百度、華為等企業(yè)依托自身數(shù)據(jù)、算法、技術(shù)和服務(wù)器優(yōu)勢為行業(yè)鏈條的各公司提供基礎(chǔ)資源支持的同時,也會將自身優(yōu)勢轉(zhuǎn)化為通用和專業(yè)應(yīng)用領(lǐng)域的研究,從而形成自身生態(tài)內(nèi)的人工智能產(chǎn)業(yè)鏈閉環(huán)。

在通用場景應(yīng)用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業(yè)將主要以計算機(jī)視覺和語音識別為方向,為安防、教育和金融等領(lǐng)域提供通用解決方案。而在專用應(yīng)用研發(fā)方面則集中了大部分硬件和創(chuàng)業(yè)企業(yè),這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問問、linkface 和優(yōu)必選這類的差異化應(yīng)用提供商。

總的來說,由通用領(lǐng)域向?qū)I(yè)領(lǐng)域的進(jìn)化離不開產(chǎn)業(yè)鏈條各核心環(huán)節(jié)企業(yè)的相互配合,專用領(lǐng)域的競爭盡管存在,但各分工層級間的協(xié)作互通已成為多數(shù)企業(yè)的共識。

(4)系統(tǒng)級開源將成為常態(tài)

任何一個人工智能研究分支都涉及到異常龐大的代碼計算,加上漏洞排查與跨領(lǐng)域交叉,任何一家企業(yè)都無法做到在封閉環(huán)境內(nèi)取得階段性突破的可能??梢钥吹降内厔菔牵珿oogle、微軟、Facebook 和雅虎等視人工智能為未來核心競爭力的頂級企業(yè)都先后開放了自身的人工智能系統(tǒng)。

需要明確的一點(diǎn)是,開源并不代表核心技術(shù)和算法的完全出讓,底層系統(tǒng)的開源將會讓更多企業(yè)從不同維度參與到人工智能相關(guān)領(lǐng)域的研發(fā),這為行業(yè)層面新產(chǎn)品的快速迭代和共同試錯提供了一個良性且規(guī)范化的共生平臺。于開放企業(yè)而言,這也確保了它們與行業(yè)最新前沿技術(shù)的同步。

(5)算法突破將拉開競爭差距

作為人工智能實(shí)現(xiàn)的核心,算法將成為未來國內(nèi)人工智能行業(yè)最大的競爭門檻。以 Google 為例,Google 旗下的搜索算法實(shí)驗(yàn)室每天都要進(jìn)行超過 200 次的改進(jìn),以完成由關(guān)鍵字匹配到知識圖譜、語義搜索的算法創(chuàng)新。

在未來競爭的重點(diǎn)機(jī)器學(xué)習(xí)領(lǐng)域,監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)三個方面算法的競爭將進(jìn)入白熱化階段。而正是算法層面的突破造就了騰訊優(yōu)圖、科大訊飛和格靈深瞳等企業(yè)在圖像識別和計算機(jī)視覺領(lǐng)域取得了突破性進(jìn)展和國際一線的技術(shù)水平。

但就目前國內(nèi)人工智能算法的總體發(fā)展而言,工程學(xué)算法雖已取得階段性突破,但基于認(rèn)知層面的算法水平還亟待提高,這也是未來競爭的核心領(lǐng)域。

總的來看,雖然基礎(chǔ)技術(shù)的成熟帶來了存儲容量和機(jī)器學(xué)習(xí)等人工智能技術(shù)的提升,但由于現(xiàn)階段運(yùn)算能力以及大規(guī)模 CPU 和GPU 并行解決方案的局限,目前國內(nèi)人工智能的發(fā)展主要集中于計算機(jī)視覺、語音識別、智能生活等方向上。

雖然專用化領(lǐng)域的場景應(yīng)用仍是目前研發(fā)和投資的核心,但隨著技術(shù)、數(shù)據(jù)的積累演化以及超算平臺的應(yīng)用,由專用化領(lǐng)域的場景應(yīng)用向語音、視覺等領(lǐng)域的通用化解決方案應(yīng)該在未來 20 年內(nèi)成為發(fā)展的主流。

第4篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);視線追蹤;應(yīng)用

增強(qiáng)現(xiàn)實(shí)(Augmented Reality簡稱AR)技術(shù)是近年來的一個研究熱點(diǎn),有著廣泛的應(yīng)用前景。它是對現(xiàn)實(shí)世界的補(bǔ)充,使得虛擬物體從感官上成為周圍真實(shí)環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(shí)(Virtual Reality簡稱VR)不同,增強(qiáng)現(xiàn)實(shí)只是實(shí)現(xiàn)對現(xiàn)實(shí)環(huán)境的增強(qiáng),加深了對現(xiàn)實(shí)環(huán)境的感受。在實(shí)際的AR體驗(yàn)中,因?yàn)槿说挠^察視線會不斷地變化,AR系統(tǒng)需要實(shí)時的根據(jù)用戶的視場重新建立位置坐標(biāo)系,進(jìn)行追蹤。而視線追蹤技術(shù)就是實(shí)時地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來確定虛擬物體在真實(shí)空間坐標(biāo)中的位置,并將它實(shí)時地顯示在顯示器中的正確位置。

一、視線追蹤技術(shù)及其特點(diǎn)

(一)視線追蹤技術(shù)概述。

視線追蹤也稱為眼動追蹤,它被認(rèn)為是研究視覺信息加工的有效手段。利用專用設(shè)備來記錄學(xué)習(xí)者的眼球運(yùn)動(Eve-Movement,簡稱眼動)情況,可以作為分析學(xué)習(xí)者內(nèi)部心理活動情況的依據(jù)。關(guān)于視線追蹤技術(shù)的研究己有較長歷史,目前它己在多個領(lǐng)域得到廣泛應(yīng)用。例如用于圖片廣告研究(網(wǎng)頁評估、設(shè)計評估等)、動態(tài)分析(航空航天、體育運(yùn)動、汽車、飛機(jī)駕駛等)、產(chǎn)品測試(可用性測試)、場景研究(商場購物、店鋪裝演、家居環(huán)境等)和人機(jī)交互等多個領(lǐng)域。此外,視線追蹤在智能計算機(jī)、智能家電、虛擬現(xiàn)實(shí)和數(shù)字游戲等領(lǐng)域也有很好的應(yīng)用前景。

在眼動實(shí)驗(yàn)研究中,當(dāng)被試對視覺信息進(jìn)行提取時,其注視時間、注視次數(shù)、注視點(diǎn)序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過對被試在學(xué)習(xí)過程中的實(shí)時眼動信息進(jìn)行觀測,可用于分析和引導(dǎo)其學(xué)習(xí)的依據(jù)。眼動模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運(yùn)動(pursuit movement)。其中,持續(xù)一段時間、相對穩(wěn)定的眼球運(yùn)動稱為注視;眼球快速運(yùn)動時導(dǎo)致視覺區(qū)域的聚焦點(diǎn)產(chǎn)生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個緩慢運(yùn)動的目標(biāo),則稱為追隨運(yùn)動。通過分析眼動模式和相關(guān)參數(shù),可以獲得很多重要的信息。例如,眼跳速度會隨著疲倦程度的增加而降低,而隨著學(xué)習(xí)任務(wù)難度的增加而增加;眨眼速度和眼睛睜開程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來確定學(xué)習(xí)者的學(xué)習(xí)精神狀態(tài),或?qū)ζ鋵W(xué)習(xí)過程進(jìn)行分析,從而采取相應(yīng)的學(xué)習(xí)策略或干預(yù)措施。

(二)視線追蹤系統(tǒng)的類型及其特點(diǎn)。

人眼的注視點(diǎn)主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點(diǎn)的精確位置。國內(nèi)外將視覺跟蹤技術(shù)按照借助的媒介分為硬件和軟件兩種。以硬件為基礎(chǔ)的視線跟蹤的基本工作原理是利用圖像處理技術(shù),通過攝像機(jī)攝入瞳孔反射的紅外線記錄視線變化,達(dá)到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機(jī),這種情形用戶使用較不舒適。通過軟件實(shí)現(xiàn)的視線跟蹤方法,對用戶沒有干擾,首先利用攝像機(jī)獲取頭部、臉部或眼睛圖像,再經(jīng)過軟件分析對視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。

人與計算機(jī)交互是研究人與計算機(jī)之間溝通的技術(shù),將視線跟蹤、語音識別、手勢輸入、感覺反饋等引入人機(jī)交互,提高了交互的自然性和高效性。視線追蹤技術(shù)同樣引發(fā)了人機(jī)交互系統(tǒng)的改革,鼠標(biāo)、觸控板的消失,及通過追蹤人眼視線,用眼神來操作電腦、輸入文字、玩游戲。

二、視線追蹤技術(shù)在AR增強(qiáng)現(xiàn)實(shí)研究中的應(yīng)用

(一)顯示技術(shù)。

AR的簡單定義就是將計算機(jī)生成的虛擬數(shù)字信息疊加到現(xiàn)實(shí)的生活場景中。這個“疊加”是需要通過顯示設(shè)備作為中介來實(shí)現(xiàn)。

增強(qiáng)現(xiàn)實(shí)系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設(shè)備。目前,一般的增強(qiáng)現(xiàn)實(shí)系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個基本環(huán)節(jié)構(gòu)成:虛擬信息顯示通道、真實(shí)環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實(shí)系統(tǒng)所用的浸沒式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據(jù)其中真實(shí)環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學(xué)原理的光學(xué)透視式頭盔顯示器兩類。

光W透視技術(shù)是通過安裝在設(shè)備眼前的光學(xué)透鏡來呈現(xiàn)出真實(shí)和虛擬世界。首先計算機(jī)生成的虛擬信息經(jīng)過光學(xué)系統(tǒng)放大后反射后進(jìn)入視野,透過透鏡又能直接看到現(xiàn)實(shí)場景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實(shí)現(xiàn)AR的效果。視頻透視技術(shù)是借助安裝在頭顯上的攝像頭來捕捉獲取外部真實(shí)環(huán)境,計算機(jī)將數(shù)字模擬信息疊加到攝像機(jī)的視頻信號上,再將真實(shí)場景和虛擬場景進(jìn)行融合。相比較光學(xué)透視技術(shù),它的視角場更大,而且不受外界的強(qiáng)光干擾。不過一旦攝像機(jī)與用戶的視點(diǎn)不能保持完全重合,會產(chǎn)生一些偏差。

(二)跟蹤注冊技術(shù)。

基于計算機(jī)視覺的注冊技術(shù)主要是指利用計算機(jī)視覺獲取真實(shí)場景的信息后,經(jīng)過圖像處理方面的知識來識別和跟蹤定位真實(shí)場景。細(xì)分可以劃為基于傳統(tǒng)標(biāo)志的注冊算法和基于自然特征點(diǎn)無標(biāo)志注冊算法?;谟嬎銠C(jī)視覺的注冊技術(shù)的精度較高,但是對計算量非常大,而且算法復(fù)雜,對系統(tǒng)的要求非常高。

為了取長補(bǔ)短,得到更加精確的注冊結(jié)果,現(xiàn)在有結(jié)合兩種技術(shù)的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態(tài),再通過視覺法進(jìn)一步精確調(diào)整定位。一般采用的復(fù)合法有視覺與電磁跟蹤結(jié)合、視覺與慣導(dǎo)跟蹤結(jié)合、視覺與GPS跟蹤結(jié)合等。

三、結(jié)論

在國外,增強(qiáng)現(xiàn)實(shí)早已在醫(yī)學(xué)、遙操作、制造與維修、可視化與教育培訓(xùn)、娛樂、軍事訓(xùn)練等領(lǐng)域取得了成功應(yīng)用。在國內(nèi),不少單位和個人對增強(qiáng)現(xiàn)實(shí)中的關(guān)鍵技術(shù)和算法進(jìn)行了研究,并且以牙科醫(yī)學(xué)、設(shè)備維修等許多背景得到了初步應(yīng)用研究。但國內(nèi)的研究目前仍多限于實(shí)驗(yàn)階段,與國外的應(yīng)用水平還有一定距離。

目前,隨著增強(qiáng)現(xiàn)實(shí)的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實(shí)感圖形繪制、調(diào)節(jié)現(xiàn)實(shí)、基于網(wǎng)絡(luò)的增強(qiáng)現(xiàn)實(shí)和針對戶外隨身增強(qiáng)現(xiàn)實(shí)系統(tǒng)的技術(shù)等等。其中涉及到的技術(shù)包括基于圖像的繪制(IBMR)、多通道信息融合、普適計算技術(shù)、顯示設(shè)備和跟蹤設(shè)備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過程的簡化和設(shè)備成本的降低,增強(qiáng)現(xiàn)實(shí)會在越來越多的領(lǐng)域得到廣泛應(yīng)用。

參考文獻(xiàn):

[1]奚惠寧等.視線追蹤應(yīng)用技術(shù)的專利分析[J].電視技術(shù),2013(S2)。

第5篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞:車牌圖像;預(yù)處理;灰度化;二值化;邊緣增強(qiáng)

DOIDOI:10.11907/rjdk.151249

中圖分類號:TP317.4

文獻(xiàn)標(biāo)識碼:A 文章編號:16727800(2015)006018902

基金項(xiàng)目基金項(xiàng)目:江蘇省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項(xiàng)目(xcx2014052)

作者簡介作者簡介:劉凱(1992-),男,江蘇揚(yáng)州人,徐州工程學(xué)院信電工程學(xué)院學(xué)生,研究方向?yàn)橛嬎銠C(jī)軟件;羅凱耀(1994-),男,江蘇徐州人,徐州工程學(xué)院信電工程學(xué)院學(xué)生,研究方向?yàn)榫W(wǎng)絡(luò)技術(shù);姜代紅(1969-),女,江蘇徐州人,徐州工程學(xué)院信電工程學(xué)院教授,研究方向?yàn)閿?shù)據(jù)庫技術(shù)、嵌入式技術(shù)。

0 引言

汽車牌照自動識別系統(tǒng)[1]是以汽車牌照為特定目標(biāo)的專用計算機(jī)視覺系統(tǒng) ,是計算機(jī)視覺和模式識別技術(shù)在智能交通領(lǐng)域應(yīng)用的重要研究課題之一。 車輛牌照識別[2]一般由以下環(huán)節(jié):圖像獲取、圖像預(yù)處理、車牌定位、字符分割、字符識別 ,每一環(huán)節(jié)對下一環(huán)節(jié)都有很大的影響。 從采集卡獲得的原始圖像不僅包括車牌照,而且還有汽車本身以及汽車背景圖像,車牌識別的難點(diǎn)在于獲取高質(zhì)量的車牌圖像。采集車牌圖像時,會受到光照、障礙物、拍攝角度、攝像設(shè)備等的影響,圖像中會產(chǎn)生較多與車牌無關(guān)的圖像數(shù)據(jù),造成噪聲,從而影響車牌識別效果,所以需要對識別的圖像進(jìn)行預(yù)處理,去除噪聲干擾。

本文車牌圖像預(yù)處理[3]主要針對智能交通管理系統(tǒng)中的車牌識別,通過獲取車牌對車輛信息進(jìn)行采集,經(jīng)過車牌圖像灰度化、圖像增強(qiáng)、邊緣檢測、車牌定位、車牌圖像二值化及圖像傾斜校正等,為車牌圖像后續(xù)處理打下基礎(chǔ)。

1 灰度化

一般從攝像頭采集到的圖像或者計算機(jī)中存儲的圖像通常是彩色圖,彩色圖像包含著大量的色彩信息,在數(shù)字圖像[4]處理中 ,很多算法都是針對灰度圖像 ,處理的灰度級從0~255,共 256個灰度級,這樣不僅減少了存儲圖像所需的內(nèi)存,而且加快了圖像處理的速度。 因此,首先要將彩色圖像轉(zhuǎn)換成灰度圖像。彩色圖像中任一像素都有R、G、B三種不同的顏色分量,而當(dāng)圖像中每一像素值R=G=B時,表示一種灰度顏色。其中,灰度化的方法主要有以下3種。

2 二值化

二值圖像是由黑白兩種顏色構(gòu)成的圖像。目的是能夠快速將車牌字符和背景分開,通過閾值設(shè)定將灰度值小于閾值的像素直接設(shè)為0,灰度值大于閾值的像素直接設(shè)置為255,而二值化的關(guān)鍵就是找到合適的閾值T來區(qū)分對象和背景。

4 實(shí)驗(yàn)結(jié)果

本文采用手機(jī)隨機(jī)拍攝的汽車圖像,測試環(huán)境為2GHz cpu,2G內(nèi)存,操作系統(tǒng)為window 7,使用平臺為vs2005,并基于opencv開發(fā)車牌預(yù)處理功能。

當(dāng)對一副未進(jìn)行預(yù)處理或噪聲處理不當(dāng)?shù)膱D像分割時,即會出現(xiàn)如圖5的車牌定位區(qū)域過大或過小的情況,而進(jìn)行過預(yù)處理后的圖像進(jìn)行車牌定位時則如圖6所示,可見預(yù)處理對降噪起了很大的作用。

5 結(jié)語

車牌圖像本身較復(fù)雜,冗余信息較多,因此難以識別。本文探討三種預(yù)處理方法簡化圖像、消除圖像噪聲。其中灰度化減少了圖像存儲的大?。欢祷瘜D像轉(zhuǎn)化為黑白兩種顏色的圖像,使車牌和背景分離;邊緣增生使得車牌定位更加快速、準(zhǔn)確。實(shí)驗(yàn)結(jié)果表明,三種方法均達(dá)到預(yù)期效果,提高了圖像的質(zhì)量,為圖像后續(xù)分割和識別打下了基礎(chǔ)。

參考文獻(xiàn):

[1]劉海波,沈晶 ,郭聳.Visual C++ 數(shù)字圖像處理結(jié)束詳解[M].北京:機(jī)械工業(yè)出版社,2010.

[2]馮偉興,唐墨,賀波.Visual C++數(shù)字圖像模式識別技術(shù)詳解[M].北京:機(jī)械工業(yè)出版社,2010.

[3]周閱宇.汽車牌照識別系統(tǒng)研究與設(shè)計[D].長春:吉林大學(xué)論,2013.

[4]李凌.車牌圖像預(yù)處理技術(shù)研究與實(shí)現(xiàn)[J].淮北職業(yè)技術(shù)學(xué)院學(xué)報,2007(2):98100.

第6篇:計算機(jī)視覺的研究方向范文

【關(guān)鍵詞】課程 計算機(jī)視覺 圖像檢索

1.課程設(shè)置、建設(shè)與改革自述

1.1 綜合基礎(chǔ)與應(yīng)用,精選教研內(nèi)容

從專業(yè)學(xué)位教育的高層次應(yīng)用型人才培養(yǎng)目標(biāo)出發(fā),我以學(xué)生專業(yè)應(yīng)用能力的培養(yǎng)作為教研的重點(diǎn),同時,考慮到“計算機(jī)視覺”是一門數(shù)學(xué)要求較高、理論性較強(qiáng)的專業(yè)基礎(chǔ)課程。課程的基礎(chǔ)理論教研十分重要,我在規(guī)劃教案時,綜合安排基礎(chǔ)理論與應(yīng)用實(shí)踐的教研內(nèi)容。

1.2 強(qiáng)調(diào)學(xué)生應(yīng)用能力,優(yōu)化教研方法

將啟發(fā)式教研方法融入到整個教研過程中,將課堂講授的重點(diǎn)放在問題由來、概念形成、研究思路與方法上,并通過介紹人工智能與計算機(jī)視覺學(xué)科交叉中出現(xiàn)的最新研究與應(yīng)用。把新理念、新思路、新方法和新問題引入課堂,調(diào)動學(xué)生學(xué)習(xí)的積極性和主動性,拓寬他們視野和思路。

通過較為熟悉的分析,“計算機(jī)視覺”課程中的教研方法較為新穎,使他們從一開始就建立了所學(xué)理論與實(shí)際工程控制問題的聯(lián)系。

按“計算機(jī)視覺”的基礎(chǔ)理論和知識內(nèi)容分環(huán)節(jié)來實(shí)施教研,每個環(huán)節(jié)以實(shí)際工程問題開始,以理論學(xué)習(xí)為基礎(chǔ),各教研環(huán)節(jié)之間既是工程問題的系統(tǒng)化深入,也是理論知識體系的循序推進(jìn)。

按“計算機(jī)視覺”的基礎(chǔ)理論和知識內(nèi)容分環(huán)節(jié)來實(shí)施教研。每個環(huán)節(jié),以理論學(xué)習(xí)為基礎(chǔ),以提出和解決實(shí)際實(shí)驗(yàn)案例中的識別問題為結(jié)束,各教研環(huán)節(jié)之間既是三維重建問題的系統(tǒng)化深入,也是理論知識體系的循序推進(jìn)。

他們都十分贊同我以強(qiáng)調(diào)學(xué)生自主學(xué)習(xí)和應(yīng)用能力為目的的啟發(fā)式和交互式教研方法。尤其是以論文報告和答辯形式提交作業(yè)。強(qiáng)調(diào)了理論和應(yīng)用的結(jié)合。每一次的作業(yè)貫穿整個教研環(huán)節(jié),使他們對問題的發(fā)現(xiàn)、理解和解決成為一個逐漸明確、細(xì)化和深入的過程,因此。雖然作業(yè)要求較高、工作量較大,但做起來并不會感到壓力和困難。同時,他們大多之前沒有撰寫科研論文和報告的經(jīng)歷,通過作業(yè)也可以使他們在這方面的能力得到鍛煉和提高,最后考試結(jié)業(yè)。

與此同時。研究生們也暢談了他們對課程教研中一些問題的看法.研究生們十分重視專業(yè)應(yīng)用能力和實(shí)際動手能力的培養(yǎng)與提高。也非常看重扎實(shí)理論基礎(chǔ)的必要性,都認(rèn)為理論學(xué)習(xí)與專業(yè)應(yīng)用能力培養(yǎng)應(yīng)該沒有矛盾,但在有限的2年時間內(nèi),如何實(shí)現(xiàn)兩者的全面提高,他們大多存在疑慮。同時,他們也認(rèn)為目前大多數(shù)的課程教研具有明顯的理論或?qū)嵺`的偏向性,缺乏科學(xué)合理的平衡。

針對我在教研中所提出的案例和問題,學(xué)生們反映,盡管十分熟悉,但對問題的本質(zhì)和要求仍只是停留在理性認(rèn)識上。無法建立與實(shí)際對象的對應(yīng)關(guān)系。另外,他們提出,案例僅從單一課程角度講授,在有限課時內(nèi)難以從多學(xué)科的角度介紹濾波,三維重建,運(yùn)動恢復(fù),圖像檢索案例,雖然是實(shí)際科研項(xiàng)目,但課堂不可能展示整體實(shí)物,學(xué)生缺乏工業(yè)現(xiàn)場的實(shí)際感受。使得學(xué)生對案例的整體理解難以跳出課堂的思維界域。

針對此,我計劃在加強(qiáng)現(xiàn)代化教育手段方面進(jìn)行一些建設(shè)與探索,努力向?qū)W生提供信息容量大、表現(xiàn)形式豐富的綜合性輔助認(rèn)識手段??紤]到“計算機(jī)視覺”通常需要運(yùn)用計算機(jī)技術(shù)解決工程問題,我們將在以后教研中,增加計算機(jī)輔助教研的功能。如利用Matlab工具對所學(xué)內(nèi)容及實(shí)際視覺問題進(jìn)行可視化仿真演示。我們也將用虛擬儀器工具搭建案例的虛擬系統(tǒng),試圖通過這樣的虛擬系統(tǒng),向?qū)W生提供有利于啟發(fā)思維的靈活的認(rèn)識與實(shí)踐環(huán)境。增強(qiáng)學(xué)生的感性認(rèn)識;同時,盡管采用了多媒體教研。計劃在以后的教案中增加更多的現(xiàn)場視頻材料以及圖形和圖像資料,使學(xué)生更容易理解和記憶,增強(qiáng)抽象理論的可接受性。這些工作都需要我們在教研和科研工作之余投入大量的熱情和精力。

2.教研手段(課程建設(shè)中積極營造數(shù)字化、信息化環(huán)境和外語教研環(huán)境,網(wǎng)絡(luò)教研和網(wǎng)上教研資源的開發(fā)與建設(shè)情況)

2.1本課程的主要特色

體現(xiàn)機(jī)器視覺與機(jī)器聽覺融合。①機(jī)器視覺:圖像處理、圖像與視頻壓縮、模式識別和機(jī)器學(xué)習(xí)、生物特征識別、三維視覺信息處理。②機(jī)器聽覺:聽覺計算模型、語音信號處理、口語信息處理。此外還在同濟(jì)大學(xué)開設(shè)計算機(jī)視覺,和圖像處理方面課程,該課程構(gòu)成本課程基礎(chǔ), 及對大量應(yīng)用實(shí)例介紹設(shè)計方法,系統(tǒng)性能,并對結(jié)果進(jìn)行祥細(xì)分析和點(diǎn)評。學(xué)生通過聽課可以跟隨教師本人了解和掌握計算機(jī)視聽覺。充分領(lǐng)略數(shù)字技術(shù)用于語音通信這一廣闊的領(lǐng)域神奇魅力。腦、 機(jī)接口的研究有廣闊的應(yīng)用前景, 正成為腦科學(xué)、康復(fù)工程、神經(jīng)工程及人機(jī)交互( puter interface, HCI) 領(lǐng)域的一個研究熱點(diǎn)。

2.2本課程的建設(shè)總目標(biāo)和成果

以后開展圖像,圖形,語音處理,多媒體的內(nèi)容的檢索,三維景物物體的重建,自然語言理解的研究方向:視覺與聽覺的生理學(xué)和心理學(xué)基礎(chǔ),從生理與心理學(xué)的角度探索視覺與聽覺的感覺和知覺機(jī)理,為視覺與聽覺信息處理提供基本理論和方法,完成同濟(jì)大學(xué)研究生精品課程建設(shè)。以近幾年為研究生講授“計算機(jī)視覺”課程講義的電子教案為基礎(chǔ),結(jié)合開發(fā)科研項(xiàng)目,并參考相關(guān)文獻(xiàn)資料和最新動態(tài)編寫計算機(jī)視聽覺電子教案,和教材。

機(jī)器視覺:圖像處理、圖像與視頻壓縮、模式識別和機(jī)器學(xué)習(xí)、生物特征識別、三維視覺信息處理。

機(jī)器聽覺:聽覺計算模型、語音信號處理、口語信息處理、自然語言處理、智能人機(jī)交互。

2.3 本課程的建設(shè)分年度目標(biāo)和步驟

教材內(nèi)容:針孔攝像機(jī),輻射學(xué)術(shù)語;局部影調(diào)模型,點(diǎn),線和面光源,光度學(xué)體視;顏色;線性濾波器,平滑抑制噪音,邊緣檢測;紋理,用濾波器輸出表示統(tǒng)計量,紋理量,紋理合成,由紋理推斷形狀;基本的多視角幾何,立體視覺;用聚類實(shí)現(xiàn)分割;擬合直線與曲線,用最大似然率進(jìn)行擬合,魯棒性;隱變量與EM;用卡爾曼濾波來跟蹤,數(shù)據(jù)相關(guān);攝象機(jī)標(biāo)定;使用特征對應(yīng)和攝像機(jī)標(biāo)定的基于模型的視覺;使用分類器的模版匹配;基于關(guān)系的匹配;在數(shù)字圖書館中檢索圖像,基于圖像的繪制。

準(zhǔn)備離散時間語音信號處理的原理,介紹語音信號處理研究及其應(yīng)用方面的最新動態(tài),其中包括語音處理,語音時頻分析以及非線性聲學(xué)語音產(chǎn)生模型,而這些講授內(nèi)容在以往任何一本語音信號處理教科書都不曾提及,深入介紹以下內(nèi)容:語音編碼,語音增強(qiáng),語音綜合,說話人識別,語音信號恢本復(fù),動態(tài)范圍壓縮語音信號處理基礎(chǔ),語音的時域的分析語音信號頻域分析,語音信號線性預(yù)測分析,矢量量化,語音編碼,語音合成,語音增強(qiáng),說話人識別。

3.構(gòu)建研究實(shí)踐型模式,探究研究生指導(dǎo)

通過研究生指導(dǎo)模式的學(xué)習(xí),兩種指導(dǎo)方式之一是對傳統(tǒng)面對面的與基于網(wǎng)絡(luò)兩種指導(dǎo)方式的混合。師生之間定期與不定期面對面的交流對于保證研究生指導(dǎo)質(zhì)量提高有著重要關(guān)系。互聯(lián)網(wǎng)突破時空限制為高校師生提供一個開放的、共享、個性化、多維交互的教與學(xué)的平臺。我提供優(yōu)秀研究資源,學(xué)生也可以通過網(wǎng)絡(luò)共享研究資源。師生都可以Web對于優(yōu)化研究資源的共享、促進(jìn)師生之間的社會互有著重要作用使得研究生指導(dǎo)模式充分發(fā)揮面對面指導(dǎo)。研究生指導(dǎo)主要注重科研素養(yǎng)培養(yǎng)。研究生培養(yǎng)根本目標(biāo)發(fā)展能力。課程學(xué)習(xí)對于系統(tǒng)提高研究生對專業(yè)關(guān)心課程學(xué)習(xí)狀況必要,要為學(xué)生提供學(xué)習(xí)方法指導(dǎo)與建議,要鼓勵學(xué)生結(jié)合課程學(xué)習(xí)進(jìn)行相關(guān)討論。

基于自主與協(xié)作的探究性學(xué)習(xí)是研究生學(xué)習(xí)的主體地位,發(fā)揮作用。我在教研中培養(yǎng)研究生發(fā)現(xiàn)問題、分析問題、解決問題的能力正是為了支持研究目標(biāo)在于獲得親身參與研究探究體驗(yàn):培養(yǎng)“教研模式中”包括個人理解專業(yè)研究領(lǐng)域相關(guān)問題的內(nèi)涵與特征。旨在使學(xué)生能夠切實(shí)掌握專業(yè)與研究領(lǐng)域所涉及基本原理與能夠利用這些原理與方法分析確定方案實(shí)施、“know“know 是相互交織相互作用的層面,主要是為了增強(qiáng)指導(dǎo)以便根據(jù)不同層包括若干個問題常常需投人較多的精力與時間。應(yīng)該安排較長時間且要充分利用網(wǎng)絡(luò)技術(shù)平臺支持。提升研究質(zhì)量有效地避免傳統(tǒng)指導(dǎo)誤區(qū)。在指導(dǎo)時過于強(qiáng)調(diào)研究生所獲取學(xué)術(shù)成果而忽視指導(dǎo)過程體現(xiàn)在兩方面:一目標(biāo)評價標(biāo)準(zhǔn)單一往往給研究生層面:①面向研究生個體的“個別指導(dǎo)”;②面向小組集中:③自主調(diào)控評價,必須與教師、同伴、專家進(jìn)行交流、協(xié)作才有可能真正地提高效率,實(shí)現(xiàn)學(xué)習(xí)目標(biāo),培養(yǎng)學(xué)團(tuán)隊(duì)意識,其次要幫助研略,在各層面都有明確的目標(biāo)相應(yīng)指導(dǎo)內(nèi)容,并要注意這三個層面整合。使之過程得到全面發(fā)展。養(yǎng)成科學(xué)態(tài)度和科學(xué)道德?!翱蒲心芰Πl(fā)展、輕綜合素質(zhì)培養(yǎng)”,研究生導(dǎo)師不但應(yīng)該是研究生的指導(dǎo)者。指導(dǎo)教師可以按“科研項(xiàng)目一要問題一具體任務(wù)”的層次。以教師的、助學(xué)促學(xué)”盡可使每個研究生都能達(dá)到預(yù)期培養(yǎng)目標(biāo)。評價要更關(guān)注總結(jié)性評價”與“過程性評價”工具以豐富研究生指導(dǎo)過程中教研交互的教育學(xué)中社會互。傳統(tǒng)環(huán)境下的社會互往往是面對面的交互。網(wǎng)絡(luò)平臺可以利用構(gòu)建社會網(wǎng)絡(luò)支持社會交互。強(qiáng)調(diào)的研究科研成果而深層次交流方式不同指導(dǎo)目標(biāo)、不同指導(dǎo)層次整合,指導(dǎo)教師角色轉(zhuǎn)變,變革評價方式,豐富指導(dǎo)教師來促進(jìn)“自主一協(xié)作”探究學(xué)習(xí),對研究生“混、他評”與“自混評關(guān)注教研評價的?!苯萄心J较戮W(wǎng)絡(luò)技術(shù)與內(nèi)涵表現(xiàn)在:①利用技術(shù)促進(jìn)教研資源的整合,優(yōu)化教研資源管理,教研資源共享,促進(jìn)師生與教研內(nèi)容的交互;②利用Web工具,有效地整合現(xiàn)實(shí)交互空間虛擬交互空間另外還地加速或加強(qiáng)人際聯(lián)系,幫助師生了解探究式應(yīng)用實(shí)踐探索。

研究生是否發(fā)表了高水平的科研成果,研究生入學(xué)初期,以Web的應(yīng)用為核心的互聯(lián)網(wǎng)絡(luò)不但為高校師生的交流提供了新的溝通與互動方式。以獨(dú)特高校師生的思維方式生存方式發(fā)生了系列改變。也成為高校師生教研與生活中的重要信息工具為研究生指導(dǎo)提供了豐富的資源與多維立體環(huán)源。網(wǎng)絡(luò)平臺也用于共享、深化面對面交流中所總結(jié)形成相關(guān)觀點(diǎn)與資料。要求其他每位學(xué)生都至少要提一個問題所提出問題進(jìn)行進(jìn)一步的討論。了解專業(yè)研究領(lǐng)域的基本問題、核心問題與前沿問題研究生自己在調(diào)研基礎(chǔ)上提出研究進(jìn)行獨(dú)立自主的探究。所以除了關(guān)注在專業(yè)領(lǐng)域內(nèi)研究能力的發(fā)展之外還要注意教育科研能力的培養(yǎng)引導(dǎo)學(xué)關(guān)注“專業(yè)發(fā)展”。 用于規(guī)劃了解學(xué)生的已有基礎(chǔ),以幫助后期制定更為合理個別指導(dǎo)計劃:第二,通過召開定期的討論會、師生個別交流,包括兩種類型:①旨在提高新生適應(yīng)研究生學(xué)習(xí)與生活的適應(yīng)性:②面向科研任務(wù)的研究小組。面向任務(wù)方式?jīng)_擊著高校師思維方式與文化理念,非常重視網(wǎng)絡(luò)平臺研究指導(dǎo)中的應(yīng)用,建立了向團(tuán)隊(duì)公用資源平臺教研主要采用研究式教研方法, 要求研究生自學(xué)其基本原理, 然后利用實(shí)際數(shù)據(jù),由導(dǎo)師提供或從期刊文獻(xiàn)中獲取,完成數(shù)據(jù)預(yù)處理、計算、結(jié)果表達(dá)、解釋的全過程, 并以論文形式提交給教師, 同時在課堂上向大家介紹自己的研究成果。這樣做一方面提高了學(xué)生應(yīng)用知識的能力以及研究成果的文字組織和語言表述能力。 另一方面, 研究生的每篇習(xí)作就是一個很好的實(shí)例, 教師可以從中發(fā)現(xiàn)學(xué)生對知識理解的偏差, 及時予以糾正, 使學(xué)生對方法的掌握更加準(zhǔn)確和牢固。將網(wǎng)絡(luò)共享平臺中上傳所有研討記錄訓(xùn)練,將研究分個層面:①選擇專業(yè)研究內(nèi)的基本問題或重要問題或熱點(diǎn)問題對之進(jìn)行深入探究。掌握本專業(yè)領(lǐng)域基本研究方法;②以自己課體依托,在課題下設(shè)置子課根據(jù)研究與研究興趣跨年級構(gòu)建小組,每個小組負(fù)責(zé)不同的子課題與任務(wù)③鼓勵研究途徑。一年級開始參與課題研究,二年級學(xué)期要求開始提出自己一些問題或鼓勵結(jié)合確定畢業(yè)論文選題使他們在更大程度職業(yè)能力發(fā)展;推薦專業(yè)相關(guān)資料;對(共8人)進(jìn)行指導(dǎo),效果較明顯。在學(xué)習(xí)方面,24名本科生通過畢業(yè)答辯。研究生八人以學(xué)生身份公開發(fā)表學(xué)術(shù)科研論文。 他們在這方面的能力得到鍛煉和提高。

通過"混合型-探究式"研究生指導(dǎo)模式的學(xué)習(xí)實(shí)踐三個維度的"混合":對傳統(tǒng)面對面的與基于網(wǎng)絡(luò)的兩種指導(dǎo)方式的整合,對提升研究生課程學(xué)習(xí)績效、促進(jìn)研究生科研能力發(fā)展、促進(jìn)研究生職業(yè)能力發(fā)展三個指導(dǎo)目標(biāo)的整合,對個別指導(dǎo)、小組集中指導(dǎo)、團(tuán)隊(duì)集中指導(dǎo)三個指導(dǎo)層面的整合;說明了該模式中三個層面的"探究":對專業(yè)問題的探究,對專業(yè)與研究領(lǐng)域內(nèi)基本原理的探究,對綜合科研任務(wù)的探究;同時介紹了在實(shí)踐層面應(yīng)用"混合型-探究式"研究生指導(dǎo)模式的實(shí)際效果。以重點(diǎn)學(xué)科為依托,吸取國內(nèi)外大學(xué)研究生培養(yǎng)經(jīng)驗(yàn),對創(chuàng)新型研究生培養(yǎng)模式方法進(jìn)行探索,在研究生培養(yǎng)模式改革中,提出“四個轉(zhuǎn)變”的指導(dǎo)思想,即變“單人指導(dǎo)”為“團(tuán)隊(duì)指導(dǎo)”,變“單一培養(yǎng)模式”為“多元培養(yǎng)模式”,變“以教師為中心”為“以學(xué)生為中心”,變“面向培養(yǎng)結(jié)果”為“面向培養(yǎng)過程”。形成以研究生為中心的培養(yǎng)模式,突出研究生探索精神、科學(xué)思維、創(chuàng)新意識的培養(yǎng)。切實(shí) 行的措施 引導(dǎo) 究生遵守科學(xué) 道德,保持科學(xué)沖動,增強(qiáng)創(chuàng)新意識,提高科學(xué)能力。

考慮到“計算機(jī)視覺教研探究研究生指導(dǎo)”通常需要運(yùn)用計算機(jī)技術(shù)解決工程問題,我將在以后教研中,增加計算機(jī)輔助教研的功能。如利用Matlab工具對所學(xué)內(nèi)容及實(shí)際視覺問題進(jìn)行可視化仿真演示。我也將用虛擬儀器工具搭建案例的虛擬系統(tǒng),試圖通過這樣的虛擬系統(tǒng),向?qū)W生提供有利于啟發(fā)思維的靈活的認(rèn)識與實(shí)踐環(huán)境。增強(qiáng)學(xué)生的感性認(rèn)識;同時,盡管我采用了多媒體教研。我計劃在教案中增加更多的現(xiàn)場視頻材料以及圖形和圖像資料,使學(xué)生更容易理解和記憶,增強(qiáng)抽象理論的可接受性。

參考文獻(xiàn):

[1]David A.Forsyth and Jean Ponce , Computer Vision-A modern Approach

[2]賈云得.機(jī)器視覺.電子工業(yè)出版社,1999

[3]Thomas F.Quatieri離散時間語音信號-原理與應(yīng)用,電子工業(yè)出版社,2004

[4]Shapiro.L.G and stockmen,G.C,計算機(jī)視覺.北京-機(jī)檻工業(yè)部,2001

[5]Haralick,R.,1992/1993 Computer and Robot vision ,volume I and II

[6]張雄偉,陳亮等.現(xiàn)代語音處理技術(shù)及應(yīng)用.機(jī)械工業(yè)出版社,2003

[7]Thomas F.Quatieri離散時間語音信號-原理與應(yīng)用,電子工業(yè)出版社,2004

[8]鄭燕林等“混合型-探究式”研究生指導(dǎo)模式的構(gòu)建與實(shí)踐,學(xué)位與研究生教育,2010

第7篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞:嵌入式;GUI;QT;OpenCV

中圖分類號:TP368.1

1 目前主流的嵌入式GUI

GUI技術(shù)是嵌入式的關(guān)鍵技術(shù)之一,其直接關(guān)系到產(chǎn)品的界面友好性程度,最終影響到產(chǎn)品的競爭力。

目前主流的嵌入式GUI主要有以下幾種:

Microwindows的體系結(jié)構(gòu)由上至下,分別為API層、圖形引擎層、驅(qū)動層、硬件層,用戶可以根據(jù)具體的應(yīng)用需求來實(shí)現(xiàn)每一個層。

MiniGUI的實(shí)現(xiàn)主要依賴于標(biāo)準(zhǔn)C的庫函數(shù),它可以任意在支持標(biāo)準(zhǔn)C的環(huán)境上運(yùn)行,MiniGUI很小巧但也很高效。MiniGUI主要應(yīng)用在一些中低端設(shè)備中。

2 QT的搭建

由于QT具有跨平臺的特性,所以一般開發(fā)可以在windows下開發(fā),再移植到Linux中,本文重點(diǎn)介紹QT在Windows下的使用。

QT的開發(fā)環(huán)境包括以下幾部分:QT的GUI庫,QT creator,windows版本還包含編譯器,可以是Microsoft visual stdio c++,還可以是MinGW,本文中使用的是MinGW。

搭建QT開發(fā)環(huán)境包括以下幾部分:(1)下載安裝MinGW編譯器,該編譯器支持Gcc和G++。(2)下載安裝qt-creator-win-opensource。(3)為QT、MinGW、qmake添加環(huán)境變量。

3 OpenCV的安裝配置

3.1 OpenCV簡介。QT中本身也支持視頻處理,但功能十分有限,如果需要更強(qiáng)大的視頻處理功能,需要引入OpenCV(open source computer vision library),即開源計算機(jī)視覺庫。

3.2 OpenCV的優(yōu)點(diǎn):(1)開源。OpenCV完全遵循BSD協(xié)議(五大開源許可協(xié)議之一),具有極高的開放性。(2)跨平臺。OpenCV支持Windows、Linux,Mac,可以輕松實(shí)現(xiàn)平臺之間的移植。(3)效率高,速度快。由于OpenCV采用C++實(shí)現(xiàn),并且算法經(jīng)過優(yōu)化,效率有較大程度的提高,執(zhí)行的速度也比較快。(4)涵蓋面廣、功能強(qiáng)大。OpenCV主要有13個模塊構(gòu)成,涵蓋了計算機(jī)視覺的各個方面,在相關(guān)方面基本都應(yīng)用。

3.3 OpenCV的安裝配置:(1)前提是QT已經(jīng)安裝配置成功。(2)下載OpenCV。下載OpenCV后,解壓即可,實(shí)際上并不需要安裝,注意解壓路徑不能有空格,否則會出錯。(3)下載安裝CMake。OpenCV只是一個庫,并不能直接拿來使用,需要借助CMake將其編譯后才可以使用。(4)配置CMake參數(shù),進(jìn)行編譯。使用CMake,主要是設(shè)定OpenCV的輸入路徑、輸出路徑、MinGW的位置等相關(guān)信息。運(yùn)行CMake之后,需要在命令提示符下進(jìn)入輸出路徑,然后執(zhí)行mingw32-make命令,由MinGW對OpenCV進(jìn)行編譯,其間會耗費(fèi)一定的時間。此步驟成功后,再執(zhí)行mingw32-make install命令,會把編譯好的所有文放到這個文件夾下,這個就是將來開發(fā)要用到的OpenCV全部文件。(5)將上一步驟得到的install目錄bin文件夾,添加到系統(tǒng)的環(huán)境變量中,重新啟動電腦。(6)在QT工程中,打開.pro工程屬性文件,將OpenCV添加到INCLUDEPATH和LIBS中后,就可以在QT開發(fā)中使用OpenCV計算機(jī)視覺庫了。

4 在QT中通過OpenCV實(shí)現(xiàn)視頻處理

4.1 實(shí)現(xiàn)的基本原理。在視頻處理中主要用到OpenCV的highgui模塊,該模塊,前面已說過,主要完成視頻捕捉、編碼,圖片處理等相關(guān)功能。

highgui模塊中已經(jīng)封裝了視頻、圖像、窗口的所有操作。

首先,利用OpenCV建立窗口,然后打開攝像頭,獲取攝像頭中的幀,然后申請IplImage類型的指針,將幀放入指針指向的內(nèi)存空間,此時的只是靜止的圖像而已,為了符合我們?nèi)搜鄣挠^看習(xí)慣,再通過循環(huán),達(dá)到每秒鐘顯示30次左右的效果,與放電影的原理基本一樣,最終顯示到窗口,看到就是動態(tài)的視頻效果,使用完之后釋放內(nèi)存,釋放窗口即可。

5 總結(jié)

嵌入式技術(shù)在當(dāng)前的大環(huán)境下得到了快速發(fā)展,隨著硬件設(shè)備性能的不斷提高,高性能的嵌入式程序會越來越廣泛地被使用,而QT恰好與這個大環(huán)境相吻合,同時OpenCV的出現(xiàn)對QT也是一個促進(jìn),QT+OpenCV模式在未來嵌入式視頻處理中會廣泛地被使用。

參考文獻(xiàn):

[1]彭均鍵,史步海,劉洋.基于Qt的嵌入式GUI開發(fā)平臺的搭建[J].微型電腦應(yīng)用,2010,2.

[2]郭暉,陳光.基于OpenCV的視頻圖像處理應(yīng)用研究[J].微型機(jī)與應(yīng)用,2010,21.

[3]秦小文,溫志芳,喬維維.基于OpenCV的圖像處理[J].電子測試,2011-7.

[4]許生模,余敏.嵌入式QT的內(nèi)核分析與優(yōu)化[J].微計算機(jī)信息,2007-10.

[5]陳峰,郭爽,趙欣.基于QT和嵌入式的視頻監(jiān)控系統(tǒng)[J].通信技術(shù),2011,10.

第8篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞:OpenCV;圖像處理;C++

中圖分類號:TP391.41

1 圖像的加載

圖像的加載過程為:調(diào)用攝像頭;逐幀加載圖像;圖像的顯示。

調(diào)用攝像頭的過程,我們用下面這段程序來實(shí)現(xiàn):

攝像頭啟動后,自動采集圖像,不同類型的圖像內(nèi)部結(jié)構(gòu)不同,需要根據(jù)圖像的結(jié)構(gòu)采用不同的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。在窗口中顯示出加載的圖像,主要由函數(shù)cvNamedWindow()來實(shí)現(xiàn),這個函數(shù)也是一個高層調(diào)用接口,由HighGUI庫提供,它用于在屏幕上創(chuàng)建一個窗口,將被顯示的圖像包含于該窗口中。我們用下面這段程序來實(shí)現(xiàn)加載和顯示圖像的過程:

2 圖像的預(yù)處理

2.1 光線補(bǔ)償。在攝像頭的捕捉過程中,可能會存在光線不平衡,這影響了對特征的提取。

考慮到背景模型對光線變化比較敏感。在有室外光照、光潔地板和金屬設(shè)備的室內(nèi)場景中,需要對攝像頭捕捉的圖像序列進(jìn)行光線補(bǔ)償。

2.2 平滑處理。圖像在采集、傳輸、處理和保存的過程中,必然會受到隨機(jī)擾動和各種限制的影響,由此將產(chǎn)生各種噪聲和失真,因此需要對圖像進(jìn)行平滑處理。

OpenCV中提供了圖像濾波函數(shù):

2.3 灰度化。彩色圖像由于其信息容量比灰度圖像大,因此處理難度大、速度慢,而且在識別一般圖像的過程中,灰度圖像所含的信息量已經(jīng)足夠,因此先將彩色圖像轉(zhuǎn)換為灰度圖像?;叶葓D像與黑白單色圖像的區(qū)別是灰度圖像加上了顏色深度的概念,單純的看,灰度圖也是黑白的,就像黑白電視顯示的圖像一樣,但是點(diǎn)與點(diǎn)之間黑的程度是不一樣的,這就是深度即灰度,一般灰度圖像分為256 級。設(shè)彩色圖像某像素點(diǎn)顏色值為,根據(jù)

光學(xué)原理分解為紅色(r),綠色(g),藍(lán)色(b)三個分量,則灰度值為:

將彩色圖像中的所有的點(diǎn)經(jīng)過上式轉(zhuǎn)變后,該圖像轉(zhuǎn)變成灰度圖像,各像素點(diǎn)的灰度值在(0-255)范圍內(nèi),其中0為黑色,255 為白色。

這個轉(zhuǎn)換過程可以用OpenCV中的函數(shù)來實(shí)現(xiàn),這個函數(shù)的原型為:

2.4 二值化(閾值化)。圖像閾值化分割是一種最常用,同時也是最簡單的圖像分割方法,它特別適用于目標(biāo)和背景占據(jù)不同灰度級范圍的圖像。它不僅可以極大地壓縮數(shù)據(jù)量, 而且也大大簡化了分析和處理步驟。因此,在很多情況下,它是進(jìn)行圖像分析、特征提取與模式識別之前的必要的圖像預(yù)處理過程。圖像閾值化的目的是按照灰度級,對像素集合進(jìn)行一個劃分,得到的每個子集形成一個與現(xiàn)實(shí)景物相對應(yīng)的區(qū)域,各個區(qū)域內(nèi)部具有一致的屬性,而相鄰區(qū)域布局有這種一致屬性。這樣的劃分可以通過從灰度級出發(fā)選取一個或多個閾值來實(shí)現(xiàn)。

最常見的閾值分割方法是固定閾值分割,OpenCV提供了這方面的函數(shù),如下所示:

3 結(jié)束語

本文介紹了基于OpenCV的圖像處理并給出了實(shí)例,利用OpenCV中的函數(shù)使圖像處理問題變得很簡單,具有很強(qiáng)的實(shí)用價值。而且OpenCV免費(fèi),源代碼公開,其必將成為圖像視頻處理領(lǐng)域的強(qiáng)有力的工具。

參考文獻(xiàn):

[1]于仕琪,劉瑞禎.學(xué)習(xí)OpenCV(中文版)[M].北京:清華大學(xué)出版社,2009.

[2]朱虹.數(shù)字圖像處理基礎(chǔ)[M].北京:北京科學(xué)出版社,2005.

[3]劉潔,馮貴玉,張汗靈.一種圖形處理和計算機(jī)視覺的開發(fā)工具[J].計算機(jī)仿真,2006(11):305-307.

[4]阮秋琦.數(shù)字圖像處理學(xué)[M].北京:電子工業(yè)出版社,2007.

第9篇:計算機(jī)視覺的研究方向范文

關(guān)鍵詞:三維點(diǎn)云;配準(zhǔn);迭代最近點(diǎn)

中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2012)31-7568-03

在計算機(jī)應(yīng)用領(lǐng)域,三維點(diǎn)云數(shù)據(jù)的配準(zhǔn)對解決曲線曲面匹配、圖像拼接、三維重建、計算機(jī)輔助文物復(fù)原等問題至關(guān)重要。以計算機(jī)輔助文物碎片拼接為例,在過去十年間有很多研究項(xiàng)目需要獲取文物詳細(xì)的三維表示,但是通過三維掃描設(shè)備獲取的多個掃描需要采取一定的技術(shù)恢復(fù)每個掃描的相對視點(diǎn),然后將多個掃描融合到一個最終的模型。這一過程就是三維點(diǎn)云數(shù)據(jù)的配準(zhǔn),它是獲取文物準(zhǔn)確的三維表示的關(guān)鍵步驟。1992年,Besl和Mckay提出了一種基于幾何模型的三維物體配準(zhǔn)算法——迭代最近點(diǎn)算法[1]。近年來,伴隨著三維掃描技術(shù)的不斷進(jìn)步,該算法得到了廣泛應(yīng)用,也吸引了眾多研究者的目光。許多研究者對該算法進(jìn)行了系統(tǒng)的研究,分析了該算法的特點(diǎn)與不足,提出了各種改進(jìn)算法。國外學(xué)者M(jìn)ichael Wild[2]回顧了2002年到2007年ICP算法的發(fā)展;介紹了ICP算法的流程并對幾種改進(jìn)算法做了詳細(xì)的分析和比較;最后介紹了該算法在放射療法中的應(yīng)用。近幾年,ICP算法的研究改進(jìn)以及應(yīng)用仍然是國內(nèi)外眾多學(xué)者熱衷的一個研究方向,這從發(fā)表在IEEE上的論文數(shù)量即可看出。本文詳細(xì)總結(jié)了ICP算法的基本原理,然后從數(shù)據(jù)采樣、特征點(diǎn)選取與點(diǎn)對權(quán)重、非重疊區(qū)域檢測、兼容性約束四個方面對幾種改進(jìn)算法進(jìn)行了系統(tǒng)而詳細(xì)的分析與研究。總結(jié)了這些算法的基本思想和特點(diǎn),這些工作對后期的研究將會起到重要的作用。

1 ICP算法的基本原理