前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺技術主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:增強現實;計算機視覺;三維注冊
中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9599?。?012) 19-0000-02
1 引言
隨著計算機技術的迅速發(fā)展,計算機視覺、虛擬現實技術、人工智能、計算機圖形學等技術被廣泛地研究和應用,這些技術引導著人們進入了一個信息數字化的虛擬時代。
增強現實技術(Augmented Reality,AR)作為虛擬現實技術和計算機圖形學相結合的產物,它是在通過計算機渲染生成虛擬的物體或文字信息模型的同時,對真實的場景進行標定,從而使虛擬的物體能夠被準確地放置到真實的場景中,最終通過顯示設備顯示出來,使用戶處于虛擬和現實相融合的亦真亦幻的新環(huán)境中,無法清楚地分辨出真實和虛擬。增強現實技術增強了用戶的觀感及其與真實場景之間的交互。
增強現實技術作為虛擬現實的一個重要分支,是虛擬現實技術發(fā)展過程中的產物。如圖1.1所示,該圖為Milgram提出的增強現實和虛擬現實關系的一種分類學表示方法。由圖我們可以看出,虛擬現實所創(chuàng)建出來的是一種完全虛擬的三維世界,它與真實的世界相隔離。而增強現實是以現實場景為基礎,場景中的虛擬物體隨著真實物體的變化而變化,提供給用戶的是一種復合的視覺效果,就好像這些虛擬物體真實的存在于場景中。
2 增強現實技術的應用
增強現實技術在20世紀90年代真正興起,其發(fā)展與20世紀60年代計算機圖形學的迅速發(fā)展密不可分。增強現實技術不僅擁有虛擬現實的各種優(yōu)點,同時又有其獨特的視覺增強功能,因此成為了國內外研究機構和知名大學的研究熱點,并廣泛的被應用于教育、醫(yī)療、工業(yè)、娛樂、軍事等多個領域。
2.1 教育
增強現實豐富了教育學習生活。傳統(tǒng)的書籍中只存在文字信息,通過增強現實技術,我們可以透過書籍看見文字相關的動態(tài)畫面或是影像,圖文并茂,極大的增強了學生的學習興趣。目前的魔法書系統(tǒng)就是這一技術的很好運用,用戶通過頭盔顯示器可以看到書中描述的場景,使讀者可以完全沉浸在虛實結合的環(huán)境中,提高學習興趣和效率。
2.2 醫(yī)療
增強現實技術可以幫助醫(yī)生實現可視化手術或手術培訓。準確地定位真實場景是增強現實技術的一個重要方面,在醫(yī)療中,運用增強現實技術可以進行手術定位,實時地收集病人體內的3D影像,并將其與真實的人體相結合,使得醫(yī)生可以“透視”病人體內,從而減少手術的風險,該技術對微創(chuàng)手術也有著深遠的意義。手術培訓方面,通過加入虛擬的提示注解,可以提醒醫(yī)生手術中的一些必要步驟,降低手術風險。
2.3 工業(yè)
增強現實的另一個應用是工業(yè)組裝和維修。通過增強現實技術可以顯示出各種設備零件的內部結構圖、使用說明等,方便安裝和維修。顯示的內容可以不僅僅是簡單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來,方便操作。
2.4 娛樂
電影、廣告、游戲、體育比賽轉播中,增強現實技術也得到了廣泛的運用。體育比賽中,能夠在直播現場實時地插入三維的圖形、動畫、視頻等虛擬的比賽相關信息或廣告。日常生活中,出現一種增強現實瀏覽器,它利用多種傳感器將日常需求通過實景與虛景結合后呈現在用戶面前,用戶可以通過增強現實瀏覽器看到實景的文字介紹、三維模型等,并可以搜索定位。
3 增強現實相關技術
增強現實系統(tǒng)具有虛實結合、三維注冊、實時交互三個特點。三個特點之間緊密聯系,要求在合成的場景中虛擬的物體能夠擁有真實的存在感和位置感。因此顯示技術、定位技術、虛實融合技術、用戶交互技術是實現增強現實系統(tǒng)的基礎支撐技術。
3.1 顯示技術
理想的AR系統(tǒng)的顯示器具有體積小、移動方便、圖像繪制清晰、交互自然等特點,但是目前仍不能制造出完成符合這些特點的顯示器。常用的顯示設備可以分為四類:普通液晶現實器;頭戴式顯示器;手持式顯示器;投影式顯示器。
液晶顯示器是最為常見,也最容易得到的顯示設備。但是液晶顯示器體積較大,移動不方便,限制了用戶的活動范圍。頭戴式顯示器,佩戴于用戶的頭部,這種顯示器本身提供了一路或兩路攝像機,采用視頻合成技術,為用戶提供場景的顯示。但是頭戴式顯示器在戶外長時間佩戴很不舒服,因此也不能為用戶廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進,但是也限制了用戶手部的活動。投影式顯示器能夠將場景投影到較大范圍的環(huán)境中,位置固定,適合于室內的AR系統(tǒng)。
3.2 定位技術
增強現實系統(tǒng)需要將虛擬的物體準確地放置到真實的場景中,因此定位技術顯得尤為重要。目前的定位技術主要分為兩種:一種是基于硬件的定位技術;一種是基于計算機視覺技術的定位技術。
基于硬件的定位技術一般使用硬件設備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測距儀、導航儀、機械裝置等。
基于計算機視覺的定位技術一般是從真實場景中獲得一幅或多幅圖像,根據圖像中的信息,計算出攝像機和圖形中物體的相對信息,最終恢復出三維場景的結構,從而達到定位的目的。
基于計算機視覺的定位技術主要包括以下幾種:
(1)單視圖法:在一幅圖像中找到六個以上特征點進行跟蹤,通過已知的特征點的三維坐標和其成像坐標進行定位。
(2)多視圖法:從多個角度拍攝場景,根據常用的角點檢測法,檢測多幅圖像的角點并進行匹配,從而計算出真實場景中物體的景深,最終實現定位。
(3)運動目標的序列圖像:根據序列圖像估算運動目標的各項參數。
(4)模板匹配法:從多個視角出發(fā)尋找真實圖像中的物體作為模板數字化圖像,繼而將虛擬物體疊加到真實場景。
3.3 虛實融合技術
增強現實技術中的虛擬融合主要指虛擬物體在真實場景中的配準,以及虛擬物體與真實場景的一致性。
在增強現實系統(tǒng)的實現過程中,一致性是一個關鍵性問題。虛實融合的一致性包括動態(tài)一致性和靜態(tài)一致性。其中,動態(tài)一致性通常指場景的實時繪制,跟蹤過程中虛擬物體和真實場景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實場景外觀的一致性變化等。
另一方面,為了實現很好的虛實融合效果,必須對拍攝真實場景的相機進行標定,并與繪制虛擬物體的虛擬相機參數進行匹配。攝像機標定主要是對攝像機的內外參數的確定。目前,攝像機標定技術已經較為成熟,主要可以分為三類:傳統(tǒng)的標定法,如張正友標定法;自標定法,如基于Kruppa方程的自標定法;基于主動視覺的標定法,如基于射影重建的標定法。三類標定法各有利弊,并沒有一種可以普遍適用,因此攝像機標定技術仍是一個研究重點。
3.4 用戶交互技術
人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強現實系統(tǒng)根據跟蹤定位獲得的有關真實場景的信息對虛擬物體發(fā)出指令。目前,交互技術主要使用以下三種方式:
(1)在場景中選擇一個或多個特征點作為標記點,這是增強現實系統(tǒng)中最基本的交互方式。
(2)使用計算機識別出人或物體的姿態(tài),進而交互操作。
(3)制作特殊工具,能夠通過按鍵等簡單方式觸發(fā)事件。
4 結束語
本文總結了現階段增強現實技術的應用領域,并對其涉及到的關鍵技術進行了闡述。增強現實技術作為一個多學科交叉的研究領域,必將飛速發(fā)展,更多的融入到我們的生活中。
參考文獻:
[1]紀慶革,潘志庚,李祥晨.虛擬現實在體育體育仿真中的應用綜述[J].計算機輔助設計與圖形學學報,2003,15(11):1333-1338.
[2]陳靖,王涌天,閆達遠.增強現實系統(tǒng)及其應用[J].計算機工程與應用,2001,15:72-75.
[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.
【關鍵詞】視頻跟蹤 手部識別
1 引言
計算機從誕生至今,其輸入設備從最初的機電開關,逐漸發(fā)展為打孔紙帶、磁帶,再到今天的鍵盤、鼠標和游戲手柄,向計算機輸入數據的效率越來越高,但方法的本質并未改變,都要將自然信息通過機械式方式輸入計算機。這些方式都是基于2D的圖形界面,將用戶的操作限制于特定的外部設備上,無法實現自然而隨意的人機交互。長時間使用,會使用戶感到疲憊,導致用戶體驗下降。
對于用戶來說,人的語音、手勢等可以說是最為自然、最為方便的交流手段,同時手勢在3D環(huán)境中意義明確、方向精確,是極好的人機交互手段。許多大型互聯網公司與游戲公司早就對此進行了探索。微軟,索尼,任天堂等公司有著自己研發(fā)的外部設備,如游戲手套和傳感器等,以此來捕捉并記錄手部的運動軌跡,實現特定的操作乃至體感游戲。但這類外部設備的缺陷也是很明顯的:這類設備一般為機械傳感器式或光纖傳感器式,帶有傳感器、機械部件甚至用來與主機連接的電纜等,沉重、累贅、不靈活;且通常價格昂貴、極易損壞,用戶體驗不佳;更重要的是限制于特定平臺,不具備通用性,普及度不高。
若能實現基于計算機視覺技術的手勢識別及操作系統(tǒng),不僅可以將我們的雙手從特定外部設備上解放出來,使操作更加輕松、隨意,還能獲得更好的人機交互體驗,推動“虛擬現實”的研究。目前已經有了大量的跟蹤算法和相關設別,如微軟的Kinect攝像頭及最新的Hololens頭盔已經能達到很好的效果,但都較為復雜。因此本文研究一種簡單通用的基于計算機視覺的手部跟蹤算法。
2 手部區(qū)域提取
2.1 樣本采集
為了保證研究的順利進行,首先需要采集手部樣本圖片。為保證實驗結果的準確性,樣本圖片數量最好在100張以上,并記錄不同姿態(tài),其中男性樣本和女性樣本的數量保持相等。
2.2 膚色信息分析
膚色信息近似為皮膚的顏色信息,物體表面的顏色即表面色是因光照而呈現的顏色[6]。我們采用RGB顏色模型對手部表面膚色進行分析,發(fā)現膚色處于某個范圍之內。方法如下:手動提取樣本圖像中的手部,對其進行RGB顏色分量統(tǒng)計,得到各分量直方圖。由于各分量直方圖上手部體現為一個近似波峰,所以可取波峰的半峰全寬(Full Width at Half Maxium)作為手部的膚色閾值。
根據膚色閾值提取手部,設HandSkin表示膚色閾值范圍,RGB(m, n)表示點(m, n)處的顏色信息,而bw(m, n)代表該點是否是手部,則:
2.3 模式識別
通過膚色信息初步提取手部后,可能會有孤立的局部點集出現。為此,統(tǒng)計所有互相連接的點集,提取點集對應的幾何特征,建立規(guī)則來選取符合手部的點集。
幾何特征一般包括面積、周長、重心等。而手部可以分為手掌和手指部分,手掌形狀近似于橢圓,手指為細長的柱體,因此整個手部的周長面積比會與其他物體有所區(qū)分,所以根據周長面積比將手部從背景中提取出來:
面積:指物體區(qū)域包含的像素數,用符號s表示。
周長:物體輪廓線上像素間距離之和,用符號c表示。在進行周長計算時,需根據像素間的連接方式,分別計算距離。像素間距離可分為并列連接像素與傾斜連接像素。并列有上下左右四個方向,像素間距離為1;傾斜方向有左上、左下、右上、右下,其像素間距離等于單位正方體的對角線長度。本文中先獲取二值圖像的邊緣信息,再使用8向鏈碼求周長。
周長面積比:用r表示,r = c/s。
求得所有樣本的面積周長比后,通過統(tǒng)計建立規(guī)則,并排除異常數據。設h表示點集,hand表示手部,handrule表示手部點集所必需滿足的規(guī)則,noise表示噪聲,s.t.表示滿足,則最終的手部點集為:
3 手部跟蹤
基于計算機視覺的手部跟蹤算法具體步驟:
步驟1:第一幀圖像預處理。根據上文所述方法進行第一幀的初始化。通過膚色信息和面積周長比特征提取出第一幀圖像中的手。為了方便描述手的運動軌跡,用幾何圖形來近似表示手部區(qū)域,本文選用包圍手部區(qū)域的最小橢圓來表示手部,該橢圓的中心O1表示手部中心點。
步驟2:依次掃描視頻的每一幀。對于第n幀,由于相鄰幀的時間相隔較短,手部不會有太大位移。根據上一幀手部區(qū)域的位置,設置該幀的掃描范圍。通過第2章方法,得出當前幀手部的中心點On。不斷重復算法直至視頻結束。
步驟3:描繪運動軌跡。從視頻最后一幀的中心點On開始,逆序依次連接On與On-1,直至視頻第一幀的中心點O1,得到完整的手部運動軌跡。
4 結論
本文所提出的以手部膚色信息為基礎的手部跟蹤算法,工程實現上較為簡答,算法效率高,經試驗測試,能夠較為準確地再現手部運動軌跡。同時,該種方法也具有缺點,在手部快速移動或做復雜運動時,算法所描繪的運動軌跡可能會出現斷裂,且該算法對光照敏感,在過強或過弱光照條件下,算法的準確性都會受到影響。今后的工作將繼續(xù)完善本算法,將嘗試以HSI顏色模型進行分析,考慮引入手部紋理與邊緣信息,減弱算法的光照敏感性,采用專家系統(tǒng)、智能優(yōu)化、神經網絡、特征降維等高級技術。
參考文獻
[1]俞烈彬,孟凡文.武器裝備系統(tǒng)中的人機交互新技術[J].電子世界,2013(12): 164-165.
[2]孟艷麗,郭建.二語演講中手勢功能的實證分析[J].河南科技大學學報(社會科學版),2014,32(3):62-67.
[3]劉晉鋼,劉衛(wèi)斌,劉晉霞.Kinect與Unity3D數據整合技術在體感游戲中的應用研究[J].電腦開發(fā)與應用,2014, 27(11):7-14.
[4]張蓬,王曉沖,陳建義.多自由度機械臂的虛擬現實仿真實現[J].機械設計與制造,2015(01):128-134.
[5]閆慶森,李臨生,徐曉峰,等.視頻跟蹤算法研究綜述[J].計算機科學,2013, 40(6A):204-209.
[6]奚吉,趙曉鈴,張煜東.改進的沃爾什濾波的圖像插值算法[J].計算機工程, 2010,36(22):211-213.
[7]張煜東,吳樂南,王水花.專家系統(tǒng)發(fā)展綜述[J].計算機工程與應用,2010, 46(19):43-47.
[8]王水花,張煜東,吉根林.群智能算法的理論及應用綜述[J].南京師范大學學報(工程技術版),2014,14(4):31-38.
[9]張煜東,吳樂南,韋耿.神經網絡泛化增強技術研究[J].科學技術與工程,2009(17):4997-5002.
[10]張煜東,霍元鎧,吳樂南,等.降維技術與方法綜述[J].四川兵工學報,2010, 31(10):1-7.
作者簡介
羅偉,男,江西省景德鎮(zhèn)市人。現供職于南京師范大學計算機科學與技術學院。研究方向為手勢跟蹤。
通訊作者
張煜東,男,江蘇省南京市人。博士學位。現為南京師范大學計算機科學與技術學院教授。研究方向為圖像處理。
作者單位
誕生于20世紀40年代的電子計算機是人類最偉大的發(fā)明之一。并且一直以飛快的速度發(fā)展著。進入21世紀的現代社會,計算機已經進入各個行業(yè),并成為各行業(yè)必不可少的工具。如今的計算機發(fā)展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發(fā)展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術也是應運而生。
人臉識別的論述
人臉識別是人類視覺中的一大特色,因為能對身邊的人進行識別,才不會對身邊的信息進行混淆,簡單來說,根據人臉可以對人的年齡,性別進行初步判斷。隨著計算機技術的智能化,計算機業(yè)已經通過視覺能進行人臉的識別。其中在對人臉識別的同時進行有關信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術。如今人臉識別已經應用于很多的領域,但是要人臉檢測與識別是需要基于本來已經收集和整理的信息本庫才能進行。再加上現在計算機技術雖然已經接近成熟,然而在人臉識別方面的表情傳達出什么信息還是無從下手進行編程和設計。所以,基于計算機視覺的人臉檢測與識別技術還是會有很廣的發(fā)展空間,再加上人臉識別還可以維護人們的財產安全和隱私保護,必然會引起社會各界人士的廣泛關注。
從19世紀末開始就已經有人對人臉識別進行了研究,因為當時沒有先進的科學技術做后盾,所以經過了數百年的研究仍然沒有什么顯著的進展和成果。直到20世紀90年代人臉識別才成立了自己的學科,在加上當時的科技發(fā)展水平已經達到了不錯的水平,人臉識別這個學科得到了快速的發(fā)展。如今,我國的計算機技術也已經居于世界的前列,我國也已經擁有比較完善的一套東方面孔的人臉數據庫。
人臉識別在發(fā)展過程中大概經歷了三個階段:第一階段就是對人臉特征進行整理,整理出所需要的數據庫,并且應用當時的計算機技術做出一套質量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進,有了基礎人機互交,將人臉的特征經過多維度的矢量在模型上表示出來,并也可以設計出一套人臉識別的系統(tǒng),這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現了計算機與計算機之間的互聯,多臺計算機一起完成人臉識別的過程,都人力也是一種解放。
積極踐行人臉檢測識別技術
人臉檢測識別技術是計算機實現智能化特征后的又一重要發(fā)展方向之一,它已經在世界范圍內得到了廣泛的普及與應用。人們可以通過人臉識別來進行定位,來起到保護人們財產安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權的事情,有了人臉識別讓不法分子沒有可乘之機,也應用人臉識別來對財務密碼進行聯系,起到對人們的財產有絕對的保護作用,對社會的安定何嘗不是一項有意義的發(fā)明。
人臉識別一直是計算機智能化發(fā)展過程中的一個重要領域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進行算法設計有一定的困難,所以只有通過輪廓特征來進行初步的判斷,分辯出各種器官,再根據器官來完成人臉的分布情況設計灰度模型的完成工作。
1 雙目立體視覺概述
雙目立體視覺又稱雙目視覺技術,是目前計算機視覺應用領域的重要研究內容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應用功能的不同,組成也都各不相同。
雙目立體視覺的實現原理是基于人眼的視網膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實現清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據匹配的結果,獲取同一個物體不同偏差位置的信息。最后在依據三角測量技術,根據已經獲得的這些偏差信息從而獲得這些不同點對應的距離信息,并最終獲得這些實際物體的具體坐標位置信息。
視差測距技術告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達到拍攝同一個物體的目的。根據同一個物體在兩個觀察物當中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設備、圖像預處理設備、攝像機標定設備、立體匹配設備、根據二維信息實現三維重構設備等五個重要設備。
2 雙目立體視覺技術的原理
立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術或者通過合理的觀察手段和觀察設備,就可以看到一組秩序井然的美妙圖片。
三維立體圖是一組重復的二維圖片有序的堆積積累而成,因此可以呈現出立體效果。人體觀察物體的原理大致如下:當人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當左右眼重新聚焦或者在觀察畫面的時候呈現一定的層次感,則人類的左右眼觀察到的一組重復案在經過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。
雙目立體視覺技術正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標圖像的信息,并經過一定的處理獲得三維重建的物體立體信息的技術。
雙目立體視覺在計算機技術中實現三維重建的大致流程
如下。
1)攝像機定位,并通過單片機計算得到要獲取圖像信息需要的外部的參數的大概值,并根據這些參數值設定攝像機。
2)用設定參數的攝像機拍攝目標場景的畫面,并采集這些畫面的二維圖的信息。
3)通過計算機技術實現雙目匹配,并判定采集畫面中的二維圖像中的不同點之間的對應關系。
4)在第三步中若得到兩組二維圖像的關系是稠密的時候,則生成三維視差圖。如果不是則進一步采集圖片信息。
5)根據得到的視差圖最終實現場景的三維圖形的重建。
3 雙目立體匹配技術的研究難點和未來的發(fā)展方向
盡管目前有很多學者都投身到雙目立體匹配技術的研究和開發(fā)當中,直至目前為止也解決了很多關于視覺理論當中存在的很多缺陷問題。但是視覺問題是一個復雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術的難點已經成為限制將雙目技術應用到計算機技術當中的重要瓶頸。
立體匹配的主要手段就是找到計算機采集到兩幅和多副圖片的中像素的對應關系,然后根據這些像素關系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現在以下幾個方面。
1)由于視角的問題或者觀察物體存在遮擋問題,導致采集回來的圖片信息存在盲點,這樣子更難找到圖片的匹配區(qū)域。
2)場景中的一些深度不連續(xù)的區(qū)域大都處在場景當中的邊界位置,這些位置容易出現像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。
3)場景當中的低紋理的圖片匹配特征和匹配關系較少,而且該位置的每個像素點極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結果,而這些匹配結果當中有一大部分是錯誤的。這樣子的結果勢必會導致最終的圖像匹配正確率極為低下。
從以上的分析,我們可以看出立體匹配技術存在很多技術上的難點,這些都在很大程度上限制雙目立體匹配技術在計算機當中的應用發(fā)展。如何才能設計出有效、準確、快速、通用性強的立體匹配算法將會是以后雙目立體匹配計算發(fā)展的重要方向。也只有通過設計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術在計算機視覺當中得到廣泛的應用。
4 結束語
人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠近。因此人類視覺感知系統(tǒng)就是一個雙目的立體感知系統(tǒng)。本文講述的計算機中的雙目立體匹配技術正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機采集獲得兩幅二維圖像的信息進行分析,并結合計算機的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術與計算機技術的完美結合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項技術應用于人類的視網膜當中,以幫助一些視網膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。
參考文獻
[1]高文,陳熙霖.計算機視覺算法與系統(tǒng)原理[M].北京:清華大學出版社,2002.
[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學,2008.
[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準則及其快速算法[J].電路與系統(tǒng)學報,2007,12(4):137-14.
[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學,2012.
【關鍵詞】計算機視覺技術 馬鈴薯外部品質 檢測
隨著計算機技術的不斷發(fā)展,計算機視覺技術應運而生并在工業(yè)自動化以及農產品檢驗檢測等領域成功應用。其中,將計算機視覺技術用于以自動化采集和品級分級為代表的果蔬商品化處理具有非常廣闊的發(fā)展空間。我國政府將“農產品深加工技術與設備研究開發(fā)”列為我國“十五”重大科技攻關項目的第一項,這標志著計算機視覺技術在果蔬外部品質檢測中會發(fā)揮越來越重要的作用。
馬鈴薯是世界上僅僅排在小麥、水稻和玉米之后的第四種主要農作物,種植區(qū)域非常廣泛。馬鈴薯品質檢測是馬鈴薯深加工的一個關鍵步驟,目前,該檢驗過程多數采用人工檢測,不僅成本高、效率低,而且與檢驗員的專業(yè)素質有密切的關系,受到人為因素影響的程度較大,嚴重制約的馬鈴薯加工企業(yè)的發(fā)展。計算機視覺技術能對農產品的某些特性變化和缺陷進行識別,具有客觀、無損害等特點。本文對基于計算機視覺的馬鈴薯外部品質檢測的應用進行了研究。
1 應用計算機視覺技術對馬鈴薯進行外部品質檢測的必要性
隨著“麥當勞”、“肯德基”的餐飲服務業(yè)的快速發(fā)展,炸薯條、炸薯片已經成為一種休閑食品深受消費者的喜愛,推動了我國馬鈴薯產業(yè)的發(fā)展。然而,情況并不十分樂觀,與國外的馬鈴薯企業(yè)相比,我國馬鈴薯加工企業(yè)生產規(guī)模小、生產產品單一、技術設備落后、產品質量不高的現象導致我國的馬鈴薯產品銷售困難,經濟效益逐漸下滑。
基于以上現狀,對馬鈴薯的加工研究還有很長的一段路程。企業(yè)要擴大生產規(guī)模,針對中國的消費趨勢與消費水平開發(fā)出新的馬鈴薯產品,從而提高我國馬鈴薯產品的競爭力。這就要求馬鈴薯加工企業(yè)要對馬鈴薯的加工技術進行創(chuàng)新,保證產品質量。其中,馬鈴薯外部品質檢測對馬鈴薯產品的最終品質起著決定性作用。當前的人工檢測方式已經不再適應社會發(fā)展的要求,利用計算機視覺檢驗代替人工檢驗成為社會發(fā)展的必然趨勢,這是因為計算機視覺技術具有以下優(yōu)點:
(1)精度高,能夠進行定量測量。
(2)自動化程度高,一次就可完成包括大小、形狀、顏色以及缺陷在內的檢測和分析,并能進行綜合識別。
(3)無損檢測,計算機視覺檢測過程不需要接觸產品,是通過傳感器掃面獲取圖像的,不會造成產品的損傷。
(4)信息量大,可對大量信息進行采集,對光譜的敏感范圍也很廣。
2 基于計算機視覺的馬鈴薯外部品質檢測的應用研究
2.1 馬鈴薯大小的檢測方法
馬鈴薯的大小檢測不僅影響馬鈴薯深加工的商業(yè)價值,在在遺傳和育種方面也有很高的應用價值。
利用計算機視覺技術對馬鈴薯大小的檢測步驟如下:先從攝像機中獲取馬鈴薯的圖像信息,在圖像信息的基礎上對馬鈴薯三維空間的幾何信息進行計算,并由此重建和識別馬鈴薯。而馬鈴薯物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系是由攝像機成像的幾何模型決定的,這些幾何參數成為攝像機參數。要想準確的獲取這些攝像機參數,就必須將實驗與計算相結合,此過程成為系統(tǒng)定標。
系統(tǒng)定標的基本步驟:根據設定好的攝像機模型和特定的實驗條件包括形狀、尺寸等已知的定標參照物,經過對馬鈴薯圖像的處理,并利用一系列的數學轉換和計算方法將攝像機模型的內部和外部參數計算出來,從而建立照片與實物的聯系推算出馬鈴薯的真實尺寸。
2.2 馬鈴薯形狀的檢測方法
根據《中國馬鈴薯栽培學》中的知識,我們可以把馬鈴薯的塊莖形狀分為三類,分別是圓形、長筒形和橢圓形,除了這三種形狀,其余都是這三種形狀的變形。此次研究將馬鈴薯分為圓形、橢圓形和長筒形,并且采用橢圓的短長軸比來模擬馬鈴薯的縱橫直徑之間的關系。
2.2.1 馬鈴薯形狀特征參數的提取
將馬鈴薯橢圓的短長軸比R作為形狀特征參數,并按照R的大小將馬鈴薯進行分類。當R小于0.67時,稱之為長筒馬鈴薯;當R大于0.85時,稱之為圓形馬鈴薯;當R介于0.67到0.85之間時,稱之為橢圓形馬鈴薯。
2.2.2 結果與分析
隨機抽取114塊馬鈴薯,對抽取的馬鈴薯進行正反兩面拍照,挑選清晰度最高的228張圖片。人工分類后進行計算機視覺分類,操作步驟具體如下:
(1)用DIPS預處理:B通道灰度化,中值濾波和Otsu分割;
(2)通過計算機視覺技術提取馬鈴薯圖片的短長軸比R;
(3)將人工分類與計算機視覺分類進行對比,并得出正確率。
根據圖表,我們可以看出在228張僅有兩張圖片被分類錯誤,正確率高達99.1%,而這兩個分類錯誤的馬鈴薯的短長軸比處于0.67周圍,分別為0.667604 , 0.67193和0.671887, 0.661063,又因為對馬鈴薯形狀的分類不需要類似工業(yè)生產那樣精密,所以,當正反兩面短長軸比接近時都可看作是橢圓形。
2.3 馬鈴薯的缺陷檢測
計算機視覺技術具有實時、客觀、無損的檢測特點,能對馬鈴薯的表面缺陷和某些特征要素進行快速檢測?;诖?,國內外很多研究學者進行了大量的實驗研究,在1998年開發(fā)了利用PC機輔助的實時馬鈴薯檢測系統(tǒng),能夠對馬鈴薯的重量、顏色以及形狀進行快速檢測;2000年,相關研究者在此基礎上建立了計算機視覺檢測系統(tǒng),不僅能實現大小、形狀的檢測,還能對馬鈴薯表面的生長裂縫、機械裂縫、綠皮等表面缺陷進行檢測。當前對馬鈴薯表面缺陷進行檢測的主要計算機視覺技術包括缺陷分割法和缺陷識別法兩種方法。
3 結論
本文應用計算機視覺技術對馬鈴薯的大小、形狀和表面缺陷等外部品質進行了檢測,但是還未能實現利用計算機視覺技術對馬鈴薯的表面缺陷進行分類這一技術。因此,相關部門要加大研究力度,爭取早日完善計算機視覺技術,從而推動我國馬鈴薯加工企業(yè)快速高效的發(fā)展。
參考文獻
[1]魯永萍.基于機器視覺的馬鈴薯外部品質檢測與分級.機械設計及理論[D].內蒙古農業(yè)大學.2013(學位年度).
[2]史崇升.基于高光譜成像技術的馬鈴薯外部品質無損檢測建模及優(yōu)化研究.電子與通信工程[D].寧夏大學.2014(學位年度).
作者單位
【 關鍵詞 】 云計算;關聯規(guī)則;Apriori Map/Reduce
1 引言
隨著我國開放大學建立及網絡學院的發(fā)展,高中起點升本科,??破瘘c升本科,高中起點升大專三個層次的多個不同專業(yè)吸引了更多的人選擇參加遠程教育完成學習,網絡學習云平臺上及網絡考試系統(tǒng)中也就保存了大量數據,在這些數據中隱藏很多對遠程教學有價值的信息,有助于教學管理人員及時分析學生學習情況,更好地整合網絡學習平臺上的教育資源。如果僅使用傳統(tǒng)數據挖掘方法,就會由于數據量巨大而導致系統(tǒng)處理速度緩慢,頻繁的輸入輸出會影響系統(tǒng)響應時間,節(jié)點效率不同也會出現挖掘效率不高的情況。為此在對網上考試系統(tǒng)所存儲的海量數據信息進行挖掘時,引入能夠在云計算環(huán)境下運行的數據挖掘算法,利用云計算環(huán)境中分布的計算節(jié)點,來支持數據挖掘算法的并行執(zhí)行,彌補傳統(tǒng)數據挖掘算法的不足,能從海量的考試數據資源中找出有價值的數據信息。
2 云計算與數據挖掘相關概念
2.1 云計算下MAP/REDUCE并行編程模型介紹
云計算的概念最先由Google埃里克·施密特在2006年首次提出,其基本原理是將大的海量數據的計算任務分割成小的微量的計算任務,將計算任務細分后由分布在網絡上的計算節(jié)點通過并行計算實現,最后將細化的計算結果數據匯總,得到最后的計算結果。在當前的網絡教學平臺中就已經開始引入云的概念,將優(yōu)質的教學資源作為云,學習者只訪問自己學習相關的資源而不用考慮該資源所在位置,學習結束后通過網上考試系統(tǒng)完成測試。
MapReduce 是 Google 發(fā)明的并行分布式編程模型,被廣泛應用于云數據計算中,用MapReduce來處理的數據任務必須能分解成獨立的小數據集,而且各個小數據集能夠并行處理,通過 Map階段將待處理數據分割成小的獨立數據塊,分別讓不同的空閑計算節(jié)點來進行計算,達到分布式運算的效果,再通過 Reduce 程序將計算結果匯總輸出。
2.2 關聯規(guī)則及Apriori算法介紹
數據挖掘目前公認的定義是:數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
關聯規(guī)則由Agrawal 等于1993年首先提出,就是要從當前數據庫中挖掘出各個項集間存在的某種規(guī)則,形成關聯規(guī)則的項目集必須是頻繁項目集,也應滿足最小支持度和最小可信度。
對于云計算平臺上的海量考試數據進行挖掘,主要目的之一就是希望能通過挖掘大量的考試信息發(fā)現試題之間隱藏的內在聯系,這在功能上屬于關聯分析。例如,關聯規(guī)則可以表示為“答對了題目3的考生中有80%的人也答對了題目9”。從這些規(guī)則可找出試題中題目之間的關聯性,幫助教師分析學生知識掌握情況以及分析題目之間的互相影響性,以便幫助提高教學質量。
Apriori算法的基本思想是找出所有的頻繁項集,這些頻繁項集出現的頻繁性要大于等于預先定義的最小支持度,由找出的這些頻繁項集產生同時滿足最小支持度和最小可信度的強關聯規(guī)則。
3 云計算環(huán)境下Apriori算法的Map/Reduce模型化設計
要在云計算環(huán)境下應用Apriori算法,要將算法按照Map/Reduce的編程模型并行化設計并執(zhí)行,然后由主控程序控制算法應用云存儲環(huán)境中的數據運行。主程序按照使用者指定的數據塊大小將云存儲中數據分成獨立的N個數據塊,并將這些數據塊分發(fā)到云平臺中各個空閑的計算節(jié)點去運行,在進行數據預處理后,Map進程對處理好的目標數據進行計算,得到局部的頻繁候選項集,再由Reduce進程對Map過程產生的局部候選頻繁項目集做歸并處理,產生總體的全部候選項目集,然后按照給定的最小可信度和最小支持度找出全局的頻繁候選項目集,得到有關的關聯規(guī)則。
云計算環(huán)境下的 Apriori 算法Map/Reduce化包括3個過程,首先是數據準備過程;其次是Map函數過程找到各個獨立數據塊的局部頻繁項集;最后由Reduce過程通過歸并處理接收Map過程得到的局部頻繁項集,從中找出全局頻繁項集,得到所需要的強關聯規(guī)則。
Map/Reduce 化后 Apriori 算法的執(zhí)行步驟如下:
(1) 數據庫中待處理數據首先要按照要求分割成相對獨立的N個小數據塊,并按照所需要求進行數據清理處理和篩選處理,得到處理后的N個候選數據項集。
(2) 由Master將N個候選數據項集分派給不同的工作節(jié)點,每個節(jié)點執(zhí)行不同的Map進程,利用參數KEY,產生的VALUE,按照系統(tǒng)設定的最小支持度和最小可信度要求計算出局部的頻繁項集。
(3) 由Map過程得到的局部頻繁項集保存到本節(jié)點硬盤上,準備交給Reduce過程處理歸并。
(4) Map過程結束后,由Master主程序將本次硬盤存儲的局部頻繁項集具置信息傳遞給Reduce歸并過程,由主程序決定讓云計算環(huán)境中的空閑計算節(jié)點來運行完成Reduce過程。
(5) Reduce過程主要是從存儲區(qū)讀取局部頻繁項集數據,然后通過歸并處理得到全局的數據候選項集,再找出滿足大于系統(tǒng)給定的最小可信度和最小支持度的頻繁項目集。
(6) Reduce過程得到的數據傳遞給用戶,由用戶對數據進行整理找出符合要求的強關聯規(guī)則。
4 實驗過程及分析
4.1 MapReduce化的Apriori算法考試數據挖掘應用
網上考試系統(tǒng)中保存海量的學生考試信息,其中學生考試成績是很重要的一項數據信息,利用MapReduce化的Apriori算法對海量考試數據信息進行挖掘,主要是對學生成績信息進行挖掘,找出所學課程之間的相關性,可以更科學地幫助教師制訂合理的教學計劃進程,以指導學生順利完成學業(yè)。
如在對網絡云平臺上考試系統(tǒng)中的數據信息挖掘時,要找出學生的學習課程之間的相互關聯性,可以從學生的課程考試成績入手。首先要處理數據,將學生課程成績92分以上的設置為1,表示該門課程成績?yōu)閮?yōu)秀,其它低于該分數的成績設置為0,表示該門課程成績不優(yōu)秀。該數據庫表中有三門課程,包括程序設計基礎,計算機基礎和VB課程,選取部分學生成績數據,要對上述優(yōu)秀課程進行云計算環(huán)境下的關聯規(guī)則挖掘,假定最小支持度為40%、最小可信度為60%時,設定key和value參數值,首先由Master分配數據塊給各個Map,找出局部的頻繁項目集,再由Reduce過程歸納局部頻繁項目集得到全局候選項集,根據設定的最小支持度和最小可信度,找出全局頻繁項目集。可以得出如下規(guī)則:
(1)程序基礎成績優(yōu)秀,VB成績優(yōu)秀=〉計算機基礎成績優(yōu)秀的可能性大于100%;
(2)VB成績優(yōu)秀,計算機基礎成績優(yōu)秀=〉程序基礎成績優(yōu)秀的可能性大于100%。
根據以上挖掘得到的規(guī)則可以得知,VB程序設計課程與程序設計基礎課程之間有某種聯系,能夠相互影響,程序設計基礎這門課程成績會影響到VB課程成績,計算機專業(yè)責任教師在設計教學計劃時,可以將程序設計基礎課程作為VB程序設計課程的先修課,這樣學生成績?yōu)閮?yōu)秀的可能性就更大。
同樣的可以利用MapReduce化的Apriori算法在網絡考試數據信息中挖掘出相關學科之間不同知識點的影響程度,以實現在教學中在講授某一知識點時的知識擴展和準備。我們設定最小支持度為96% 最小置信度為97%
通過挖掘后,得到如下的規(guī)則:
站點顏色與主題 =〉網站風格的設計 96.8% 98.3%
網站風格的設計=〉站點顏色和主題 96.8% 97.2%
網頁信息的強勢 =〉頁面設計 97.6% 96.5%
其中,每一行為一條關聯規(guī)則,數字分別表示他們的支持度和可信度。如第2條規(guī)則表示,網站風格設計的知識點與站點顏色和主題的知識點有很強的關聯性,由于有96.8%的學生對這兩個知識點的掌握都比較好,同時有97.2%的學生屬于對網站風格設計知識點掌握的好也對站點顏色和主題知識點掌握的好。這就說明網站風格設計的知識點可以作為站點顏色和主題知識點的知識準備,教師在講解網絡信息制作與時要重點強調該部分內容,也可以在講解DREAMWEAVER課程中將網站風格設計的相關概念給出,這對學生學習會有很大的幫助。同時,該規(guī)則可以幫助教師在進行試卷設計時,將這兩個知識點的內容同時考察,這樣學生的得分率會更高。
4.2 MapReduce化的Apriori算法和傳統(tǒng)的Apriori算法挖掘效率對比
為了驗證使用基于云計算環(huán)境的Apriori算法與傳統(tǒng)的Apriori算法在對海量的考試數據信息挖掘方面的優(yōu)越性能,進行數據實驗測試。本測試環(huán)境是在局域網范圍內配置一定數量節(jié)點的集群環(huán)境,每個單一節(jié)點的軟硬件配置都統(tǒng)一,利用Hadoop 自帶的 MapReduce Tools for Eclipse ,配置好 MapReduce分布式編程環(huán)境。測試數據來源于網上考試系統(tǒng)保存的學生考試數據信息。設定最小支持度為0.2,最小可信度為0.1。通過使用MapReduce化的Apriori算法和傳統(tǒng)的Apriori算法對海量的考試數據信息進行挖掘,將得到的測試結果進行比較,得到的結果是在數據規(guī)模比較小的情況下,傳統(tǒng)的挖掘方法和云計算環(huán)境下的挖掘方法耗費的時間差別并不大,但是隨著數據規(guī)模的增大,使用傳統(tǒng)的Apriori算法進行的單節(jié)點數據挖掘所耗費的時間越來越多,而使用MapReduce化的Apriori算法則顯現出了更好的計算效能,在對網絡考試系統(tǒng)的大規(guī)模數據信息進行挖掘時系統(tǒng)性能表現很好,解決了傳統(tǒng)數據挖掘在面對海量數據信息進行挖掘時的系統(tǒng)響應速度慢,各個節(jié)點的輸入輸出量巨大時負載不均衡,挖掘效率不高的問題。
5 結束語
通過對網絡考試系統(tǒng)的海量考試數據信息進行挖掘,驗證了云計算環(huán)境下應用基于Map/Reduce編程模型的Apriori算法進行數據挖掘,能夠解決傳統(tǒng)數據挖掘算法在對大規(guī)模數據挖掘時出現的系統(tǒng)響應速度慢,整體挖掘效率不高的問題,希望在數據量越來越多的云教育時代,基于云計算環(huán)境的數據挖掘能發(fā)揮出更大的作用。
參考文獻
[1] 陳嘉恒.分布式系統(tǒng)及云計算概論.清華大學出版社, 2011.5.
[2] 趙虎.云計算環(huán)境下的關聯數據挖掘算法實現.電子科技大學,2011.6.
[3] 蘇海英.數據挖掘中關聯規(guī)則算法的分析與優(yōu)化研究.吉林大學,2006.
[4] 孟小峰.數據挖掘:概念與技術(M).機械工業(yè)出版社, 2001.
[5] 安淑芝.數據倉庫與數據挖掘.清華大學出版社,2005.6.
[6] 戎翔.基于MapReduce的頻繁項集挖掘方法.西安郵電學院學報,2011.7.
[7] 謝桂蘭.基于Hadoop模型的應用研究.微型機與應用, 2010.8.
[8] 季一木,康家邦,潘俏羽等.一種云計算安全模型與架構設計研究[J].信息網絡安全,2012,(06):6-8.
[9] 胡春輝.云計算安全風險與保護技術框架分析[J].信息網絡安全,2012,(07):87-89.
[10] 江偉玉,高能,劉澤藝等.一種云計算中的多重身份認證與授權方案[J].信息網絡安全,2012,(08):7-10.
關鍵詞:視覺技術;太陽視位置;算法
DOI:10.16640/ki.37-1222/t.2017.06.204
1 引言
基于太陽能利用涉及的太陽位置算法的研究源于20世紀60年代。1969年的Copper算法、年的Spencer算法、1988年Michalsky提出的基于天文算法的太陽位置算法,以及2004年Reda提出的精度較高的SPA算法。這些算法均需計算出太陽視赤緯、當地太陽時角,并以此為變量,利用球面三角公式或矢量法計算太陽視位置的地平坐標(高度角、方位角)[1],算法復雜、計算量大,影響太陽位置時時準確地獲取,不利于實現自動化跟蹤控制。基于視覺技術的太陽視位置算法是借助視覺技術代替人眼通過采集地平坐標系下的影子圖像,經圖像處理分析后,建立太陽方位角和高度角的算法,從而確定太陽視位置。這樣的研究是基于機器視覺技術的新的嘗試,也是目前太陽能跟蹤眾多方法中尚未涉及的新領域。
2 圖像處理
視覺系統(tǒng)采集的圖像,在形成、傳輸、接受和處理的整個過程中,由于受到噪聲和圖像特征衰減等方面的影響,會降低圖像的質量。因此,對圖像進行分析之前,必須先對圖像進行處理,以便為后續(xù)圖像分析處理等高層操作提供基礎[2]。處理技術主要是對被處理圖像進行灰度變換、平滑濾波、圖像增強、幾何變換、灰度均衡化處理[3] ,目的是消除圖像中無關的信息,恢復有用的真實信息,增強有關信息的可檢測性和最大限度地簡化數據,從而改善圖像數據,提高特征抽取、圖像分割、匹配和識別的可靠性。
2.1 圖像翻轉
圖像翻轉是一種幾何變換,可以將原圖像繞著中心點翻轉180度,只改變坐標不改變圖像像素值。采集到的影子圖像如圖1(a)所示,處于倒置狀態(tài),不利于獲取影子坐標系,因此在預處理前應當將圖像翻轉,如圖1(b)所示。
2.2 閥值分割
閾值分割就是確定一個閥值,把圖像中每個像素點的灰度值與閥值進行比較,根據比較結果將像素分為前景和背景[4]。經過圖像分割后,圖像變成了二值圖像,使后續(xù)圖像輪廓的提取和分析就變得非常簡單[5]。
研究中采集到的圖像是灰度圖像,圖中的影子邊界和坐標標量邊界與背景有些模糊,但圖像和背景的對比度比較高,產生的假邊緣點少,因此通過閥值分割就能將圖像與背景分割(見圖2)。
圖像閥值分割的關鍵技術是閥值的選取,常用的閾值選取方法有直方圖谷底閥值法、迭代選擇閥值法、最大熵法、最大類間方差法以及其它一些方法。用以上方法依次對圖1(b)圖像進行分割,所得結果如表1所示。經過數據和分割效果對比,迭代選擇閥值法獲取的閥值為最佳閥值。
2.3 邊緣檢測
要想準確獲取太陽高度角和方位角就需要準確檢測出影子的像素長度、圖像標準長度像素值和坐標方向。為了獲取這些參數,采用了邊緣檢測算子。
檢測步驟如下:
(1)對坐標方塊的坐標位置(左方格的左上方坐標和右下方坐標、右方格的右上方坐標和左下方坐標)進行初始化;
(2)通過雙重循環(huán)逐行逐列的掃描搜索獲取四個坐標位置的真實坐標值;
(3)設計算法,構建東西方向向量,計算標準長度的像素值,并標出影子圖像所在區(qū)域;
(4)在區(qū)域下方掃描搜索影子圖像標出邊緣點;
(5)設計算法,構建影子的方向向量,計算影子的像素長度。
3 太陽方位角和高度角計算
經邊緣檢測,獲取了坐標標量方塊的四個坐標點和影子圖像的兩端邊緣點,并已通過算法確定了東西方向向量、影子方向向量、標準長度的像素值和影子的像素長度值。通過GUI界面輸入直桿的長度和坐標標定單位長度就可準確地計算出太陽方位角和高度角。
將基于視覺技術檢測到太陽高度角和方位角與精度較高的SPA算法計算[6,7,8]的太陽高度角和方位角進行對比。
實驗數據采集地點為北緯N39°37′2.67″ 、東經E109°48′50.29″;采集日期為2016年3月5日。
4 結論
基于覺技術檢測獲取的太陽視位置精度高,采集原理可行性高,影子圖像輪廓易于提取,圖像前期處理所需步驟少,大大提高了算法處理速度,消除了以往太陽跟蹤時間滯后和實時性低的不利影響[9]。
參考文獻:
[1]杜春旭,王普,馬重芳等.一種高精度太陽位置算法[J].新能源及工藝,2010(02):41-48.
[2]張春雪.圖像的邊緣檢測方法研究[D].無錫:江南大學,2011.
[3]王東江,劉亞軍.太陽自動跟蹤控制系統(tǒng)的設計[J].數字技術與應用,2010(07):19-25.
[4]張錚,王艷平,薛桂香等.數字圖像處理與機器視覺――Visual C++與Matlab實現[M].北京:人民郵電出版社,2010:361.
[5]徐平,邵定宏,魏楹等.最佳閥值分割和輪廓提取技術及其應用[J].計算機工程與設計.2009,30(02):437-439.
[6]張菲菲.關于日出日落方位的淺析[J].城市地理,2015:76.
[7]金衛(wèi)東.揭開太陽方位角的神秘面紗[J].求學,2015(05):53-54.
[8]王國安,米鴻濤,鄧天宏等.太陽高度角和日出日落時刻太陽方位角一年變化范圍的計算[J].氣象與環(huán)境科學,2007(30):161-164.
[9]李平陽.基于圖像處理的太陽質心位置檢測算法研究[D].太陽科技大學,2013.
【關鍵詞】云計算 web數據挖掘 運用 控制層
1 云計算與web數據挖掘
1.1 云計算的概念
所謂云計算,具體是指將分布式、網絡存儲、網格計算、并行計算以及虛擬化技術有效融合而形成的技術,是計算機技術蓬勃發(fā)展的最終產物。
1.2 云計算的關鍵技術
1.2.1 數據管理技術
系統(tǒng)處理能夠為用戶提供更為優(yōu)質的高質量服務,進而可以通過此技術手段進行管理數據。此外,管理技術的廣泛應用,還能夠進一步解決存在的問題,對于數據集的整合和處理來說,提供了充足的數據參考。
1.2.2 虛擬化技術
作為一種特別有效資源合理分配劃分的方式,可以將不同等級的系統(tǒng)進行孤立,進而實現存儲、服務器與設備之間的劃分,從中凸顯出應用系統(tǒng)的實質性作用,實現體系結構與管理技術的廣泛應用。
1.2.3 分布式存儲技術
運存儲數據主要就是采用分布式的存儲方式,這種方式在某種程度上來說,可以有效的保障數據的可靠性,同時也具備一定的經濟性。
1.3 web數據挖掘技術
通常情況下,我們將web數據挖掘成為網絡挖掘,其根本原因是基于互聯網與數據挖掘技術而形成的。由于當前互聯網中數量是非常龐大的,而運用web能夠準確的尋找到有價值的信息。在web數據挖掘技術領域當中,主要是基于機器學習、統(tǒng)計學、數據庫技術以及神經網絡等分支來構成的。在web數據挖掘技術運用的過程中,由于和傳統(tǒng)挖掘技術相比,在挖掘方式與挖掘對象方面是存在著較大差異的,因此在流程方面是完全不同的。通常來說,web數據挖掘的流程主要可分為四個部分,分別為搜索信息、信息預處理、模式發(fā)現以及模式分析。
2 基于云計算平臺的web數據挖掘體系架構
2.1 服務層
服務層的功能是用戶與web數據挖掘之間的交互。在操作過程中,服務層能夠將用戶的請求接收,并通過轉化的方式向web數據挖掘發(fā)送指令,然后web數據挖掘將得到的資源返回到用戶。
2.2 控制層
在web數據挖掘執(zhí)行的過程中,控制層處于核心地位,其根本原因是在云計算平臺當中,所有的數據挖掘的相關操作都是由控制層來操作與控制的。具體來說,主控節(jié)點會根據用戶所提出的需求,來對最合理的web數據挖掘算法來進行選擇,然后將算法的階段傳輸到體系架構當中的各個節(jié)點當中,在挖掘任務完成后則會傳輸到服務層,最終展現給用戶。
2.3 算法和數據存儲層
在基于云計算平臺的web數據挖掘的體系架構當中,數據存儲層的功能是對各種類型的算法進行存儲,當接收到用戶所發(fā)出的信息后,在算法進行選擇后存儲到數據存儲層,以實現對數據的備份。即便在挖掘過程中出現意外,也能夠瞬間將數據恢復。
2.4 業(yè)務處理層
眾所周知,在web挖掘技術當中得到的數據與信息,是經過數據存儲層的解析后,轉化為XML文件。對此,業(yè)務處理層的職責就是將分配的任務進行處理,在操作完成后返回到控制層,最終由控制層傳輸到服務層。
3 基于云計算的web數據挖掘技術運用
3.1 數據的收集和處理
在數據的收集和處理過程中,需要將用戶訪問數據與web機器人訪問數據相分離,那么則需要運用到決策樹工具。除此之外,基于云計算平臺的web數據挖掘算法,在對數據進行篩選與整合后,將其轉化為半結構化的XML文件,并將其保存到分布式文件體系當中。其中,具有代表性的谷歌公司所研發(fā)的Map-Reduce編程,這種編程模式將負載均衡、并行化以及數據布局有效的融合。在操作階段,數據的流程包含兩個階段,分別為Map階段與Reduce階段。借助于此編程方式,所收集得到的數據量更大,但是需注意的是,系統(tǒng)本身并不包含搜集數據與保存掃面的功能,再加上應用程序在使用的過程中,還會運用到歷史數據的功能,因此對于系統(tǒng)的性能具有一定的負面影響。截止到目前,構建相關系統(tǒng)項目的研究機構是逐漸增多的,其中具有代表性的有Aurora以及STREAM等。
3.2 數據存儲
當數據進行收集之后,需要進行科學合理的數據處理,當完成收集和處理任務之后,應該將數據存儲起來,以保證可以對日后的使用起到一定的便捷作用,數據在存儲的同時,應該始終堅持以云計算為重要的存儲數據流程設定基礎,這樣可以有效的保障數據的穩(wěn)定性,對數據的存儲起到一定的促進作用。在現階段以云計算為核心的web數據存儲領域當中,主要被劃分為開源系統(tǒng)與非開源系統(tǒng)。其中,前者運用最多的為hdfs系統(tǒng),該系統(tǒng)是由hadoop公司所開發(fā)的;而后者運用最多的是gfs系統(tǒng),該系統(tǒng)是由谷歌公司所開發(fā)的??偟膩碚f,在各項技術蓬勃發(fā)展的過程中,在云計算平臺中,web數據挖掘技術的運用范圍是不斷擴展與延伸的。在此背景下,云計算平臺的web數據挖掘技術不但搜索效率方面有著明顯的提升,同時在數據處理效率方面的提升也是非常顯著的。
4 結論
通過全文的分析,能夠看出重點是對于云計算以及數據挖掘技術進行具體的探索和分析,明確在云計算技術基礎上,數據挖掘技術得到了較大程度上的創(chuàng)新發(fā)展,其未來的發(fā)展前景非常的寬廣。與此同時,相信在云計算領域蓬勃發(fā)展的背景下,web數據挖掘在云計算的未來發(fā)展發(fā)揮出了巨大的推動力。
參考文獻
[1]蔡興旺,段夢博.云計算及其在數據挖掘上的應用研究[J].電腦知識與技術,2010(22).
[2]劉帥,蔣貴凰.數據挖掘的現狀及發(fā)展趨勢研究分析[J].現代商業(yè),2015(33).
[3]吳銳,孫銀香.云計算平臺下的Web數據挖掘研究[J].網絡安全技術與應用,2014(08).
【 關鍵詞 】 云計算;數據挖掘;平臺架構;設計和實現;探究
1 引言
近年來,隨著科學技術的飛速發(fā)展,大量的數據被存儲到計算機等存儲介質當中。通常情況下,所存儲的數據多是復雜的、數據量較大的等。因此,難以通過人工而直接獲得。尤其是在科研或是商業(yè)發(fā)展領域中,需要對海量的數據進行分析,從而找出更多有價值的信息。為解決上述問題,很多研究人員聚集在一起,研究出一種新型的數據挖掘技術。
近來,由于計算機技術、云計算技術的飛速發(fā)展,大量的數據都存儲到了網絡當中,而這些海量的、復雜式的數據信息給數據挖掘系統(tǒng)的實現帶來很多的難題,如數據相對復雜,現有的計算能力難以達到技術要求,而可以借助云計算數據挖掘技術可提升處理復雜數據的能力。
2 云計算數據挖掘系統(tǒng)架構設計的分析
2.1 目標系統(tǒng)模型
在云計算環(huán)境下,構建目標系統(tǒng)為各種終端用戶提供高透明化的界面服務,并且在此基礎上也提供了開放式的接口支持。這樣一來,用戶不僅能夠通過終端訪問用戶訪問來使用系統(tǒng),也或是利用其它應用程序調用開放式接口間接式的應用系統(tǒng)服務。不管遇到上述哪一種情形,用戶都無需對系統(tǒng)實現而擔心其存儲能力,只需考慮要選擇何種算法進行處理,最后通過任務形式部署給系統(tǒng)獲得所需的挖掘結果。除此之外,云計算環(huán)境下的數據挖據平臺中得模塊都是利用用戶界面和開放式接口提供服務的。其中,由開放式接口提供的服務均為外部可見服務。而當涉及到高級權限使用功能時,可通過用戶界面直接調用開放式接口服務功能。
2.2 功能層次框架設計
2.2.1算法層
該層主要是利用下一層所提供的統(tǒng)一數據源來調用相關算法及對接口進行合理的管理。由于不同算法的執(zhí)行順序和得到的結果有所不同而分開的。例如數據清洗算法服務,它是針對具有噪聲數據的數據及在應用數據挖掘算法前需要進行接口服務調用,把清洗后的數據利用數據層再儲存到云計算平臺中,為后續(xù)數據挖掘工作提供更好的服務;數據挖掘調用服務,在應用該服務之前,將已清洗的及不需要清洗的數據利用數據挖掘技術統(tǒng)一對數據進行調用。
2.2.2應用層
和其它層相比,該層的抽象性較強,它是把海量數據挖掘涉及到的數據、算法等之間的內在關系描述成任務,同時提供提供應用調用服務和維護接口等。
2.2.3用戶層
該層主要為用戶提供身份驗證和授權等功能。
2.3 設計關鍵點
2.3.1插件系統(tǒng)設計
插件是結合相應的應用程序開發(fā)接口規(guī)范而實現的一種程序。其中,任何一個插件都是由三大部分構成的,即擴展點、業(yè)務邏輯、調用下層擴展點,并且這三者都是由相同的負責模塊管理幫頂包跟各種服務所構成的。另外,每個綁定包涉及到一個服務說明接口與多個服務調用接口兩種類型的接口。要求綁定包接口必須滿足相關規(guī)范要求,若把插件防止到平臺的某個特定目錄下,能夠識別和加載該動態(tài)。除此之外,算法實現不同于以往針對特定個數、排列數據而實現。它是在滿足實現算法的基礎上,利用抽象數據提供更多的兼容性。盡管這種算法實現存在很大的難度,但其算法的復用性有了顯著提升。
2.3.2開放接口設計
通常情況下,開放接口主要被應用數據挖掘平臺的開發(fā)使用。利用上述接口,開發(fā)者能夠更好地利用數據挖掘平臺提供的資源及數據服務。為實現開放接口高效性、直觀性的目的,其平臺接口主要應用的是表述性狀態(tài)轉移接口,英文縮寫為:REST。該類接口的優(yōu)勢在于為無態(tài)型。也就是說,在同一個局域網中,瀏覽器中的緩沖裝置可替代服務的重復調用。這樣一來,不僅能夠有效減輕服務器的運行負擔,而且若用戶量過多造成底層服務影響整個系統(tǒng)的運行,而此時可利用橫向服務器數量的增加擴展線性的吞吐量。因此,利用云計算平臺,能夠為用戶提供無窮大的數據吞吐能力,滿足系統(tǒng)的性能要求。
3 云計算數據挖掘平臺架構的實現
3.1 開發(fā)環(huán)境
Google的云計算開發(fā)環(huán)境主要為App Engine。當遇到重載或是數據量非常的情形時,也能輕松構建安全的應用程序。這是因為此環(huán)境的優(yōu)勢在于可提供動態(tài)服務、自動擴展等。
3.2 開發(fā)思想和技術
3.2.1原型開發(fā)模型
首先,需進行快速分析。在相關人員和用戶的共同合作下,可準確確定出系統(tǒng)的需求,再結合原型的特征描述需求,來滿足開發(fā)原型的需求。其次,原型的建構。在經過分析的基礎上,結合需求快速建構一可行性較高的系統(tǒng)。在此情況下,需要有相應的軟件工具提供可靠的技術支持,同時不考慮系統(tǒng)細節(jié)方面的具體要求。再次,原型的運行。此環(huán)節(jié)是為及時發(fā)現問題,從而快速消除問題的一個關鍵環(huán)節(jié)。最后,對原型的評價。原型運行的前提下,對原型的特性予以科學性的考核,對運行結果能否滿足用戶期望而進行分析。而針對該過程中存在的錯誤或是增添的新要求等,提供合理性的修改建議和意見。
3.2.2基于WSGI規(guī)范的開發(fā)
通過分析可知,在基于WSGI規(guī)范基礎上的開發(fā)具有很多的優(yōu)勢。其根本目的是提升系統(tǒng)的可用性和實現跨平臺性操作。因此,基于WSGI規(guī)范的實現遠比傳統(tǒng)的C/S模塊使用簡單的多。用戶通過對瀏覽器來訪問系統(tǒng),同時增加了用戶的終端的可選擇性。此外,由于WSGI規(guī)范是在Python的語言環(huán)境下而實現的。而該種語言屬于一種跨平臺性開發(fā)語言。這樣一來,不管是把已開發(fā)的系統(tǒng)放置到云計算平臺上還是在本地開發(fā)應用都是極其方便的。
3.3 開發(fā)步驟
3.3.1算法模塊插件系統(tǒng)
算法模塊主要涉及到數據集清洗算法、數據挖掘算法、結果可視化算法等多種。而一個完整的執(zhí)行過程必須在原始數據集的噪聲及不規(guī)則數據的情況下借助數據集清洗算法把數據集統(tǒng)一進行整理。也或者是由異狗、分布式等數據源中轉化而得到,再自動生成規(guī)則的數據集。將這些規(guī)則的數據集利用數據挖掘算法予以處理,進而獲得數據挖掘結果信息,再經過可視化算法的處理,最終將數據信息傳遞給用戶。其中,任何一個環(huán)節(jié)數據的調用都必須利用REST接口而實現,并且接口間的數據信息轉換和傳遞都是采用XML格式。特別是近年來,由于數據挖掘平臺各種算法模塊插件的出現,這樣一來,云計算平臺下的數據挖掘平臺所提供的功能也會逐步增多。
3.3.2數據集訪問模塊
該模塊的實現和上述算法模塊插件系統(tǒng)實現具有很多相同點。它也是通過插件方式進行維護和調用的。尤其是在訪問數據集的過程中,其訪問模塊文件被索引處在被用戶調用的狀態(tài)。而和算法模塊插件系統(tǒng)的不同之處是在調用數據集訪問模塊前,系統(tǒng)自動把數據機實例文件解析成若干個元數據組合及物理訪問地址,最后把此類數據組合成字典類型結構的參數傳遞到數據機訪問模塊中。
4 結束語
總體來說,在云計算平臺下的數據挖掘系統(tǒng)逐步趨于完善,增強了數據規(guī)約的功能,從而更好地解決異構數據訪問的問題。同時在App Engin開發(fā)平臺上,設計出一套更為完善的數據挖掘系統(tǒng),提升了云計算和數據挖掘技術結合的可靠性與高效性。文章主要針對基于云計算的數據挖掘平臺架構設計與實現予以深入的研究,并且對今后云計算環(huán)境下的數據挖掘系統(tǒng)的延伸發(fā)展予以展望,希望能夠通過論述對讀者產生一些積極影響。
參考文獻
[1] 楊慶平.基于云計算的數據挖掘平臺架構及其關鍵技術研究[J].中興通訊技術,2013,19(1);122-123.
[2] 黃章樹.基于云計算服務模式的數據挖掘應用平臺的構建[J].電信科學,2012,28(1);138-139.
[3] 莊福振.基于云計算的大數據挖掘平臺[J].中興通訊技術,2013,19(4);130-131.
作者簡介:
本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。