前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺前沿方向主題范文,僅供參考,歡迎閱讀并收藏。
最近幾年,自動駕駛成為當下最為熱門的科技領域之一,許多企業(yè)紛紛將目光轉向該領域,諸如谷歌、百度、英特爾、Uber、豐田、本田、福特等科技和車企巨頭都在該領域有相關研究。在國內,除了高舉無人車大旗的百度,許多創(chuàng)業(yè)公司也在研究自動駕駛技術,圖森互聯(lián)即其中之一。
9月19日,國內計算機視覺與人工智能創(chuàng)業(yè)企業(yè)圖森互聯(lián)宣布,他們研發(fā)的計算機視覺與深度學習算法在全球最權威、最具影響力的自動駕駛算法公開排行榜KITTI和Cityscapes評測數據集上均獲得世界第一。僅KITTI數據集中,圖森互聯(lián)獲得目標檢測三個單項、目標追蹤兩個單項、道路分割四個單項,共計九個單項的全部世界第一。
那么,在當前,自動駕駛技術究竟有哪些等級?市面上的自動駕駛技術都有哪些陣營?產品落地情況又如何?基于這些問題,《汽車觀察》記者對有著十年并行和分布式運算研究經歷、曾是淡馬錫國家實驗室研究員、現為圖森互聯(lián)聯(lián)合創(chuàng)始人的南洋理工大學博士郝佳男進行了獨家采訪。以下為部分采訪實錄:
《汽車觀察》:圖森做自動駕駛技術項目的初衷是什么,單純就是看到了這塊的市場需求與前景嗎?
郝佳男:首先,圖森是做圖像識別SaaS起家,在技術上有一定的積累,自動駕駛所用到的計算機視覺感知技術和圖像識別SaaS在很多方面是同源的;另外,對于自動駕駛,特別是主要基于視覺傳感器的自動駕駛,有很高的技術壁壘,圖森能夠很好地發(fā)揮自己的長處;第三,運營車輛對自動駕駛和無人駕駛存在較大的需求,因為自動駕駛和無人駕駛可以極大地減少這些運營車輛企業(yè)的人力成本和潛在的安全風險,而且無人車可以持續(xù)運營,這對企業(yè)來說是生產效率的飛躍。
《汽車觀察》:目前,在國際上自動駕駛技術分為幾個等級?圖森的自動駕駛技術又是幾級的技術?在國內外算是一個什么水平?
郝佳男:目前自動駕駛有L1-L5五個等級,L5是人們最期待的完全無人駕駛水平,眾人熟知的谷歌無人駕駛在目前只能算是L4級水平。圖森的主要目標是通過低成本傳感器實現可靠的L3級別無人駕駛。
目前行業(yè)內的標桿是以色列的Mobileye。但目前Mobileye量產的芯片依然使用傳統(tǒng)非深度學習算法,因此在一些特定場景中(如車側面、非常見車型等)會出現錯誤。最近Tesla發(fā)生的車毀人亡事故就一個例子。圖森的技術方案基于深度學習構建,能夠實現更可靠的性能。
《汽車觀察》:目前的自動駕駛技術有哪幾類?它們的本質區(qū)別在哪里?分別有哪些優(yōu)勢?
郝佳男:目前,市面上共有兩種解決方案:一種是計算機視覺為主、毫米波雷達為輔的低價解決方案;另一種是激光雷達為主、以攝像頭為輔的高價解決方案。
以谷歌和百度為代表的是以激光雷達為主、攝像頭為輔的高價解決方案,成本在50萬以上。比如Google的無人駕駛車輛,在這個技術路線中,車輛完全由人工智能來駕駛,可以將車輛的方向盤、油門和剎車去掉,同時,為了增加技術的可靠性,Google無人駕駛汽車以激光雷達為核心,一個64線的激光雷達成本在7萬美元左右,整體解決方案較貴。另外,激光雷達的硬件可靠性一般,也很難達到車規(guī)需求。但是這兩家上市企業(yè)出于市值管理的考慮,在這方面不計成本。對他們來說,新技術所能達到的程度帶來的新聞和公關效力,會大幅地抬高股價。但這種成本過高的技術,在商業(yè)化應用時會比較困難。
而選擇低價解決方案更容易被車廠、受眾所接受。以特斯拉、奔馳、沃爾沃等車廠為代表的漸進型自動駕駛,即先從輔助駕駛開始做起,在特定場景、或是特定的封閉結構化路段適用,做出緊急剎車、自適應巡航、車道保持、自動泊車等動作,后續(xù)涉入高度自動駕駛,即除了結構化路段外,還能在非結構化道路上自動駕駛。
圖森就屬于低價解決方案,即選擇低成本的硬件(毫米波雷達、視覺傳感器、高性能SoC),配合計算機視覺算法來降低總成本。傳感器承擔的精度要求降下來,那么對算法的要求就比較高了。
《汽車觀察》:目前的自動駕駛技術是如何實現自動駕駛的?能實現到怎樣程度的自動駕駛?
郝佳男:自動駕駛系統(tǒng)使用了多種傳感器來感知,其中可視為廣義“視覺”的有超聲波雷達、毫米波雷達、激光雷達(LiDAR)和攝像頭等。毫米波雷達和激光雷達承擔了主要的中長距測距和環(huán)境感知,而攝像頭主要用于交通信號燈、車輛、行人等物體的識別。
攝像頭拍到的視頻其實也是由一幀幀圖像形成。拍下來是一回事,通過計算得出圖像里的行人、車輛、信號燈等結構化數據則是另一回事。在過去,這被視為不可想象的任務。但深度學習的發(fā)展讓基于視覺的感知技術獲得了大幅度提升,基于視覺的環(huán)境感知變得可行了。
《汽車觀察》:目前,市面上的自動駕駛技術在產品化的情況如何?有沒有落地的產品正在運營?
郝佳男:對于整個自動駕駛行業(yè)來說,產品化需要漫長的時間,可能需要2-3年的時間。圖森主要還是為主機廠和Tier1(一級零部件供應商)提供以攝像頭為主、配合毫米波雷達和視覺芯片的、低成本的自動駕駛解決方案。
《汽車觀察》:自長安的無人駕駛路試后,國家開始出臺相關禁止自動駕駛路試的政策,這樣一來,整個研發(fā)自動駕駛技術的企業(yè)又該如何測試自己的技術?如何看待國家有關自動駕駛這方面的政策?
【關鍵詞】虛擬現實 數字媒體 藝術設計
虛擬現實,英文名為Virtual Reality,簡稱VR技術,也稱靈境技術或人工環(huán)境。VR技術領域幾乎是所有發(fā)達國家都在大力研究的前沿領域,它的發(fā)展速度非常迅速。作為一項尖端科技,虛擬現實集成了計算機圖形技術、計算機仿真技術、人工智能、傳感技術、顯示技術、網絡并行處理等技術的最新發(fā)展成果,是一種由計算機生成的高技術模擬系統(tǒng)。這種技術的特點在于計算機產生一種人為虛擬的環(huán)境,這種虛擬的環(huán)境是通過計算機圖形構成的三維數字模型,并編制到計算機中去生成一個以視覺感受為主,也包括聽覺、觸覺的綜合可感知的人工環(huán)境,從而使得在視覺上產生一種沉浸于這個環(huán)境的感覺,可以直接觀察、操作、觸摸、檢測周圍環(huán)境及事物的內在變化,并能與之發(fā)生“交互”作用,使人和計算機很好地“融為一體”,給人一種“身臨其境”的感覺。
一、虛擬現實課程簡介
隨著國內寬帶網絡的普及和多媒體技術的發(fā)展,虛擬現實技術逐漸應用于信息多媒體展示方面。而三維網絡展示系統(tǒng)將是虛擬現實技術未來發(fā)展的重要方向之一,因此全國各高校相繼開設數字媒體藝術設計專業(yè),其中的虛擬現實技術的課程成為國內外教育技術學及媒體傳播領域的研究熱點和發(fā)展趨勢之一,它集成了計算機圖形學、多媒體、人工智能、多傳感器、網絡等技術的最新成果,以其沉浸性、交互性和構想性等無可比擬的優(yōu)點。虛擬現實技術在各行各業(yè)得到了廣泛的應用和重視,比如在教育培訓、城市規(guī)劃、文物保護、游戲娛樂等領域取得了巨大的發(fā)展,市場前景廣闊;同時國家自然科學基金會、國家高技術研究發(fā)展計劃和863計劃等都已將虛擬現實技術列入了研究項目。
虛擬現實課程是以往多個計算機輔助設計軟件的一個綜合運用,課程主要涉及到多個軟件與課程的結合,軟件包含有Photoshop、AutoCad、3dsmax、Virtools 等,涉及課程有建筑制圖、建筑場景漫游、景觀綠地設計等專業(yè)范圍。課程主要運用虛擬現實技術完成一個三維場景的漫游瀏覽系統(tǒng), 使其能夠流暢,完整的再現一個實際的環(huán)境或建筑。其中主要運用virtools 這個軟件來實現交互瀏覽的制作, 這一步驟是整個系統(tǒng)實現人機交互的核心, 最后完成系統(tǒng)的制作并。
二、虛擬現實在國內高校的研究現狀
國內在VR方面有較多研究成果的其他單位有國防科技大學、天津大學、北京理工大學、中國科學院自動化研究所、西北大學、山東大學、大連海事大學和香港中文大學等。
北京航空航天大學計算機系是國內最早進行VR研究的機構之一,他們首先進行了一些基礎知識方面的研究,并著重研究了虛擬世界中物體物理特性的表示與處理,在VR中的視覺接口方面開發(fā)出了部分硬件,并提出了有關算法及實現方法。他們還實現了分布式虛擬世界網絡設計,建立了網上VR研究論壇,可以提供實時三維動態(tài)數據庫,提供VR演示世界,提供用行員訓練的VR系統(tǒng),提供開發(fā)VR系統(tǒng)的開發(fā)平臺,并將要實現與有關單位的遠程連接。
清華大學計算機科學和技術系對VR和臨場感的方面進行了研究,他們還針對室內環(huán)境中水平特征豐富的特點,提出借助圖像變換,使立體視覺圖像中對應水平特征呈現形狀一致性,以利于實現特征匹配,并獲取物體三維結構的新穎算法。
西安交通大學信息工程研究所對VR中的關鍵技術——立體顯示技術——進行了研究。他們在分析人類視覺特性的基礎上提出了一種基于JPEG標準壓縮編碼的新方案,并獲得了較高的壓縮比、信噪比以及解壓速度,并且已經通過實驗結果證明了這種方案的優(yōu)越性。
2004年南京大學成立了南京大學虛擬現實與數字媒體研究中心,對VR技術及應用進行研究,并把重點放在虛擬體育仿真、數字文化遺產保護和自然人機交互等方面。
三、虛擬現實課程開設的重要性
虛擬現實技術是利用計算機生成一個逼真的三維虛擬環(huán)境,并通過傳感設備與之交互的新技術。作為一門新興的學科,它已經被眾多高校納入計算機科學與技術專業(yè)的選修課范疇,但是卻沒有在數字媒體技術專業(yè)中普遍開設。其實無論從技術特點,還是從社會需求來講,虛擬現實技術都與數字媒體技術有著非常密切的關系,具體體現在如下幾個方面。
1) 虛擬現實是一門典型的交叉學科,它所涵蓋的知識結構與數字媒體技術具有非常大相似性,例如計算機圖形學、數字圖像處理、計算機視覺、視音頻技術等。除此之外,它還涉及了仿真技術、人工智能技術、計算機網絡技術、多傳感器技術等內容。虛擬現實強調這些技術的綜合應用。
2) 虛擬現實強調技術創(chuàng)新性和應用創(chuàng)新性。從技術上來講,虛擬現實在不同學科的交叉融合中,能夠不斷產生新思想和新方法,例如近幾年出現的各種人機交互新方法,各種立體顯示新技術等;從應用上來講,虛擬現實具有強烈的“身臨其境”的沉浸感和發(fā)人想象的刺激性。因此,利用虛擬現實技術,學生們能夠將自己的任何創(chuàng)意和想象進行實踐,在虛擬場景中進行規(guī)劃、設計和測試,從而激發(fā)出新的創(chuàng)意。
【關鍵詞】OpenCV;智能視頻監(jiān)控;目標檢測;目標跟蹤
1.引言
近年來,隨著我國職業(yè)院校的不斷發(fā)展,校園建筑面積和規(guī)模逐步擴大,校園的流動人口大量增加,治安形勢錯綜復雜,做好校園的安保工作,僅靠簡單的增加人力和物力,采取常規(guī)的防范措施已經很難適應新形勢的需要。為了加強校園安全防范整體力量,有效保護校園與學生的財產安全,利用先進的科技手段建立一套功能完善、覆蓋范圍廣泛的監(jiān)控系統(tǒng)是維護學生正常學習、生活,創(chuàng)造平安校園的必要條件。
智能視頻監(jiān)控是綜合利用圖像處理、機器視覺和計算機視覺知識進行研究的一個新興的研究方向和備受關注的前沿課題。與傳統(tǒng)的模擬監(jiān)控不同,智能監(jiān)控系統(tǒng)能實時的對攝像機捕捉到的視頻序列進行處理和分析,自動完成動態(tài)目標的檢測、識別和跟蹤,并在此基礎上可以進一步對目標的行為進行分析和理解。本文構建的校園智能視頻監(jiān)控系統(tǒng)利用OpenCV實現了對視頻圖像中動態(tài)目標的行為快速有效地進行監(jiān)控和分析,并實現了對動態(tài)目標的精確跟蹤。
2.OpenCV視覺庫簡介
OpenCV是Intel公司開發(fā)的用于數字圖像處理和計算機視覺的函數庫[1]。它由一系列C函數和少量C++類構成,實現了圖像處理和計算機視覺方面的很多通用算法。OpenCV其源代碼完全開放,運行速度快,由于具有良好的可移植性和統(tǒng)一的結構及其穩(wěn)定性,因此可以縮短系統(tǒng)設計的開發(fā)周期,使系統(tǒng)運行更加穩(wěn)定。
鑒于OpenCV的特點,它主要用于對視頻圖像進行一些高級處理,如人臉識別、動態(tài)跟蹤、圖像分割及人機互動等。
3.校園智能視頻監(jiān)控系統(tǒng)的實現
3.1 系統(tǒng)工作流程
當動態(tài)目標出現在可視范圍內,首先通過背景差分法將前景圖像與背景圖像分離,再對差值進行二值化判斷,利用給定的閾值去除噪聲等干擾后,從場景中檢測出動態(tài)目標。與之前檢測出的目標做特征比對,如果是新目標則加入到跟蹤序列中,如果是舊目標則舍棄。目標跟蹤階段,對跟蹤序列中的目標采用CamShift跟蹤算法,提取目標特征信息,并獲得其運動軌跡,對目標進行實時跟蹤。其關鍵點在于目標的特征信息提取和匹配,這是決定目標跟蹤效果的重大因素。
3.2 動態(tài)目標檢測
動態(tài)目標檢測是校園智能視頻監(jiān)控系統(tǒng)的重要組成部分。動態(tài)目標檢測的主要目的是從視頻圖像中實時的提取出動態(tài)目標并獲得動態(tài)目標的特征信息,如色彩、形狀、輪廓等[2]。動態(tài)目標提取的過程就是在連續(xù)的視頻圖像序列中尋找差異,并把由于目標運動和表現出來的差異提取出來。
動態(tài)目標檢測常用的有四種常用方法:連續(xù)幀間差分法、背景差分法、光流法和運動能量法[3]。由于背景差分法具有實現簡單,運算速度快,因此最常用。它通過當前幀圖像與背景圖像相減并提取出感興趣區(qū)域來檢測動態(tài)目標,固定場景下應用背景差分法進行動態(tài)目標檢測,關鍵在于創(chuàng)建和維護一個可靠的背景。針對這種情況,背景模型應運而生。評價一個好的背景模型,應該從兩個方面進行考慮:第一,背景模型對背景變化的響應速度要足夠快;第二,背景模型對運動目標要有較強的抗干擾能力。
3.2.1 提取前景圖像
假設環(huán)境溫度不變,視頻圖像的背景也不變,當動態(tài)目標出現時.圖像相應像素點的灰度值會發(fā)生明顯的改變,利用圖像減法就可以得到差分灰度圖像[4]。差分灰度圖像包含了動態(tài)目標信息,相對于背景圖像又稱之為前景圖像。相減的結果中每一像素的值和一個預先設定的閾值相比較,若這個像素的值大于閾值,則認為這點是前景圖像,否則是背景圖像。假設利用圖像平均法可得到當前背景圖像BK(x,y),當前的輸入圖像為CK(x,y),則前景圖像DK(x,y)可以表示為當前圖像與背景圖像差的絕對值即:DK(x,y)=|CK(x,y)-BK(x,y)|
3.2.2 差分圖像二值化
選取T為閾值,對差分圖像進行二值化[5]:
1,DK(x,y)≥T
EK=
0,DK(x,y)
其中,EK為進行二值化后的圖像,當差分圖像中像素值大于某一給定的閾值T時,則認為該像素為前景像素,即認為該像素可能為目標上的一點,反之則認為是背景像素。
在OpenCV中,差分圖像的二值化是由函數void cvTheshold實現的。
由于背景差分法受外界光線的變化、背景中含有輕微擾動的對象,如樹枝、樹葉的搖動等的影響,因此對前景圖像還要進行一系列的圖像處理。包括:平滑處理,形態(tài)學膨脹、腐蝕,二值化操作,輪廓提取等。但是并不是所有的輪廓都是由目標產生的,有些是目標的子輪廓或者是噪聲產生的輪廓,因此必須對輪廓進行篩選,淘汰偽目標的輪廓,把目標輪廓篩選出來后加入到跟蹤隊列。
3.3 動態(tài)目標跟蹤
在校園智能視頻監(jiān)控系統(tǒng)中,動態(tài)目標跟蹤起著承上啟下的作用,它是利用圖像處理和計算機視覺等相關技術對視頻圖像序列進行處理和分析,在連續(xù)的圖像序列中找到動態(tài)目標的位置和相關信息,比如動態(tài)目標的速度、形狀等。為了實現該功能,本文采用了OpenCV中的CamShift目標跟蹤算法。它主要通過視頻圖像中動態(tài)目標的顏色信息來達到跟蹤的目的。
3.3.1 CamShift算法簡介
Gary R.Bradski提出的CamShift算法,是以顏色直方圖為目標模式的目標跟蹤算法,是對MeanShift算法的改良,可以有效地解決目標變形和部分遮擋的問題,而且運算效率很高。它的基本思想是將視頻圖像的所有幀做MeanShift運算,將上一幀的運算信息作為搜索窗口的初始值,并將初始值作為對下一幀圖像運算的輸入,進行迭代后實現對動態(tài)目標在每一幀圖像序列中的連續(xù)跟蹤。由于RGB顏色空間對光照亮度變化比較敏感,為了減少光照亮度變化對跟蹤效果的影響,CamShift算法將圖像由RGB顏色空間轉化到HSV顏色模型,方便對動態(tài)目標特征的提取。
3.3.2 CamShift算法實現
在OpenCV庫中,CvCamShiftTracker類就是用來實現CamShift算法的,使得進行二次開發(fā)變得很簡單[7]。
其中,prob_image為目標直方圖的反向投影;Window為初始搜索窗口;criteria為確定窗口搜索停止的準則;comp為生成的結果,包含收斂的搜索窗口坐標(comprect字段)與窗口內部所有像素點的和(comparea字段);box為目標的最小矩形。如果非NULL,則包含目標的尺寸和方向。
利用該函數,在VC++2010開發(fā)環(huán)境下,就很容易實現CamShift算法跟蹤動態(tài)目標。
4.結束語
本文設計的基于OpenCV的校園智能視頻監(jiān)控系統(tǒng),由于其較低的計算復雜度和較高的魯棒性,具有廣闊的應用前景。采用了背景差分法作為動態(tài)目標檢測的方法。檢測是跟蹤的前提,檢測結果的精確性直接影響跟蹤的可靠性。利用CamShift跟蹤算法提取每個動態(tài)目標的顏色特征信息,實現對多個動態(tài)目標的精確跟蹤,最后將動態(tài)目標的輪廓和運動軌跡描述出來。
該系統(tǒng)平臺簡單,大大縮短工作人員的開發(fā)周期,只需根據不同的需要進行簡單的改進,就可以實現多種場合的不同應用。實驗證明,系統(tǒng)運行穩(wěn)定,檢測結果真實可靠,具有較高的精確度。
參考文獻
[1]Gary Bradski,Adrian Kaehler.學習OpenCV[M].北京:清華大學出版社,2009.
[2]譚歆,武岳.基于OpenCV的運動目標檢測方法研究與應用[J].視頻應用與工程,2010,34(S1):184-187.
[3]尹俊超,劉直芳.基于OpenCV的運動目標檢測與跟蹤[J].計算機工程與設計,2011,32(8):2817-2820.
[4]林洪文,姚作,涂丹,李國輝.基于減背景技術的運動目標檢測方法研究[J].國防科技大學學報,2003, 25(3):66-69.
[5]侯宏錄,李寧烏,劉迪迪,陳杰.智能視頻監(jiān)控中運動目標檢測的研究[J].計算機技術與發(fā)展,2012,22(2):49-52.
關鍵詞:機器視覺;三維重建;圖像處理
中圖分類號:TP301
文獻標識碼:A 文章編號:1672-7800(2014)003-0013-02
作者簡介:羅尤春(1989-),男,華中科技大學機械科學與工程學院碩士研究生,研究方向為機器視覺。
1 Marr機器視覺框架
在漫漫進化歷程中,人類和大部分動物通過視覺、聽覺、觸覺等來獲取周圍世界的信息,并通過大腦處理這些信息。而根據調查,人類大腦處理的信息有80%是來自視覺,我們通過雙目感受深度信息,通過對不同頻率光信號進行判別來獲取顏色信息[1]。通過運用攝像機來達到模擬人眼的識別和測量功能,機器視覺成為人工智能研究的重要環(huán)節(jié)。機器視覺區(qū)別于計算機視覺,更偏向于應用,一個機器視覺系統(tǒng)一般通過攝像機之類的光學儀器以圖像的形式獲取周圍世界的信息,通過計算機進行圖像處理和圖像理解,再根據相應的控制程序和機械驅動設備對智能輸出設備發(fā)出操作指令,實現智能控制和操作功能。
早期的機器視覺局限于對二維圖像的分析、識別和理解上[2]。20世紀80年代初,Marr第一次融合圖像處理、神經科學的相關研究,提出了里程碑式的視覺系統(tǒng)框架。具體來說,Marr框架包括三個層次:計算理論層次、表達與算法層次、硬件實現層次。計算理論層次,可以理解為通過對二維圖像的理解來重建三維客觀世界的視覺三維重建理論研究。因為現實世界是復雜多變的,如何建立一種通過二維圖像來實現三維重建的普適性方法成為機器視覺系統(tǒng)中最重要也是終極的目的。Marr提出的這一層次是想通過建立某種普適性模型來獲取客觀世界任何物體的形狀、位置以及運動的信息;表達與算法層次低于計算理論層次,是要解決“軟件”的問題,即如何實現機器視覺系統(tǒng)各個模塊之間信息輸入、輸出和信息表達的問題,亦即各種算法的實現;硬件實現層次可理解為如何組建機器視覺系統(tǒng)的硬件實體設備,與表達與算法層次一起為計算理論層次服務。
Marr提出的視覺框架中研究最多的是計算理論層次和表達與算法層次,分別對應下節(jié)要介紹的三維重建理論和圖像處理。
2 三維重建
視覺三維重建理論是整個視覺領域研究的重點和前沿??陀^世界的物體都是由基本的幾何要素組成的:點、直線、二次曲線等。因此,要實現對客觀世界的描繪,利用這些最基本的幾何要素來組建客觀世界是可以實現的。在很多研究中,通過大量的點對匹配得到三維世界中物體的三維點云模型,從而模擬出真實物體的形狀。在三維重建研究中,立體視覺或稱雙目(多目)視覺是最重要的手段。仿照人眼的原理,要獲得對周圍三維世界的認知,必須知道深度信息,最少需要兩個眼睛。與此同理,立體視覺一般都需要兩個或者多個攝像機同時工作,才能較好地得到周圍世界的三維信息。
2.1 攝像機針孔模型
攝像機的普適模型——針孔模型來源于小孔成像現象。簡單地說,針孔模型是指空間中一點P與攝像機中一特定點C(稱為光心)的連線交攝像機的圖像平面于點p,這個點p便是空間點P的成像點,蘊含了空間點P的幾何信息。從數學的觀點,攝像機的成像模型是一個從三維到二維的映射f:Pp,是一個降維映射,丟失掉了深度信息,即處于光心C—空間點P的直線上任意一點Q的投影也都是p。從數學上可以證明,至少需要兩幅或以上圖像才能重建出空間點P的深度信息zP。
2.2 空間點三維重建
采用兩個不同的攝像機位拍攝空間中同一點P的圖像,分別得到P在左右攝像機圖像平面上的投影點p\-L和p\-R,如果事先知道左右攝像機的相對位置關系——稱為雙目攝像機標定,那么就知道了左右攝像機的光心C\-L和C\-R的位置。簡而言之,雙目視覺系統(tǒng)能夠提供給我們一個坐標系(左或者右攝像機坐標系),在這個坐標系下通過攝像機標定知道兩個光心C\-L和C\-R的位置以及投影點p\-L和p\-R的位置,直線C\-Lp\-L和C\-Rp\-R的交點就是要重建的空間點P。
2.3 空間直線三維重建
空間直線的重建原理和空間點的重建類似,假如要重建空間直線L,得到L在左右攝像機圖像平面上的投影直線l\-L和l\-R,那么左攝像機光心C\-L和左投影l(fā)\-L形成一個平面S\-L,同理右攝像機光心C\-R和右投影l(fā)\-R形成一個平面S\-R,則空間直線L就是平面S\-L和S\-R的相交直線。
2.4 二次曲線三維重建
實二次曲線一般包括橢圓、雙曲線、拋物線和圓[3]。關于二次曲線的三維重建,司少華等[4]在1993年提出了一種特征值的方法,其開創(chuàng)性貢獻在于首先將二次曲線視為一個幾何元素來進行重建,而非利用二次曲線由其上的若干點(至少5個點)決定的原理,更不是利用點云的思想來重建二次曲線。將要重建的對象視作整體而非利用局部元素(點)去擬合逼近的思想是視覺理論更進一步的發(fā)展。圓作為最常見的二次曲線特征被廣泛應用在物體空間定位上[5]。
3 圖像處理
圖像處理是指利用計算機對圖像進行分析,得到需要的信息。所謂圖像,其數學模型即一個二元向量函數f(x,y),其坐標(x,y)表示圖像的橫縱坐標。對于灰度圖像,這個向量函數成為一個標量函數,f(x,y)表示對應平面坐標(x,y)的灰度值。對于彩色圖像,一般使用RGB三原色來表征,即f=[R,G,B]\+T。圖像處理的內容非常豐富,包括了圖像濾波去噪、邊緣檢測、圖像復原、形態(tài)學處理、圖像分割等。其中,為了得到三維重建所必須知道的點、直線、二次曲線等圖像信息,邊緣檢測至關重要。所謂邊緣檢測,目的是要識別出圖像中灰度值變化明顯的圖像點。圖像中突變的位置一般代表了三維世界中的不同屬性?,F有的邊緣檢測算子包括Canny算子[6]、Sobel算子、Prewitt算子、Roberts Cross算子、羅盤算子、Marr-Hildreth算子等。
A=imread('Beach.jpg');
B=rgb2gray(A);
C=edge(B,'canny',0.1);
imshow(C)
4 機器視覺應用及前景
機器視覺技術廣泛應用于機器人、工業(yè)檢測等領域。由于機器視覺系統(tǒng)是一套光學系統(tǒng),因此具有非接觸式測量的優(yōu)點。由于計算機的運算速度不斷刷新紀錄,使得圖像處理效率也不斷提升,運用機器視覺系統(tǒng)能夠為工業(yè)中的不同應用提供實時數據。加載視覺系統(tǒng)的智能機器人不僅擁有靈活、快捷的操作手臂,而且配置了靈敏的攝像機充當“眼睛”,還有超強計算能力的計算機充當“大腦”,真正實現了手—眼—腦同體。在工業(yè)檢測以及測量領域,機器視覺利用自身的獨特優(yōu)勢在質量缺陷、生產監(jiān)控等方面占據了重要地位。機器視覺是一種人工智能技術,在未來的智能化時代,視覺技術必定能成為人機交互的最重要途徑之一。
參考文獻:
[1] 張廣軍.機器視覺[M].北京:科學出版社,2005.
[2] 馬頌德,張正友.計算機視覺:計算理論與算法基礎[M].北京:科學出版社,2003.
[3] 呂林根,許子道.解析幾何[M].北京:高等教育出版社,2006.
[4] 司少華,馬頌德.基于二次曲線的立體視覺[J].自動化學報,1993,19(4):420-427.
關鍵詞:煙葉數字圖像;邊緣處理;形態(tài)學變換;特征抽取;智能識別
1引言
煙葉是煙草工業(yè)的基礎原料, 對煙草工業(yè)生產質量和煙草行業(yè)經營效益具有舉足輕重的作用。對煙葉生產過程的各個環(huán)節(jié)包括煙葉品質的智能識別進行技術創(chuàng)新,提高品質和效率,是一個前沿研究方向[1][5]。
當前這一方面的研究,主要集中在數字圖像處理方面,把煙葉品質的數字圖像處理與神經網絡技術相結合,實現煙葉品質的智能識別,是一個極有價值的工作。以下在此方面作出一個系統(tǒng)的、較為完備的、易于實際操作的研究。
2主要技術手段
2.1 MAⅡAB圖像處理工具箱
在MATLAB平臺上,借助圖像處理工具箱,可以簡易明快地實現對煙葉數字圖像的圖像處理。在煙葉生產一線,用數碼照相機對各種煙葉樣本進行拍照,輸入計算機,用MAT_LAB將它轉換為各(.bmp;.jpeg;.gif;.png;.t 圖片以便進行圖像處理。成本低,精確度高,宜于普及推廣。獲取各種類型的煙葉數字圖像以后,經閾值使用權圖像二值化,可以當即辨識出這一圖像是否具有何種類型的病蟲害或品質異變。利用煙葉數字圖像的邊緣檢測、輪廓提取等分析命令,獲得待測煙葉的圖像參數和特征,再由神經網絡技術,完成對煙葉品質的智能識別。
2.2神經網絡技術
神經網絡是一個新的智能識別工具。畢業(yè)論文 經過訓練的神經網絡能夠存儲與過程有關的信息,能直接從歷史數據中學習,經過用各種煙葉樣本訓練和學習的神經網絡,能自動地識別出待測煙葉樣本的品質類型。而且,神經網絡具有濾除噪聲及在有噪聲情況下得出正確結論的能力。這一點對于煙葉生產實際中大量存在各種噪聲信息的情況而言,特別重要。它特別適合在線識別。
3應用MATLAB圖像處理工具箱和神經網絡技術對煙葉品質智能識別的操作過程
3.1煙葉圖片樣本庫的建立
用數碼相機或其它數字圖像采集工具,采集各種類型的煙葉的標準圖片,分類歸檔,借助MATLAB圖像變換功能,將各種類型的煙葉的標準圖片,轉換成各種圖片形式:.bmp;.jpeg;.sir;.png;.tif等,以便隨時調用。這些煙葉圖片,有不同品質的樣本;還有各種病蟲害標本和變異標本。
3.2用直方圖均衡來實現圖像增強
當從生產一線采集的煙葉待測樣本的圖像對比度較低,碩士論文 即灰度直方圖分布區(qū)間較窄時,可用直方圖均衡實現灰度分布區(qū)間展寬而達到圖像增強的效果。
3.3煙葉圖像的邊緣檢測和特征提取
煙葉圖像的基本特征之一是圖像邊緣。圖像邊緣是圖像周圍像素灰度有階躍性變化或屋頂變化的像素的集合。煙葉的邊緣是由灰度的不連續(xù)性所致,因此考察圖像每個像素在某個鄰域內灰度的變化,利用邊緣鄰近一階或二階方向導數變化規(guī)律可以檢測煙葉圖像邊緣。圖像特征反映煙葉的幾何結構,如面積、周長、分形分維數、孔洞數、歐拉數等等。圖像特征的選擇是圖像識別的重要環(huán)節(jié)。運用二叉分類法在找出判別特征后,對不同的圖像特征由分類閾值按二分的方法進行分類;運用相似距離分類方法把待判圖像與一個標準圖像相比,標準圖像用樣本圖像特征向量的均值來表示。通過計算待判圖像與標準圖像之問的在相空間中的距離來判別圖像和進行分類。這一過程還為用神經網絡技術實現對煙葉品質進行智能識別作出必要的準備。
3.4數字圖像矩陣數據的顯示及其傅立葉
變換這一變換的目的是為提取特征、進行神經網絡模式識別等作出必要的準備。
轉貼于 3.5直方圖均勻化
這是使煙葉圖像性質更為優(yōu)良而采取的一個技術操作,源代碼如下:
I=imread ("yangshuo.tif');imshow (I);
figure,imhist(I);
[J,T]=histeq (I,64);
%圖像灰度擴展到0-255,但是只有64個灰度級
figure,imshow (J);
figure,imhist(J);
figure,Dlot((0:255)/255,T);%轉移函數的變換曲線
J=histeq (I,32);
figure,imshow 0);
%圖像灰度擴展到0~255,但是只有32個灰度級
figure,imhist(J);
3.6采用二維中值濾波函數對受椒鹽噪聲干擾的圖像濾波
MATLA圖像處理工具箱具有強大的功能,能夠對噪聲干擾的煙葉圖片進行消噪處理,模擬源代碼如下:
I=imread ("eight.tif');
imshow (I);
J2=imnoise (I,"salt&pepper ,0.04);
%疊加密度為0.04 的椒鹽噪聲
figure,imshow 02);
I_Filterl=medfdt2 (J2,[3 ,3]);
%窗口大小為3x3
figure.imshow (I Fiher1);
I_Filter 2=medfdt2 (J2,[5, 5]);
%窗口大小為5x5
figure,imshow (I_Filter2);
I_Filter3=medf'dt2 (J2,[7, 7]);
%窗口大小為7x7
figure,imshow (I_Filter3);
3.7用神經網絡技術對煙葉圖像進行智能識別
神經網絡作為一種自適應的模式識別技術,并不需要預選給定有關模式的經驗知識和判別函數,它能通過自身的學習機制自動形成所要求的決策區(qū)域。網絡的我由其拓樸結構、神經元特性、學習和訓練規(guī)則所決定,它可以充分利用狀態(tài)信息,對不同狀態(tài)一一進行訓練而獲得某種映射關系,并且,網絡可以連續(xù)學習,即使環(huán)境變異,這咱映射關系可以自適應調整。在上面各節(jié)獲取煙葉圖像特征基礎之上,可以用神經網絡技術進行圖像模式識別。例如,基于概率神經網絡PNN的煙葉品質智能識別,它的主要優(yōu)點是:快速訓練,訓練時問僅略大于讀取數據時間;無論分類多么復雜,只要有足夠的訓練數據(而這是煙葉生產一線可以做到的),就可以保證獲得貝斯葉準則下的最優(yōu)解,允許增加或減少訓練數據而無需重新進行長時間訓練。這一神經網絡對于煙葉品質的圖像識別,具有重要意義。 4結論
基于計算機視覺和神經網絡技術的煙葉品質識別的數字圖像處理方法,醫(yī)學論文 是煙葉生產環(huán)節(jié)的一種技術創(chuàng)新,它可以在煙葉生產一線普及推廣,簡便易行,能夠較大地提高煙葉品質檢測的效率和質量,以及自動化程度和智能化水平。
參考文獻
[1]于潤偉.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學報,2007,1:122—124.
關鍵詞 智能視頻監(jiān)控;運動目標檢測技術
中圖分類號:TN941 文獻標識碼:A 文章編號:1671-7597(2014)03-0160-02
智能視頻的監(jiān)控指的是:不需要人為干預的情況下,利用視頻、數字圖像處理,分析相關的技術,對視頻中的活動或者監(jiān)控中實時、現在的目標,進行跟蹤與檢測,可對異常的情況,及時做出的反應效果;又可滿足日常的監(jiān)控工作。運動目標的檢測是:用計算方法的視頻以及數字圖像的處理,運動目標的區(qū)域,提取出來的。運動目標,視覺技術分析的第一個步驟是對運動目標的檢測、后續(xù)運動的目標跟蹤、分類、行為分析理解等;作為后續(xù)處理及分析的前提。隨著科技的不斷發(fā)展,社會上一系列安全事件頻繁發(fā)生,視頻監(jiān)控系統(tǒng)無疑是一種安全防范的手段,在諸多方面取得了廣泛應用。然而,傳統(tǒng)的模擬和數字視頻監(jiān)控系統(tǒng)只提供了一個簡單的視頻捕捉、傳輸、存儲、再現等功能。對視頻中的內容也只能靠人為判定,不能主動的向監(jiān)控者提供監(jiān)測信息。屬于視頻圖像序列內的智能視頻監(jiān)控是從中自動對監(jiān)控目標場景進行實時同步分析,并且跟蹤與識別其目標,把信息反饋出來和異?,F象的警報等。所以,在動態(tài)目標檢測是視頻監(jiān)控中的視頻序列的首要任務。一般背景物體的特性應在一段時間內固定的物體,活動物體應該為移動或短時間出現的物體。但是在現實中,由于背景圖像的動態(tài)變化所帶來的諸多影響,運動目標檢測是一個非常困難的工作。
1 運動目標的檢測
1.1 運動目標的檢測是什么
運動目標檢測是指:變化區(qū)域中的部分圖像,從背景圖像序列中被提取出來,使之成為一個有意義的實體。運動目標的檢測是智能監(jiān)控中一個基礎但很關鍵的部分,是實現運動目標跟蹤、在識別與事件監(jiān)測的前提下,運動目標的分割、精確檢測都會影響到運動目標的分類及跟蹤;而目標檢測的好壞將決定后續(xù)處理的效果。
1.2 視頻監(jiān)控系統(tǒng)中運動目標檢測流程
1.2.1 視頻監(jiān)控體系的硬件是怎樣構成的
如今已分為,實時監(jiān)控系統(tǒng)和非實時監(jiān)控系統(tǒng)。實時監(jiān)控系統(tǒng)就是:把攝像頭裝在,需監(jiān)控的場所中合適的位置,隨時監(jiān)控該場景的景象,將其傳輸到監(jiān)控中心,監(jiān)控中心再對信號進行分析、判斷,由于實時的監(jiān)控系統(tǒng)其對計算機的信息處理速度要求高,故而其不能兼顧準確性、實時性,所以實際的行業(yè)應用還是無法得到大范圍推廣。非實時視頻監(jiān)控系統(tǒng)是指對已經存在的“過去時”的視頻進行分析和判斷,是目前視頻監(jiān)控實際應用中的常用方法。
1.2.2 視頻監(jiān)控系統(tǒng)的處理流程是怎樣的
不管是非實時的還是實時的視頻監(jiān)控系統(tǒng),其關鍵所在都是計算機對視頻的處理。視頻監(jiān)控系統(tǒng)對視頻的處理流程主要有5個部分:1)獲取序列圖;2)圖像的預處理;3)目標分割的提?。?)目標的匹配跟蹤;5)目標的行為分析。對視頻進行處理的時,整個系統(tǒng)之基石是如何處理噪聲,處理了噪聲后,將運動目標從圖像中找到,提取出運動目標的信息,然后,計算機通過原目標信息,與提取出運動目標的信息對比,最終,得到目標的真實信息,對運動目標進行檢測。
2 運動目標檢測技術
作為計算機視覺領域中,一項很重要而又很高效的研究方向——運動目標檢測。人們一直都在對運動目標檢測技術進行研究,希望可以研究出一種適應所有普遍場景的運動目標檢測技術,不過因為有著復雜、多樣的監(jiān)控背景的運動目標,可用于各行業(yè)各類監(jiān)控場景的運動目標檢測技術還能大范圍得到應用和推廣。當前只能根據特定的場景和特定少量的運動目標進行智能分析,需要利用不同的檢測方法來進行運動目標檢測。目前,常用的運動目標檢測技術有以下幾種。
2.1 光流法
光流是指:空間運動著的物體,被觀測面上像素點運動的時候,產生瞬時的速度場,其攜帶的信息有:動態(tài)行為及物體表面的結構等。給圖像中各個像素點,一個速度矢量就形成了一個圖像運動場;其運動時用投影將三維物體上的點對應圖像上的點,根據各個像素點、動態(tài)分析和速度矢量計算。這便是光流法檢測運動目標的基本原理。光流計算法由:基于頻域的、匹配的及梯度的光流計算法所組成。
2.1.1 基于頻域的光流計算法
基于頻域的光流計算法是利用速度可調的濾波組輸出頻率或相應的信息,可以獲得高精度的初始光流估計;但其計算非常復雜也很難進行可靠性的評價。
2.1.2 基于匹配的光流計算法
基于匹配的光流計算法又分為基于特征和區(qū)域兩種方法。前者是通過對目標的主要特征進行實時監(jiān)控,不斷進行定位和跟蹤,對大目標的運動和亮度變化的監(jiān)測具有較好的效果,但由于光流的稀疏性使得對特征的提取和匹配難度較大,精確度不高?;趨^(qū)域的方法是指:通過對相似區(qū)域進行的定位以及位移計算光流,此法在視頻編碼中有著上佳效果;不過光流稠密性的計算上仍然存在問題。
2.1.3 基于梯度的光流計算法
基于梯度的光流計算法是利用圖像序列的時空微分來計算光流,它的計算方法簡單,而且在早期的試驗中取得較好的效果,因此目前在廣泛的研究中,但由于在選擇計算光流時需要的可調參數的人工選取和可靠性評價因子上比較困難,即使基于梯度的計算方法雖然在光流估計上取得好的實驗效果,但在利用其對目標進行檢測與自動跟蹤上仍存在問題。
基于光流場,分析的運動目標之檢測方法是根據:各個光流矢量中所包含的各個像素之動態(tài)的信息,精確的計算出運動目標之速度,且還能檢測出,運動目標運動。不過噪聲會影響到光流矢量。所以光流不是單一的,且此法采用的是計算量很大的求解計算,要實時檢測運動目標,需有特殊的硬件支持。所以其多適用于目標運動速度和圖像噪聲均較小的場合。
2.2 背景差值的方法
背景差值的方法是指:常用的運動目標檢測法,運用于靜態(tài)背景下的運動目標檢測。背景差值法的原理是將前幀圖像和已有的背景模型圖像做差,得到的不同部分就作為運動目標的信息。此法的基礎是構造背景模型,常用的背景建模算法是高斯背景建模算法,而且這種算法還可以進行實時更新。背景差值法的優(yōu)點是可以提取出運動目標的完整信息;但視頻監(jiān)控中的場景是真實的場景,會受到很多外在因素環(huán)節(jié)的影響,比如天氣影響、以及噪聲影響等等,這些因素都會影響到運動目標的信息提取,有時甚至會被當成運動目標的信息被提取出來,所以當使用此法時需二次處理才能適用于視頻監(jiān)控系統(tǒng)當中,從而確能保證檢測的效果。
2.3 幀間差分法
幀間差分法是通過對連續(xù)兩幀或多幀的視頻圖像進行相減來得到差分圖像,在差分圖像上檢測運動變化的區(qū)域,再用區(qū)域上的灰度信息恢復之前的運動目標。此法是,在運動目標的檢測中,用得最多的算法之一。計算簡單、檢測目標速度快、自適應性較強、易于實現,是幀間差分法,在檢測運動目標中的優(yōu)點。但缺點是不能檢測到完整的目標,不能對目標進行深入分析和識別,增加后續(xù)處理的難度,容易空洞運動實體內部所產生的現象。
2.4 運動的能量法
運動的能量法是指:把連續(xù)圖像看成三維空間并計算空時梯度。運動的對象經過的位置像素空時梯度的一致性越高,梯度的能量就越大;因此可用來檢測運動目標。此法可以突出相同方向運動的對象,從而有效消除振動、非需的像素點,適合于復雜監(jiān)控環(huán)境。不過此法不能準確分割對象,方法非常復雜,實現難度很大。
2.5 人工的神經網絡
當前,在運動目標的檢測中,基于發(fā)展很快的是人工神經網絡的方法,這種方法通過將每幀圖像分成圖像塊,預處理圖像塊后將影像投到線性濾波器組,得到圖像模式,再把圖像分類,最后判斷運動目標是哪個圖像模式中的,這種方法可以識別出尺度和旋轉變形的目標,獲得的效果較好。
3 結束語
智能視頻監(jiān)控中的運動目標檢測是智能視頻監(jiān)控技術中的一項核心技術,而隨著社會生活和生產的進步和發(fā)展,人們對視頻監(jiān)控將會提出更高的要求,智能視頻監(jiān)控將會在人們的生產和生活中運用的越來越廣泛,作為核心技術之一的運動目標檢測技術將會得到越來越多的關注。因此,應加強對運動目標檢測技術的研究和運用,促進其技術的完善和發(fā)展,從而推動智能視頻監(jiān)控的廣泛運用,推動社會和諧和生活品質的提高。
參考文獻
[1]張正友,馬頌德.計算機視覺[M].北京:科學出版社,2001:53-59.
[2]代科學,李國輝,涂丹,袁見.監(jiān)控視頻運動目標檢測背景技術的究現狀和展望[J].中國圖像圖形學報,2006,11(7):919,927.
[3]李宏,楊延梧,任樸舟,等.基于光流技術的復雜背景下運動目標跟蹤[J].光電工程,2006(10):13-17.
[4]萬衛(wèi)兵,霍宏,趙宇明.智能視頻監(jiān)控中目標檢測與識別[M].上海:上海交通大學出版社,2009.
[關鍵詞]物聯(lián)網 智能視頻技術 現狀和分析
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-914X(2016)05-0358-01
引言
視頻監(jiān)控是物聯(lián)網中的重要組成部分。在以往的安防行業(yè)中視頻監(jiān)控只是其一個重要的應用領域,并沒有將系統(tǒng)、互聯(lián)網這些概念摻雜其中。而隨著我國經濟的不斷發(fā)展,越來越多的領域需要視頻監(jiān)控,從而也將視頻監(jiān)控原本只是安防行業(yè)的傳統(tǒng)狹窄領域給打破,越來越多的新需求也在物聯(lián)網的背景下被人們所提出來。信息的采集點是攝像頭的本質,而編碼設備的本質則在于數字信息化的變化,而將攝像頭和編碼設備進行有效的結合,也就形成的第一步功能的物聯(lián)網。而隨著第一步功能的完成接下來就是全面的IT化互聯(lián)網化,也就是對架構、系統(tǒng)以及技術的IP化[1]。在當下物聯(lián)網的趨勢和背景下,有效的結合IT和安防是必須要做的工作,因此,聯(lián)網對于監(jiān)控來說也是必不可少的。
1.物聯(lián)網中智能視頻的作用和發(fā)展現狀
1.1 智能視頻的發(fā)展作用
隨著我國科技的不斷發(fā)展,全數字化時代已經在視頻監(jiān)控中得到全面使用,也就是當下視頻監(jiān)控系統(tǒng)的網絡化,它是通過標準的TCP/IP協(xié)議而建立的,因此它又叫做IP監(jiān)控系統(tǒng),是在2001年被發(fā)明并使用的。視頻監(jiān)控的數字化的優(yōu)點就在于可以使模擬閉路電視監(jiān)控的局限性得到很好的解決,例如可以在計算機網絡上不受距離限制的傳輸數字化視頻的圖像數據,而且也不會干擾到傳輸信號,使圖像的品質和穩(wěn)定性得到大幅度的提升;視頻監(jiān)控的數字化可以很好的運用計算機網絡進行聯(lián)網,可以重復使用網絡寬帶,而且對于網線的布置上也可以不用重新布置;數字化存儲功能也得以實現,通過對視頻數據的壓縮處理,使其可以有效的在磁盤陣列中得到存儲或者在光盤中得以保存,從而更加方便快捷的進行數據查詢[2]。
在智能化方面,目前的視頻監(jiān)控系統(tǒng)都試圖對攝像機采集的視頻信息上運用計算機視覺技術來進行理解、分析和處理,過濾和排除掉一些無關緊要的信息,報告給監(jiān)控人員處理的都是一些提取出的有用信息,從而讓預警、防范以及主動監(jiān)測等功能得到實現,進而使代替人來進行監(jiān)控任務的目的得以實現。
1.2 智能視頻技術的應用領域
目前,智能視頻技術已經得到了廣泛的應用,很多行業(yè)都開始依賴智能視頻技術來促進行業(yè)的發(fā)展。例如,(1)高級視頻的移動偵測:在雨雪或者大風、大霧等復雜環(huán)境中,可以對一個或者多個物體的動作方向、運動特征等一系列的運動情況做到精準的偵測和識別。(2)物體追蹤:在對移動物體偵測到后,可以結合物體的運動狀況自動的進行控制指令的發(fā)送,從而使的攝像機可以對物體進行自動跟蹤,而當跟蹤物體超出跟蹤范圍后還能自動的對物體所在區(qū)域的攝像機發(fā)出通知,從而讓物體區(qū)域的攝像機進行再次跟蹤和監(jiān)控。(3)識別任務的面部:通過對任務的面部特征進行識別,將人物的面部特征和數據庫進行對比,從而對人物的身份進行識別和驗證。這種面部識別主要分為兩種,一種是需要人物在攝像機面前停留一段時間,在一些門禁系統(tǒng)中比較普遍,還有一種是在一群人中對一些特定的個體進行識別,這種在機場、火車站等安防工作中的運用比較普遍。除此之外還有很多地方都得到了廣泛的應用,如通過對車輛的形狀等信息進行識別、對交通流量進行控制等[3]。
2.智能視頻監(jiān)控技術的技術介紹
所謂的運動目標檢測是從視頻序列的圖像中將目標物體所在區(qū)域給分離出來。在對目標物體進行正確檢測盒識別的基礎上進行后續(xù)工作中的運動目標提取、跟蹤以及行為理解??梢哉f視頻監(jiān)控中運動目標的檢測是前導工作。在運動目標的檢測中主要分為兩種檢測,分別是背景檢測和目標檢測。
當下的背景檢測方法主要有四種:背景模型法、背景統(tǒng)計法、卡爾曼濾波法以及Surendra背景更新算法。背景模型法是建立各個像素點的統(tǒng)計模型,通過對像素點的灰度分別來找出最為符合的概率分布,例如非參數化模型。背景統(tǒng)計法是對像素點的灰度進行統(tǒng)計,在結合其平均值估計背景點的灰度,對劇烈變化的部分進行過濾??柭鼮V波法是通過將灰度的時間序列看成具有噪音的觀測值,結合時域遞歸低通濾波對緩變的實際圖像進行估計[4]。Surendra背景更新算法是對偵察圖像進行計算,得出物體運動的區(qū)域,保持區(qū)域的背景的不變,更新非運動區(qū)域,從而估計背景圖像。
目標檢測算法中光流法、幀間差分法以及背景減法最為常用。光流法是對運動目標的光流特點,通過對光流場進行計算,從而進行運動目標的提取。這種方法在計算上較為復雜,且耗時比較長,對一些實時性檢測很難滿足。幀間差分法對相鄰兩個圖像灰度值存在的差異進行對比進行運動目標的提取。這種方法在計算上較為簡單,也能很好的感應到運動物體區(qū)域的變化,但是會拉伸檢測出的物體運動方向,不能明確的確定運動目標位置,還會去除掉部分運動目標的信息數據,使得運動目標不能被完整的提取出來。背景減法對當前的幀圖像與背景圖像之間的數據進行相減,若某個像素點比域值要大,則這個點出現在運動目標上,目標的位置、形狀以及大小等信息都通過相減的結果而確定。這種方法可以很好的估計和更新出背景,卻對運動物體的定位也非常的精準,但是對一些變化的光照以及環(huán)境非常的敏感[5]。
3.總結
總而言之,物聯(lián)網實現智能交通、智能安防、智能監(jiān)控以及一些其他智能化控制的方法就是物體和物體之間相連的龐大網絡。在物聯(lián)網中最早得到應用的重要技術之一就是智能視頻監(jiān)控。因此,物聯(lián)網能夠直接影響到職能視頻監(jiān)控的發(fā)展。智能視覺監(jiān)控技術所涉及到的諸多領域的研究,屬于綜合性跨學科問題,是非常具有挑戰(zhàn)性的一種前沿課題。當下,對智能視頻技術的相關研究依舊還存在于探索和研究的一個階段,需要大量的工作才能真正的使監(jiān)控技術的智能化得以實現。
參考文獻
[1] 李萬才.物聯(lián)網中智能視頻技術的現狀與分析[J].警察技術,2010,06:8-10.
[2] 沈沛意,楊剛,張亮,肖瀟,張小平,常啟鵬,于公.物聯(lián)網的智能視頻接入終端――高清晰智能相機的研制與應用[J].物聯(lián)網技術,2011,03:41-45.
[3] 朱方,吳莉,陳飛凌,袁衛(wèi)忠.智能視頻監(jiān)控終端在物聯(lián)網中的應用和發(fā)展研究[J].中國電子科學研究院學報,2011,06:561-566.
[4] 奚吉,蔣銀忠.基于物聯(lián)網和視頻分析技術的監(jiān)獄智能監(jiān)控系統(tǒng)[J].電子器件,2014,06:1183-1188.
[5] 雷玉堂.淺析幾種視頻異常事件的智能視頻分析技術與方法[J].中國公共安全,2013,12:129-132+134-136+138+140.
關鍵詞: 自動化; 發(fā)展; 應用
Abstract: The emergence, development and application of automation technology in mechanical manufacture design, the introduction of artificial intelligence technology is introduced in this paper.
Key words: automation; development; application
中圖分類號: TP317 文獻標識碼: A文章編號:
1 自動化的基本概念
何謂“自動化”? 簡單地說,自動化就是在無人的情況下,用各種傳感器執(zhí)行控制功能。它始于人們用機器實現按固定程序自動進行的各種操作,把人類從笨重、單調、重復性的勞動中解放出來。但僅僅如此是不夠的,要進一步解放人力就要求機器不斷提高在不確定或變化的環(huán)境中自動保持必要的功能以達到預定目標的能力。因此,自動化系統(tǒng)必須是開放和可控的,不斷從外界環(huán)境中獲取信息并進行必要的分析、處理、判斷、決策、調整和控制。自動化技術研究的是如何通過各種技術工具和系統(tǒng)( 包括計算機) 延伸人的信息獲取、處理和決策控制的功能,從而更好地進行生產和生活,以提高勞動生產率和生活質量。
2 自動化技術的發(fā)展
具有低層次“自動化”功能的裝置古已有之。我國古代的木牛流馬、指南車、銅壺滴漏,歐洲的鐘表報時裝置和一些手工機械,無一不反映出人類追求自動化的聰明才智。但真正刻意設計出來取代或增強人的智能,從而能在不確定的條件下保證實現預定目標的自動裝置最早應屬木制水輪灌溉系統(tǒng)。其后瓦特發(fā)明的蒸汽機的離心調速器,也自覺地運用了自動原理,從而能在鍋爐壓力和負荷變化的條件下把轉速保持在一定的范圍。20 世紀20 年代,電子信息技術的發(fā)展提供了信息反饋和隨機處理的各種強有力手段,使得自動控制和信息處理技術有了質的飛躍,并逐漸形成了一門新興學科- 自動化。到了五六十年代,數字計算機廣泛的應用大大提高了進行復雜數值計算和簡單邏輯判斷的能力,使得自動化技術真正應用于從工業(yè)生產到航空航天的各個領域。錢學森的“控制論”在此基礎上應運而生,從而為人類自覺地實現自動化奠定了理論基礎。但由于當時的“老式”計算機體積龐大功能不全,所以一些較為復雜的問題,仍然不能得到很好的解決。七八十年代以來,芯片集成技術飛速提升,使計算機擁有了更加全面的功能: 可以高速地對圖象、聲音等各種信息進行存取和運算,可以對數據和符號進行定性、模糊的推理和判斷,可以容許局部出現錯誤或故障而保持整體的優(yōu)良性能。人們可以在這些計算機中存入“專家知識”,使它更善于處理未曾遇到過的問題,例如火星探測車,從而滿足人類無法身臨其境實現的更高要求??傊?,自動化進一步深入發(fā)展和其它一些學科發(fā)展的相互作用,將徹底改變人類的生產結構體系和生活質量體系,成為影響未來社會進程最具影響力的
前沿科學。
3 自動化技術的內容及應用
自動化技術的內容按其理論歸納、技術手段和處理對象的不同,可以大致劃分為控制理論、工程系統(tǒng)與控制、系統(tǒng)科學與系統(tǒng)工程、模式信息處理、智能系統(tǒng)與知識工程,以及機器人學和機器人技術六大部分。
3. 1 控制理論
控制理論研究的是根據被控對象和所處環(huán)境的特性,能動地運用信息施加控制作用而使系統(tǒng)正常運行并達到預定的功能??刂评碚摓榻鉀Q當今社會的許多挑戰(zhàn)性問題發(fā)揮了重大作用,提供了科學的思想方法論,這是人類實現自動化的理論基礎。
3. 2 工程系統(tǒng)與控制
工程系統(tǒng)與控制技術是研究各種工程系統(tǒng)控制和設計的問題。從單一的自動控制裝置到一個生產( 生活) 過程的自動化,直到整個工廠、企業(yè)的控制、管理和經營決策一體化,都是其研究的內容。工程系統(tǒng)與控制技術廣泛應用于生產的各個領域。其中最具影響力的、發(fā)展前景最為可觀的當屬現代集成運行系統(tǒng)。從最廣的意義說,可以包括從企業(yè)長遠規(guī)劃、市場分析、研發(fā)策略、產品規(guī)劃、設計投產、資源分配,到全系統(tǒng)的具體計劃調度、生產活動的全程監(jiān)控、質量控制、產品檢驗,直到銷售服務、市場反饋等整個企業(yè)經營的全過程。這樣一種全盤、綜合自動化的生產過程可以使企業(yè)以更高效高質的服務更好地滿足市場需求,提高企業(yè)效益,增強企業(yè)的市場競爭力。航天工程和具有世界先進水平的中國高速鐵路運行客車是這一現代集成運行系統(tǒng)的最好典范。
3. 3 系統(tǒng)科學與系統(tǒng)工程
系統(tǒng)科學研究的是在最一般意義下,由相互作用、相互聯(lián)系的事物按一定結構組成并具有某種總體功能的各種系統(tǒng)的運動規(guī)律、行為特征以及如何進行設計和控制的問題。它主要應用了運籌學、控制論、信息論等多個學科分支,成為自動化學科的一個重要研究領域并得到蓬勃的發(fā)展。數控機床、無人飛機、探測月球、火星的工程車是這一工程的杰出代表。
3. 4 模式信息處理
模式識別,亦稱模式信息處理,其本來意義是研究用計算機對一般由人類感覺器官接受的圖象、文字、語音等模式信息進行處理、描述和分類的學科。模式識別也可泛指任何對一般事物抽取概念特征進行判斷和分類的過程。模式識別的應用方向包括計算機視覺,文字、文本識別,語音識別和理解等多個領域。中國在模式識別領域正處于世界領先地位,許多中國學者都為此做出了重要貢獻。自動翻譯系統(tǒng),自動識別系統(tǒng)顯示了這一技術廣闊發(fā)展遠景。
3. 5 人工智能
人工智能研究的主要是如何用機器模仿人類智能活動的某些方面,延伸人腦功能的問題。現代科學技術的迅速發(fā)展和重大進步,已經對控制和系統(tǒng)科學提出了新的更高的要求,自動化控制理論正面臨著新的發(fā)展機遇和嚴峻挑戰(zhàn)。傳統(tǒng)控制理論在解決一些具有不確定性、難以構建精確數學模型、復雜多變的問題上遇到了不少難題。這就需要建造出這樣的機器,使它在復雜多變的環(huán)境中,能夠實時應變,靈活判斷、迅速決策以實現更高層次的自動化系統(tǒng)智能控制。簡單地說,自動控制的最高要求就是實現控制系統(tǒng)的智能化。人工智能作為一個前沿科學,發(fā)展極為迅速,最具影響力的分支有“知識表達”的專家系統(tǒng)和“簡單處理器的復雜系統(tǒng)”———人工神經元網絡。這些領域不僅具有深刻的認識論意義,而且在自動控制、信息處理以及將計算機用于判斷決策和問題求解的應用領域里都得到了廣泛的應用,人、機象棋對決,而象棋大師屢屢敗北顯示了這一技術的巨大的生命力。各種自動運行中的車輛、農業(yè)機械、飛機、艦船等都是這一技術應用的主要領域。它也是徹底代替人工完成各種復雜技能的主要工具。
3. 6 機器人學與機器人技術
機器人學與機器人技術是一類特殊的自動化機器,它具有與人的四肢相比擬的運動機構,接受視覺、聽覺、觸覺等傳感信息,在中央處理器( 相當于人腦) 的指揮下完成各種操作功能。機器人不僅可以把人類從惡劣條件、繁重單調的作業(yè)中解放出來,而且在力量、精度和速度,以及在特殊環(huán)境下生存和工作能力各方面都有人類無法替代的優(yōu)點。正因如此,機器人技術在工業(yè)、農業(yè)、國防和科學實驗中得到了日益廣泛的應用,并且有力地推動了相關學科和技術領域的發(fā)展,從而使它成為現代自動化學科中一個活躍而富有魅力的研究領域。戰(zhàn)場上的機器人、惡劣環(huán)境中作業(yè)的機器人是將人類從各個危險領域中徹底解放出來的主要替代者。
【關鍵詞】智能時代;云計算;安全架構
一、前言
當今世界,新一輪的科技革命和產業(yè)變革正在持續(xù)深入,工業(yè)互聯(lián)網、智能制造、人工智能、大數據、物聯(lián)網等領域正在加速布局,“智能時代”企業(yè)信息系統(tǒng)最顯著的變化是虛擬化、數字化一切、軟件定義,促使企業(yè)信息化的不斷發(fā)展,公司信息化資產數量日趨增多、系統(tǒng)的關聯(lián)性和復雜度不斷增強,使企業(yè)信息安全形勢日益嚴峻,信息安全防護工作面臨前所未有的困難和挑戰(zhàn)。為了更好監(jiān)控和保障信息系統(tǒng)運行,及時識別和防范安全風險,同時滿足國家和行業(yè)監(jiān)管要求,保證信息安全管理工作的依法合規(guī),企業(yè)亟需建立一個全數據、集中管理的企業(yè)安全平臺,做到事前預警、事中監(jiān)控、事后分析以及響應,全面的提升信息安全管理與防護水平。
二、智能時代的變化趨勢
我們正處在一個變革的時刻,“智能”是這個時代最顯著的標志。在今年春天首屆世界智能大會上馬云提出,智能時代有三個最主要的要素:互聯(lián)網、大數據、云計算;李彥宏也指出,未來30年推動社會進步的動力,就是智能科技的進步;浪潮董事長孫丕恕表示,智能從實現形式上就是要通過物聯(lián)網、互聯(lián)網將企業(yè)生產數據、互聯(lián)網數據和企業(yè)自身的管理數據全部打通,實現無邊界信息流和大數據分析。由此看來,一個企業(yè)走向智能化首先要完成業(yè)務在線化和流程服務軟件化,然后完成應用軟件的SaaS(Software-as-a-Service)化,從而助企業(yè)實現智能生產、智能維護、智慧服務。1.安全技術的變化基于云計算、虛擬化、大數據、智能制造、移動辦公的持續(xù)推進,都是基于企業(yè)信息基礎架構所實施的,開放式計算環(huán)境和更靈活的支持架構,要求安全技術隨之匹配發(fā)展,才能適應新環(huán)境,新技術下的安全需求。中國工程院倪光南院士在《云安全的思考》主題演講中指出,云安全一定會呈現出多維度、多層次、跨領域、多學科技術交叉等方面的特征。對于云計算的安全保護,需要一個完備體系,從技術、監(jiān)管、法律三個層面上,形成可感知、可預防的智能云安全體系。2.企業(yè)智能架構從應用架構上看,未來的應用都是角色化、場景化的,可連接互聯(lián)網資源,全員應用,實現移動化和智能化。虛擬化、數字化一切、軟件定義促使企業(yè)信息架構的變革,以業(yè)務為導向和驅動,在企業(yè)管理、集成等方向上提供基礎共性平臺,為企業(yè)快速構建和集成應用軟件提供基礎支持,從而實現工程經驗模塊化、產品實際協(xié)同化、項目流程一體化結構,實現由統(tǒng)一業(yè)務層、統(tǒng)一界面構架層、應用系統(tǒng)層、統(tǒng)一工作臺面、大數據分析、云計算層組成的一種新模式。在企業(yè)IT系統(tǒng)的業(yè)務基礎機構層面,引入先進的統(tǒng)一軟件平臺,為上層應用開發(fā)提供統(tǒng)一標準,接口和規(guī)范,同時基于“平臺+組件”的架構實現各類應用的組合和復用,助企業(yè)實現數字化轉型。3.云架構在人工智能一日千里的時代,云計算已成為產業(yè)革新的原動力、新型管理的主平臺、人工智能的強載體。在新的云時代,整個社會都在發(fā)生數字化的迭代。云成為數字化最重要的基礎架構。騰訊董事局主席兼首席執(zhí)行官馬化騰指出:“用云量將成為一個重要的經濟指標,能夠衡量一個行業(yè)數字經濟發(fā)展程度?!彼€表示:“傳統(tǒng)企業(yè)的未來就是在云端用人工智能處理大數據?!薄霸?AI”是當前最主流的方向,其核心包括三項核心能力(計算機視覺、智能語音識別、自然語言處理)。在計算機視覺領域實現開放OCR識別、人臉核身、圖片處理等多項智能云服務;在智能語音識別領域實現語音轉文字、語音合成、聲紋識別、情緒識別等功能;在自然語言處理領域,以“數據+算法+系統(tǒng)”為核心,提供毫秒級響應的個性化服務。
三、企業(yè)信息安全措施
VMware首席執(zhí)行官帕特•基辛格表示:“抵御安全攻擊,響應速度不是核心,而是如何將支離破碎的安全保護進行更有效的整合,實現安全架構的簡化,這才是企業(yè)安全轉型的關鍵。”安全技術在智能時代必須跟上發(fā)展的變化,“智慧安全”的理念正在深入,著力點從網絡系統(tǒng)安全、數據安全深入到業(yè)務應用安全等各個層面,AI防火墻、態(tài)勢感知平臺、云安全產品、企業(yè)移動化信息安全管理平臺、智慧眼監(jiān)控雷達、業(yè)務應用安全審計平臺成為保護企業(yè)信息安全的前沿技術。1.企業(yè)數據的安全阿里巴巴董事局主席馬云說:“數據是新能源?!彪S著數據量的持續(xù)增長,應用數量不斷增加,數據將成為社會創(chuàng)新的重要驅動力。隨著“網絡強國戰(zhàn)略”、“互聯(lián)網+”行動計劃、大數據戰(zhàn)略的推進,網絡安全風險和威脅也進入到企業(yè):非對稱的業(yè)務流量、定制化的應用程序、需要被路由到計算層之外并達到數據中心周邊的高流量數據、跨多個虛擬化應用,以及地理上分散的移動應用,都造成數據泄露的機會,隨著中央網絡安全和信息化領導小組的成立,信息安全已上升到國家安全層面。因此數據保護十分重要,最好的選擇是本源的防護,既做到保護數據本源的同時,又能靈活應對各種安全環(huán)境的需求。而符合這種要求的安全技術就是基于專業(yè)的安全分析模型和大數據管理工具,可準確、高效地感知整個網絡的安全狀態(tài)以及變化趨勢,通過企業(yè)本地部署安全大數據分析平臺,打通云端情報與本地設備的聯(lián)動,形成情報觸發(fā)預警,預警觸發(fā)防護的閉環(huán)。對外部的攻擊與危害行為可以及時的發(fā)現,并采取相應的響應措施,保障企業(yè)信息系統(tǒng)安全。2.企業(yè)網絡安全2016年,在“4.19講話”中再一次強調網絡安全建設的重要性,并提出:“要樹立正確的網絡安全觀,加快構建關鍵信息基礎設施安全保障體系,全天候全方位感知網絡安全態(tài)勢,增強網絡安全防御能力和威懾能力,要加快網絡立法進程,完善依法監(jiān)管措施,化解網絡風險。此外根據網絡安全法相關規(guī)定,我們也可以看出,網絡安全法在原有信息系統(tǒng)安全等級保護制度的基礎上,創(chuàng)新了網絡安全等級保護的工作方法,企業(yè)的信息安全建設需在原有信息系統(tǒng)安全等級保護制度建設的基礎上,將新技術新應用帶來的重要信息系統(tǒng)建設諸如云計算、移動互聯(lián)、物聯(lián)網、工業(yè)控制、大數據等領域的國家關鍵信息基礎設施建設都納入國家安全等級保護制度進行管理,將風險評估、安全監(jiān)測、通報預警、應急演練、災難備份、自主可控等重點措施也納入了國家網絡安全等級保護制度的管理范疇。企業(yè)緊跟網絡技術的發(fā)展,以“智慧安全2.0戰(zhàn)略”為指導,將“智慧安全”的核心從網絡系統(tǒng)安全、數據安全深入到業(yè)務應用安全等各個層面?,F在已可以采用AI、機器學習、行為分析等技術手段進行動態(tài)分析、靜態(tài)分析、異常檢測、深度解析等手段,更有效地防范未知威脅。3.物聯(lián)網安全預計到2021年,全球將有超過460億臺設備,傳感器和執(zhí)行器連接在一起,更廣闊,更強大和更穩(wěn)定的物聯(lián)網時代即將到來,并且最終將給企業(yè)帶來全新業(yè)務方式。物聯(lián)網(IoT)為企業(yè)創(chuàng)新提供了廣闊的前景。企業(yè)通過監(jiān)控、分析收集來的數據量,來確保業(yè)務的正常發(fā)展。其中數據大都是從傳感器、應用、門禁系統(tǒng)、配電單元、UPS、發(fā)電機和太陽能電池板產生的數據,但隨著這些應用的增長,物聯(lián)網帶給企業(yè)的安全風險也很大。要應對物聯(lián)網的安全挑戰(zhàn),企業(yè)應從智能設備的離線安全、入網安全、在線安全等維度進行整體安全檢測與防護,在云端接入大數據感知威脅和安全態(tài)勢分析平臺,獲取威脅情報;在本地端通過減少威脅“檢測時間(TTD)”,即減少發(fā)生威脅到發(fā)現威脅的時間差,縮短檢測時間,可有效限制攻擊者的操作空間,和最大限度減少損失。①及時更新基礎設施和應用,讓攻擊者無法利用公開的漏洞;②利用集成防御對抗復雜性,采取平衡防御與主動應對的安全控制;③密切監(jiān)控網絡流量(這在網絡流量模式可預測性非常高的IoT環(huán)境中非常重要);④追蹤物聯(lián)網設備如何接觸網絡并與其他設備進行交互(例如,如果物聯(lián)網設備正在掃描其他設備,則可能是表示惡意活動的紅色警報)。
四、結論
神州控股董事局主席郭為對未來的預測時說:“云計算將成為未來主流IT運算模式,大數據會成為最重要核心資源;自上而下的創(chuàng)新將是智能時代推動社會進步的主流方式,借助云計算、大數據這兩項關鍵技術實現互聯(lián)網化、協(xié)同化和智能化。”智能是我們這個時代的標志,對于企業(yè)信息化來說,它的路很長,首先要完成核心業(yè)務在線化和所有的業(yè)務流程服務軟件化,然后完成應用軟件的SaaS(Soft-as-a-Service)化,當企業(yè)的核心業(yè)務完全建立在互聯(lián)網上,并有軟件SaaS平臺驅動,企業(yè)才能夠向智能化方向演進——低成本積累大數據,并通過數據分析進行商業(yè)決策,最終向實時數據分析、實時智能商業(yè)決策演進。由此,企業(yè)信息智能化任重道遠,從現在開始制定適當的安全策略,以此加快IT新趨勢的適應能力,在不斷采用新技術的過程中建立適合企業(yè)的安全管理系統(tǒng),做到覆蓋企業(yè)安全運維的所有場景,監(jiān)視安全威脅,預測安全風險。
參考文獻
[1]維克多•邁克熱•舍恩伯格.大數據時代:生活、工作與思維的大變革[M].浙江人民出版社.