公務(wù)員期刊網(wǎng) 精選范文 計算機視覺研究現(xiàn)狀范文

計算機視覺研究現(xiàn)狀精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺研究現(xiàn)狀主題范文,僅供參考,歡迎閱讀并收藏。

計算機視覺研究現(xiàn)狀

第1篇:計算機視覺研究現(xiàn)狀范文

1計算機視覺概述

1.1計算機視覺學(xué)概述

從某種意義上說,計算機視覺學(xué)是一門在20世紀60年代興起的新學(xué)科。它是一門邊緣學(xué)科,融入了很多學(xué)科的特點,具有很強的工程性特征。比如,圖像處理、應(yīng)用數(shù)學(xué)、光電技術(shù)。換個角度來說,計算機視覺同屬于工程領(lǐng)域、科學(xué)領(lǐng)域。

1.2計算機視覺的應(yīng)用

計算機視覺的應(yīng)用能夠使計算機具有和人一樣的視覺功能。在生活和生產(chǎn)過程中,照片資料、視頻資料的處理是計算機視覺應(yīng)用的主要方面。比如,在航空事業(yè)方面,對衛(wèi)星照片的翻譯;在醫(yī)學(xué)領(lǐng)域中,主要用于輔方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復(fù)雜因素的影響,計算機視覺在這方面的應(yīng)用顯得特別簡單,有利于相關(guān)系統(tǒng)的實際構(gòu)成。

2目標圖像檢索存在的問題

從某種角度來說,目標圖像檢索需要分為特征匹配、特征提取兩個方面。它們表達了不同的含義。對于特征提取來說,它是圖像進行檢索的第一步,其提取結(jié)果會對進一步的研究造成直接的影響。而對于特征匹配來說,其匹配的準確度會直接影響圖像檢索系統(tǒng)的返回結(jié)果。但在目標圖像檢索完善的過程中,遇到一些問題阻礙了這兩個方面的完善。因此,本文作者對其中的一些予以了相關(guān)的探討。

2.1環(huán)境因素不斷變化

對于目標圖像來說,環(huán)境因素是影響其準確率的重要因素。同時,在復(fù)雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標圖像區(qū)域被遮蓋,致使目標圖像信息不夠全面,使目標物體特征的提取難度進一步加大。

2.2圖像噪聲的影響

子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫中的圖像也會隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會使目標物體的外觀發(fā)生對應(yīng)的變化。在此基礎(chǔ)上,嚴重降低了目標圖像信息獲取的準確度。

2.3目標圖像檢索訓(xùn)練數(shù)據(jù)的自動標注

由于處于網(wǎng)絡(luò)中的圖像資源信息過于繁多,需要采用手工的方式對它們進行標注。但這種方法非常浪費時間,準確率也比較低。很顯然,這就需要目標檢索圖像能夠具有自動標注的能力。實際上,圖像檢索方法過分依賴人工標注信息。而這些信息很多收到來自各方面因素的影響。比如,認識差異因素、個人經(jīng)驗。以至于對圖像產(chǎn)生誤解。

3基于計算機視覺下的目標圖像檢索技術(shù)

3.1以多尺度視覺為紐帶的目標圖像檢索方法

該種目標檢索技術(shù)的應(yīng)用主要是為了提高目標圖像檢索的準確率,能夠?qū)崿F(xiàn)目標圖像訓(xùn)練數(shù)據(jù)的自動化標注。該類技術(shù)主要是用于那些沒有遮擋,不需要進行監(jiān)督的目標圖像檢索方面。具體來說,它需要經(jīng)過一系列的訓(xùn)練。在訓(xùn)練的過程中,以統(tǒng)計學(xué)習為紐帶,對相應(yīng)多尺度的目標檢測模型進行適當?shù)挠?xùn)練。在此基礎(chǔ)上,以該模型為基點,對圖像中那些顯著性的區(qū)域進行合理地提取。比如,該區(qū)域的亮度、顏色。最后,需要對用于該實驗研究中的概率潛在語義分析模型進行合理地利用??傊眠@種檢索方法可以對圖像中那些顯著目標所處的區(qū)域自動進行檢測。同時,對其中目標圖像的顯著性進行合理地排序,能夠提高檢索引擎所返回圖像結(jié)果的準確度。

3.2以彩色LBP局部紋理特點為媒介的目標圖像檢索方法

這種目標圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關(guān)因素對所提取紋理特征的影響,提高了圖像目標的準確率。對于這種圖像目標檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機地相融合。在此基礎(chǔ)上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉(zhuǎn)特點。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時,這種目標圖像檢索方法的應(yīng)用可以使對應(yīng)計算方法的難度得以降低,還能對角度等變化狀態(tài)下的目標圖像進行準確地識別以及檢索。

3.3以視覺一致性為橋梁的目標圖像檢索方法

從某個角度來說,它的應(yīng)用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結(jié)果的目標顯著圖予以準確的計算。此外,還要對其中的目標顯著系數(shù)進行適當?shù)剡^濾。二是:以所有圖像為基點,以顯著目標為導(dǎo)向,采取視覺一致性的模式。三是:以視覺一致性為基礎(chǔ),對其中的不同目標圖像信息進行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結(jié)果的準確率。更重要的是,在提高圖像搜索引擎檢索性能的同時,能夠及時為用戶選出最優(yōu)的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關(guān)。

4結(jié)語

第2篇:計算機視覺研究現(xiàn)狀范文

關(guān)鍵詞:數(shù)字圖像處理;測距;聚焦;頻域

中圖分類號:TP391.41 文獻標識碼:A 文章編號:2095-1302(2012)09-0016-03

Images ranging method based on frequency domain analysis

ZHU Xue-yi

(School of Microelectronics and Solid-State Electronics, University of Electronic Science and Technology, Chengdu 610054, China)

Abstract: Using digital image processing theories and methods, the digital image pre-processing mode, the target graphic detection and the ranging model construction are studied and analyzed. Combined with a ranging scheme of single camera, a focusing ranging technique based on frequency domain analysis is given to process images captured by the monocular camera and calculate the distance from target detection image to the camera based on frequency domain image signals. The technique saves lots of complex hardware and reduces the demands of digital image processing, which has the advantages of high ranging precision and fast processing speed.

Keywords: digital image processing; ranging; focusing; frequency domain

0 引 言

視覺是人類觀察世界、認知世界的重要功能手段,人類感知外部世界主要通過視覺、觸覺、聽覺和嗅覺等感覺器官,其中80%的信息是由視覺獲取的。計算機視覺就是人類利用計算機實現(xiàn)人的視覺功能,從而對客觀世界三維場景進行感知、識別和理解。計算機視覺是一個相當新而且發(fā)展迅速的研究領(lǐng)域。

在對生物視覺系統(tǒng)的研究中,人們早就注意到,幾乎所有具有視覺功能的生物都有兩只眼睛。用兩只眼睛同時觀察物體,會有深度或遠近的感覺,我們稱之為視差。因此,在計算機視覺系統(tǒng)中,也常用兩臺或多臺攝像機從兩個或多個視點去觀察同一場景,從而獲得在不同視角下的一組圖像,然后通過同一場景點在不同圖像中的視差,推斷出場景中目標物體的空間幾何形狀和位置,這種方法稱為立體視覺。它是計算機視覺的一個重要分支,也是計算機視覺的核心研究內(nèi)容之一。

視頻和圖像是對物質(zhì)世界客觀事物的形象而生動的描述,是最直接且具體的信息表達形式之一,是人類最重要的信息載體。隨著科技的日益發(fā)展,人們需要一種更加先進快捷的工作方式,另外,人們對工作環(huán)境和工作條件也提出了更新、更高的要求,視頻測距系統(tǒng)便在這種背景下應(yīng)運而生。

視覺測距技術(shù)的發(fā)展對于距離測量有重要的意義。在基于數(shù)字圖像處理技術(shù)的視覺測距系統(tǒng)中,使用單個CCD(Charge Couple Device)攝像機的系統(tǒng)稱為單目攝像系統(tǒng),而同時使用兩臺攝像機對同一景物進行攝像,并運用計算機分析兩幅圖像來確定物體的三維狀況的系統(tǒng)稱為雙目攝像系統(tǒng)。雙目攝像系統(tǒng)測量精度高,但計算速度較慢,成本較高。而單目攝像系統(tǒng)方法則比較簡潔、快速,因此,本文對采用單目攝像系統(tǒng)檢測目標物的測距方法進行研究。

1 測距技術(shù)在國內(nèi)外的研究現(xiàn)狀

目前,國內(nèi)外對視覺測距技術(shù)的研究仍在不斷的進行之中,還并沒有形成國際統(tǒng)一的標準模式,各種數(shù)字圖像處理技術(shù)和算法之間孰優(yōu)孰劣仍在不斷的探討和比較中。當前,國內(nèi)外的研究機構(gòu)主要研究的測距技術(shù)包括超聲波測距技術(shù)、微波雷達測距技術(shù)、激光雷達測距技術(shù)和視覺測距技術(shù)。

1.1 激光雷達測距

激光雷達測距具有測量時間短、量程長、精度高等特點,但激光雷達在惡劣天氣環(huán)境下或逆光狀態(tài)下的測距準確性降低,另外,其造價、耗能、對人眼安全等因素也對其進一步應(yīng)用有一定影響。

1.2 超聲波測距

超聲波是指振動頻率在20 kHz以上的機械波,具有聲波傳輸?shù)幕疚锢硖匦?。超聲波測距是根據(jù)超聲波反射時間來計算與前方車輛之間的距離。超聲波測距原理比較簡單,成本低,但超聲波的傳輸速度受天氣影響較大,不同天氣條件下的傳輸速度不同。

第3篇:計算機視覺研究現(xiàn)狀范文

為了加快我國城鄉(xiāng)一體化進程建設(shè),農(nóng)業(yè)機械自動化的地位變得越來越重要。但是由于我國農(nóng)業(yè)人口多,以及長期以來經(jīng)濟技術(shù)落后的現(xiàn)狀,使得我國農(nóng)業(yè)機械自動化在發(fā)展的過程中依舊面臨著較大的難題。就目前的情況來看,我國農(nóng)業(yè)機械自動化技術(shù)的水平,與西方國家相比還有很大的差距。所以,如何促進農(nóng)業(yè)機械自動化技術(shù)的發(fā)展,以及對農(nóng)業(yè)機械自動化技術(shù)進行優(yōu)化,已經(jīng)成為解決三農(nóng)問題的關(guān)鍵。本文從農(nóng)業(yè)機械自動化對農(nóng)村建設(shè)的意義出發(fā),對農(nóng)業(yè)機械的分類做了相關(guān)的介紹,并指出了農(nóng)業(yè)機械化技術(shù)發(fā)展中存在的問題,最后對農(nóng)業(yè)機械自動化技術(shù)要點及優(yōu)化應(yīng)用措施提供了建議。

關(guān)鍵詞:

農(nóng)業(yè)機械自動化;技術(shù)要點;優(yōu)化措施

0引言

所謂農(nóng)業(yè)機械自動化技術(shù),指的是將控制論、計算機技術(shù)、液氣壓技術(shù)等應(yīng)用到農(nóng)業(yè)機械的設(shè)計當中,使農(nóng)業(yè)機械可以獨立完成田間耕作。隨著科學(xué)技術(shù)的不斷發(fā)展以及為了響應(yīng)政府高效農(nóng)業(yè)的號召,我國農(nóng)業(yè)正逐步朝著機械自動化的方向發(fā)展。農(nóng)業(yè)機械的自動化,不僅能夠使勞動的生產(chǎn)效率得到提高,還能減輕農(nóng)民的勞動強度,并且提高勞動舒適度,在一定程度上緩解農(nóng)村勞動力短缺的問題。在科技高速發(fā)展的今天,世界各國都加大了對農(nóng)業(yè)機械自動化技術(shù)的研究。很多科研成果已經(jīng)從實驗室走向了實用階段。

1農(nóng)業(yè)機械自動化對農(nóng)村建設(shè)的意義

對社會主義新農(nóng)村進行建設(shè),是我國構(gòu)建社會主義和諧社會的基本要求。社會主義的和諧與廣大農(nóng)村地區(qū)的和諧是不可分割的。雖然從整體上看,社會主義新農(nóng)村處于較為穩(wěn)定和諧的狀態(tài),但不可否認的是,社會主義新農(nóng)村的建設(shè)也存在著一定的問題。其中,最主要的問題是農(nóng)民收入過低。因此,我國要大力推行農(nóng)業(yè)機械自動化建設(shè),為減輕農(nóng)民的勞動強度、提高農(nóng)民的經(jīng)濟收入提供保障。

2農(nóng)業(yè)機械的分類

通常來說,農(nóng)業(yè)機械是由動力設(shè)備和與之配套的農(nóng)機器具組成的。這兩者之間主要是以牽引懸掛或者是半懸掛的方式進行連接。也有的農(nóng)業(yè)機械將這兩者制造成一個統(tǒng)一的整體。動力設(shè)備和與之配套的農(nóng)機器具這兩者在耕作的過程中,互相配合,缺一不可。

3農(nóng)業(yè)機械自動化發(fā)展中存在的問題

我國農(nóng)業(yè)機械技術(shù)在發(fā)展的過程中,并不是一帆風順的,而是遇到了很多問題。首先,我國大型農(nóng)業(yè)自動化機械在推廣的過程中難度較大。很多農(nóng)民沒有意識到機械化生產(chǎn)的重要性,導(dǎo)致了他們不愿意在農(nóng)業(yè)生產(chǎn)的機械方面進行投入,最終造成了我國大型農(nóng)業(yè)自動化機械供大于求的尷尬。第二,我國的農(nóng)業(yè)機械制造水平較低。與西方國家相比,我國農(nóng)業(yè)機械制造的起步較晚,在很多方面,科技水平還不夠成熟。第三,我國對農(nóng)業(yè)機械自動化技術(shù)的研究缺乏足夠的動力。我國大型農(nóng)業(yè)機械的制造企業(yè),以及科院院所存在著資金不足、科研環(huán)境較差的問題。對農(nóng)業(yè)機械進行設(shè)計,不僅需要耗費大量的時間和精力,還需要一定的技術(shù)條件作為依托。我國大部分科研院所和農(nóng)業(yè)機械制造企業(yè),由于資金不足,并沒有完成對實驗室的配套建設(shè),使得科研人員在進行工作時困難重重,這一現(xiàn)狀也嚴重影響了科研人員的工作積極性。第四,自動化技術(shù)在農(nóng)業(yè)機械的應(yīng)用中還處于起步階段。對自動化技術(shù)的應(yīng)用,需要很高的科技水平作為依托,但是我國科技基礎(chǔ)薄弱的現(xiàn)實,使自動化技術(shù)的應(yīng)用變得困難。

4農(nóng)業(yè)機械自動化技術(shù)要點及優(yōu)化應(yīng)用措施

4.1實現(xiàn)計算機技術(shù)應(yīng)用于農(nóng)業(yè)生產(chǎn)

計算機視覺技術(shù),作為新時期重點研究和應(yīng)用性廣泛的新科技,很多西方國家先后展開了對計算機視覺技術(shù)的研究。計算機視覺技術(shù)在農(nóng)產(chǎn)品質(zhì)量的鑒定方面,以及在記錄農(nóng)產(chǎn)品生長的信息等方面有著十分重要的作用。英國對計算機視覺技術(shù)的應(yīng)用進行了首次嘗試,利用該技術(shù)研制了專業(yè)性的采蘑菇機器人。采蘑菇機器人在采蘑菇的過程中,不僅能夠?qū)δ⒐降奈恢眠M行精準的定位,而且能夠?qū)λ傻哪⒐竭M行合理化的分類。受到英國的影響和啟發(fā),我國國內(nèi)也開始嘗試在農(nóng)業(yè)機械自動化技術(shù)中,加入計算機控制技術(shù)的內(nèi)容。但是由于我國的經(jīng)濟技術(shù)發(fā)展還不夠成熟,要實現(xiàn)對計算機視覺技術(shù)的應(yīng)用,還需要科學(xué)家們進行努力。

4.2實現(xiàn)農(nóng)業(yè)施肥和灌溉技術(shù)的自動化

我國水資源總量雖然比較大,但是人均資源占有量卻很小,而且我國水資源分配的不夠合理,使得我國水資源長期處于短缺的狀態(tài)。要促進農(nóng)業(yè)的發(fā)展,充足的水資源是必要的條件。在保證農(nóng)業(yè)生產(chǎn)用水的同時,保證對水資源的節(jié)約,是我國農(nóng)業(yè)發(fā)展過程中必須要面對的問題。農(nóng)業(yè)自動化灌溉技術(shù)的應(yīng)用可以很好地解決這一問題。所謂農(nóng)業(yè)自動化灌溉技術(shù),是把傳感器與電子計算機進行有機結(jié)合,把農(nóng)作物生長過程中對環(huán)境的需求及對用水量的需求,通過軟件的形式加以呈現(xiàn),從而避免水資源的浪費。對農(nóng)業(yè)施肥技術(shù)來說也是如此,實現(xiàn)農(nóng)業(yè)施肥和灌溉技術(shù)的自動化,是節(jié)約水資源、降低農(nóng)業(yè)生產(chǎn)成本、避免浪費以及保護環(huán)境的必然選擇。

4.3實現(xiàn)農(nóng)業(yè)的精準化

農(nóng)業(yè)精準化是指將我國的傳統(tǒng)農(nóng)業(yè)與農(nóng)業(yè)機械自動化技術(shù)相結(jié)合,實現(xiàn)農(nóng)業(yè)生產(chǎn)管理的科技化。精準農(nóng)業(yè)是未來農(nóng)業(yè)發(fā)展的主要方向之一。農(nóng)業(yè)生產(chǎn)自動化,是一項以計算機網(wǎng)絡(luò)和控制器等為基礎(chǔ)的技術(shù)。我國對精準農(nóng)業(yè)的研究,已經(jīng)取得了一定的科技成果。世界上第一臺觀測農(nóng)業(yè)氣象的自動化儀器,已經(jīng)在我國鄭州氣象站開始投入使用。農(nóng)業(yè)氣象觀測儀,可以對農(nóng)業(yè)生產(chǎn)的小環(huán)境進行合理化監(jiān)測,并且通過網(wǎng)絡(luò)把監(jiān)測到的信息及時反映給當?shù)剞r(nóng)業(yè)部門。

總之,在經(jīng)濟全球化進程不斷加快和城市化進程高速發(fā)展的今天,給各個行業(yè)帶來機遇的同時,也帶來了挑戰(zhàn)。為了在經(jīng)濟發(fā)展的大潮中處于不敗的地位,加強科技創(chuàng)新是一項必不可少的選擇,同時也是長遠發(fā)展的根本要求。對于農(nóng)業(yè)產(chǎn)業(yè)而言,為了使我國農(nóng)業(yè)能夠更好更快的發(fā)展,政府要提高對農(nóng)業(yè)機械自動化技術(shù)研究的投入,并將新的科技成果不斷應(yīng)用到農(nóng)業(yè)生產(chǎn)中。作為科技工作者要努力鉆研農(nóng)業(yè)機械自動化技術(shù),并且要對農(nóng)業(yè)機械自動化技術(shù)的應(yīng)用措施進行優(yōu)化,從而實現(xiàn)農(nóng)業(yè)的智能化時代,創(chuàng)造出我國農(nóng)科發(fā)展的新道路。

作者:楊亞杰 單位:河北農(nóng)業(yè)大學(xué)

參考文獻:

[1]劉洋.我國農(nóng)業(yè)機械自動化應(yīng)用現(xiàn)狀和推進模式探討[J].化工中間體,2015(11):11-19.

第4篇:計算機視覺研究現(xiàn)狀范文

關(guān)鍵詞:數(shù)字攝影測量;影像匹配;影像匹配分類;匹配策略

中圖分類號: P216 文獻標識碼: A

1.前言

影像匹配是數(shù)字攝影測量的典型問題之一。在航空攝影測量領(lǐng)域,影像匹配是自動獲取數(shù)字地面模型(DTM)的關(guān)鍵技術(shù),是以影像匹配代替?zhèn)鹘y(tǒng)的人工觀測,來達到自動確定同名點的目的。一般來說,由于影像在不同時間、不同傳感器、不同視角獲得的成像條件不同,因此即使是對同一物體,在影像中所表現(xiàn)出來的幾何特性、光學(xué)特性、空間位置都會有很大的不同,如果考慮到噪聲、干擾等影響會使影像發(fā)生很大差異,影像匹配就是通過這些不同之處找到它們的相同點。在計算機視覺中,通常稱為影像配準,而且很多領(lǐng)域中影像匹配都是必不可少的關(guān)鍵環(huán)節(jié)。目前影像匹配己成為現(xiàn)代信息處理,特別是圖像信息處理領(lǐng)域中的一項非常重要的技術(shù),已有很多學(xué)者進行這方面的研究而且已經(jīng)取得了很好的成就。影像匹配研究涉及到了影像采集、影像預(yù)處理、影像分割、特征提取等,并且與計算機視覺、多維信號處理和數(shù)值計算方法等緊密結(jié)合。它也是其它一些影像分析技術(shù),如立體視覺、運動分析、數(shù)據(jù)融合等的基礎(chǔ)。目前,它的應(yīng)用范圍相當廣泛,在計算機視覺、虛擬現(xiàn)實場景、航空航天遙感與數(shù)字攝影測量、醫(yī)學(xué)影像分析、光學(xué)和雷達跟蹤、景物制導(dǎo)、地形匹配、指紋與肖像檢測等領(lǐng)域都有著重要的應(yīng)用價值。在數(shù)字攝影測量的研究中,幾何變換和對應(yīng)關(guān)系是兩大關(guān)鍵問題。幾何變換問題經(jīng)過數(shù)學(xué)和圖形圖像學(xué)的研究已經(jīng)得到了解決,而對應(yīng)問題(特別是同名點的對應(yīng)問題)正是影像匹配的研究目的。影像匹配的良好實現(xiàn),可以大大促進數(shù)字攝影測量自動化量測的發(fā)展,并為立體測圖、建立立體模型、自動生成DEM、正射影像、等高線,構(gòu)建三維立體和虛擬現(xiàn)實場景提供技術(shù)支撐。

2.影像匹配國內(nèi)外研究現(xiàn)狀與內(nèi)容

影像匹配技術(shù)一直是數(shù)字攝影測量、計算機視覺等領(lǐng)域的關(guān)鍵技術(shù)難題,但它廣闊的應(yīng)用前景吸引了眾多領(lǐng)域的科研人員孜孜不倦地對它進行攻關(guān),成為經(jīng)久不衰的研究熱點。最初的影像匹配是利用相關(guān)技術(shù)實現(xiàn)的,因此又稱為影像相關(guān)。從上個世紀五十年代至今,國內(nèi)外學(xué)者提出了許多相應(yīng)的理論,涌現(xiàn)了大量的匹配算法[1][[2][3][4],如相關(guān)函數(shù)法、相關(guān)系數(shù)方法、整體法等。Bellman于上個世紀50年代提出的動態(tài)規(guī)劃法影像匹配,德國 Ackerlnann 教授提出的最小二乘匹配方法[5],Rosenhlm提出的多點最小二乘影像匹配[6],已及Ton Jez-ehing、JainA K提出的確定兩影像區(qū)域間對應(yīng)關(guān)系的點匹配方法[7],Daniel P Huttenlocher等人提出的Hausdorff距離匹配方法[8]等等;1978年,我國攝影測量學(xué)的先驅(qū)王之卓院士率先提出了“全數(shù)字攝影測量”的概念[9], 利用影像匹配來代替?zhèn)鹘y(tǒng)的人眼立體觀測;張祖勛院士提出了基于跨接法的影像匹配 [10];呂言提出了特征提取的呂言算子和基于特征的影像匹配方法[11];張力、沈未名等也提出了基于空間約束的神經(jīng)網(wǎng)絡(luò)影像匹配算法[12]。盡管發(fā)展出了多種多樣的匹配方法,但這些影像匹配算法按其匹配基元分類,主要可以分為基于像元灰度的影像匹配算法、基于特征的影像匹配算法以及基于影像的理解和解釋的匹配算法。

3.影像匹配的基本概念

匹配是圖像處理的一個基礎(chǔ)問題。簡單的說,匹配技術(shù)就是找到兩幅不同影像之間的空間位置關(guān)系實現(xiàn)同一目標的兩幅(或兩幅以上)影像在空間位置上的對準。 Barbara zitova和 Jan Flusser在其著作中對影像匹配進行了定義[23],稱其是針對來自于同一場景、不同時間、不同視角、不同傳感器的兩幅或多幅圖像進行重疊 (Overlapping)的過程,這個重疊就是幾何對齊 (Geometrically Align)的過程??梢詮闹锌闯鰞牲c,其一,影像匹配所研究的影像具有成像機理、自然條件、成像時間等的不同,這些都造成參與匹配的影像對具有很大的差異;其二,影像重疊的目的為了對兩幅影像在空間上進行對準,以確定兩幅影像之間的平移以及旋轉(zhuǎn)關(guān)系。也可以說影像匹配時利用兩個信號的相似性評價函數(shù),評價它們的相似性以確定同名點。即首先取出以待定點為中心的小區(qū)域中的影像信號,然后取出其在另一影像中相應(yīng)區(qū)域的影像信號,計算兩者的相似性評價函數(shù),以相似性評價函數(shù)值的大小來確定相應(yīng)區(qū)域中心點位同名點,即以影像信號分布最相似的區(qū)域為同名區(qū)域,同名區(qū)域的中心點為同名點。

4.影像匹配的困難與解決問題思路

影像匹配的方法有很多,但都有不同程度的局限性。對于一些共性的問題,如匹配模糊度問題,匹配組合問題等,目前仍是影像匹配中的難點問題。在實際應(yīng)用中主要表現(xiàn)在以下幾種情況的影像匹配中存在的問題:

1.信息貧乏區(qū)域(非重疊覆蓋范圍)和紋理重復(fù)區(qū)域(遮蔽區(qū)域)的匹配

2.陰影區(qū)域的匹配

3.陡坡表面和斷裂線地區(qū)的匹配

4.影像之間存在大的旋轉(zhuǎn)角度的匹配

5.非漫反射地區(qū)的匹配

6.對運動的目標和陰影的匹配

7.存在較大比例尺差異的影像間的匹配

8.不同傳感器影像之間的匹配

針對這些問題,一般的對于紋理貧乏和周期性紋理重復(fù)區(qū)域,自適應(yīng)的調(diào)整窗口大??;對于遮蔽和斷裂線區(qū)域采用雙向匹配的方法;對于陡坡區(qū)域采用跨接法影像匹配;對于存在較大旋轉(zhuǎn)角度的影像匹配則采用SIFT算子[28]進行處理。

5.小結(jié)

發(fā)展至今,影響匹配技術(shù)已經(jīng)取得了很大的成就,多種多樣的影像匹配算法基本能夠滿足實際應(yīng)用的需求。但影像匹配中仍存在著諸多問題和挑戰(zhàn),這也是數(shù)字攝影測量面臨的典型問題之一,也是我們今后科研的主攻方向和著力點。另外,目前的影像匹配算法大多是針對特定情況的應(yīng)用,適應(yīng)性方面不是太強。因此,尋找一種普適性的影像匹配算法或適應(yīng)性較強的影響匹配處理系統(tǒng)從而實現(xiàn)數(shù)字攝影測量發(fā)展的一次飛躍是我們不得不思考的問題。

參考文獻:

[1]張祖勛,新的核線相關(guān)算法一跨接法[J],武漢測繪科技大學(xué)學(xué)報,1988,13(4):19-26.

[2]王之卓,攝影測量原理續(xù)編[M],北京:測繪出版社,1986.

[3]呂言,用于提取數(shù)字圖像點特征之有利算子研究[J],測繪學(xué)報,1989,18(3):175-182.

[4]張力,沈未名,張祖勛等.基于空間約束的神經(jīng)網(wǎng)絡(luò)影像匹配[J].武漢測繪科技大學(xué)報,2000,25(1):55-58.

第5篇:計算機視覺研究現(xiàn)狀范文

關(guān)鍵詞:計算機視覺;跟蹤算法;綜述;人數(shù)統(tǒng)計

中圖分類號:TP391 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2013.03.003

0 引言

計算機視覺作為一門多學(xué)科的交叉領(lǐng)域,涉及圖像處理、計算機圖形學(xué)、模式識別、人工智能、人工神經(jīng)網(wǎng)絡(luò)、計算機、數(shù)學(xué)、心理學(xué)、生理學(xué)和物理學(xué)等。本文是對視頻人數(shù)統(tǒng)計技術(shù)的綜述,屬于智能視頻監(jiān)控范疇。

由于智能視屏監(jiān)控的挑戰(zhàn)性以及其巨大的應(yīng)用價值,越來越多的學(xué)校、研究所以及公司的研究人員投入到該領(lǐng)域中來。麻省理工學(xué)院、卡內(nèi)基梅隆大學(xué)以及其他國外著名大學(xué)成立了專門的計算機視覺及多媒體方向的實驗室;Nice和Object video等公司已經(jīng)針對飛機場、國界線等應(yīng)用場合開發(fā)了一些相應(yīng)的智能監(jiān)控系統(tǒng)。國際上的高級視頻和錄像(Advanced Videoand Signal-Based Surveillance)論壇每年都會舉辦PETS(Performance Evaluation of Tracking Systems)會議專門針對于人群行為分析,包括群體人數(shù)統(tǒng)計,人流密度估計;對單個人員以及群體中個體進行跟蹤;特殊群體和特殊事件檢測等。本文主要針對視頻人數(shù)識別這個研究方向,從基于特征點、顏色與形狀信息、模板匹配三種不同類型識別跟蹤方式分析了近些年來國內(nèi)外的研究工作及最新進展,通過對各種不同識別方法比較,對當前亟需解決的問題做了詳細的分析。

1 人數(shù)識別研究現(xiàn)狀

人數(shù)統(tǒng)計算法融合了運動物體檢測、行人檢測與分割、形狀分析、特征提取和目標跟蹤等多個領(lǐng)域的技術(shù)。從采用的手段來講可以分為直接法和間接法:直接法(或稱基于檢測的),即首先在場景中檢測出每個行人,再計數(shù)。第二種稱為間接法(也稱為基于映射或基于度量的),一般是建立場景特征與行人數(shù)量的函數(shù)關(guān)系來測算人數(shù)。在行人高度密集的場景中,間接法比直接法更加可靠,主要因為直接法無法有效分割每個行人,特別是在行人高度密集的場景中,從20世紀90年代起到目前為止這近20年里,出現(xiàn)了眾多的視覺跟蹤算法,1988年,Aggarwal和Nanadhakumar對運動圖像分析算法進行了總結(jié),將算法分為兩類,一類是基于光流法的分析,另一類是基于特征點的分析,此后在視覺跟蹤領(lǐng)域中,又出現(xiàn)了許多新的方法,目前,視頻中人數(shù)的跟蹤方法大致分為三類,分別是基于區(qū)域的跟蹤、基于特征點的跟蹤、基于模板和模型的跟蹤,這種分類方法概括了目前大多數(shù)視覺跟蹤算法,因此下面用這種分類方法對視覺跟蹤算法進行介紹。

1.1 基于特征的人數(shù)識別

基于特征的人數(shù)跟蹤算法選取目標的某個或某些局部特征作為相關(guān)時的對象,這種算法的優(yōu)點在于即使目標的某一部分被遮擋,只要還有一部分特征可以被看到,就可以完成跟蹤任務(wù),另外,這種方法與卡爾曼濾波器聯(lián)合使用,也具有很好的跟蹤效果。這種算法的難點是:對某個運動目標,如何確定它的唯一特征集?這也是一個模式識別問題,若采用特征過多,系統(tǒng)效率將降低,且容易產(chǎn)生錯誤,文獻對這一問題進行了討論,在特征提取時,一般采用Canny算子獲得目標的邊緣特征,而采用SUSAN算子獲得目標的角點信息。有關(guān)基于特征的跟蹤算法還可參見文獻。在2009年,Albiol使用角點個數(shù)作為場景特征來估測人數(shù),首先通過Harris角檢測器檢測出圖像角點,然后進行角點匹配以區(qū)分人身上的角點和背景角點,Albiol認為每幀總?cè)藬?shù)與人身上角點的個數(shù)成正比例關(guān)系,以此估測人數(shù),算法雖然簡單,但在PETS 2010“人數(shù)統(tǒng)計與密度估計”競賽中取得優(yōu)勝。2010年,Conte等“”基于Albiol的方法提出改進。采用的SURF(Speed up Ro.bust Feature)特征點以代替角點,同時,Conte等不僅考慮到特征點個數(shù)對人數(shù)估測的影響,還考慮到透視投影(拍攝距離d)密度人群遮掩(特征點密度p)對于估測的影響,同時對所有SURF點進行分組回歸以提高精度,在這個基礎(chǔ)上張茂軍等相比Conte等的研究成果在處理遠距離人群上精度提高,主要因為使用“非最大抑制聚類”——對不同拍攝距離的人群采取不同的聚類標準,有效解決遠距離人群的類過大問題,提取人身上特征點的方法是在掩模上直接檢測特征點,使得特征點個數(shù)更加穩(wěn)定,有利于SVM預(yù)測。

1.2 基于區(qū)域的人數(shù)識別

基于區(qū)域的跟蹤算法基本思想是:首先得包含目標的模板(Template),該模板通過圖像分割獲得或是預(yù)先人為確定,模板通常為略大于目標的矩形,也可為不規(guī)則形狀;然后在序列圖像中,運用相關(guān)算法跟蹤目標,對灰度圖像可以采用基于紋理和特征的相關(guān),對彩色圖像還可利用基于顏色的相關(guān)。

McKenna等首先利用色彩和梯度信息建立自適應(yīng)的背景模型,并且利用背景減除方法提取運動區(qū)域,有效地消除了影子的影響;然后,跟蹤過程在區(qū)域、人、人群三個抽象級別上執(zhí)行,區(qū)域可以合并和分離,而人是由許多身體部分區(qū)域在滿足幾何約束的條件下組成的,同時人群又是由單個的人組成的,因此利用區(qū)域跟蹤器并結(jié)合人的表面顏色模型,在遮擋情況下也能夠較好地完成多人的跟蹤。Marana等認為低密度人群在圖像上體現(xiàn)出粗糙紋理特征,而高密度人群則體現(xiàn)出精細紋理特征。文獻分別采用自組織理論和Minkowsld不規(guī)則維度理論從圖像紋理特征預(yù)測人群密度。Lin等則結(jié)合Harr小波變換(HWT)和支持向量機(SVM)進行行人頭部輪廓檢測,從而達到人數(shù)統(tǒng)計的目的。文獻利用顏色和形狀信息實現(xiàn)人頭的檢測,包含兩個步驟:黑色區(qū)域提取和形狀分析。通過對HSV空間V通道的像素設(shè)置閾值這種方法有效地檢測出黑色區(qū)域,同時可以少受光照變化和陰影的影響。使用一種基于形狀描述的快速弧形結(jié)構(gòu)提取方法實現(xiàn)人頭檢測。姬紅兵等提出了一種基于局部特征的目標跟蹤算法,通過多尺度分析方法,根據(jù)顏色和空間上的相似性將目標分割為多個區(qū)域,每個區(qū)域由一個團塊表示,團塊包含了該區(qū)域所有像素的顏色均值、形狀和位置,根據(jù)團塊特征構(gòu)造目標的外觀模型,定義團塊的匹配準則,通過團塊匹配進行目標跟蹤。

1.3 基于模板匹配的人數(shù)識別

采用模板匹配識別跟蹤方法首先將圖像序列轉(zhuǎn)換為一組靜態(tài)形狀模式然后在識別過程中和預(yù)先存儲的行為標本相比較,

部分學(xué)者在運動前景提取的基礎(chǔ)上使用了輪廓匹配方法對目標進行定位,文獻使用了半圓模型搜索前景中人頭肩所在位置,然后使用Snake模型與卡爾曼濾波相結(jié)合對目標進行跟蹤目標,但Snake模型比較適合單目標的跟蹤,當行人發(fā)生重疊時,定位精度會有一定的下降;在此基礎(chǔ)上文獻提出使用含有人harr特征分類器(使用頭肩部上半身樣本),對行人重疊情況下的檢測精度有一定的提升。文獻提出使用垂直攝像頭降低行人之間的遮擋程度,通過對基于AdaBoost的人頭檢測本方法,建立一個良好的人頭檢測分類器。然后根據(jù)運動人頭的特征去除誤檢區(qū)域。最后配合過線跟蹤實現(xiàn)出入口人數(shù)統(tǒng)計。

2 視頻跟蹤問題中的難點

從上面的闡述可以看出,各種方法都有自己的優(yōu)點和不足,是在文獻基礎(chǔ)上分析得到的幾種具體識別方法的比較結(jié)果,由于各種方法在設(shè)定理想情況下都有較好的準確率,所以不對各種方法的準確率做出比較,而是從各種算法的復(fù)雜度、魯棒性、先驗知識需求、高密度復(fù)雜人群適應(yīng)性(有遮擋出現(xiàn))等方面進行相對的比較分析,分析結(jié)果如表1。

2.1 視覺跟蹤問題中的難點

從控制的觀點來看,視覺跟蹤問題所面臨的主要難點可以歸結(jié)為對視覺跟蹤算法在三個方面的要求,即對算法的魯棒性、準確性和快速性。

魯棒性是指視覺跟蹤算法能夠在各種環(huán)境條件下實現(xiàn)對運動目標持續(xù)穩(wěn)定的跟蹤。影響人數(shù)跟蹤系統(tǒng)魯棒性的最主要原因在于目標處環(huán)境的光照變化以及部分遮擋引起的運動目標不規(guī)則變形和全部遮擋引起的目標的暫時消失。當運動目標所處環(huán)境的光照發(fā)生改變時,采用圖像灰度信息或色彩信息作為跟蹤基礎(chǔ)的視覺跟蹤算法一般都會失效,而基于圖像特征的方法往往不受光照改變的影響,如利用運動目標的邊緣信息能有效避免光照變化對運動目標的影響,但在復(fù)雜環(huán)境中要將運動目標的邊緣和周圍其它目標邊緣區(qū)分開來是非常困難的,遮擋問題是視覺跟蹤算法中又一難點問題,利用單攝像機解決遮擋問題也一直是視覺跟蹤領(lǐng)域中的熱點。而利用多攝像機可以在很大程度上解決這一問題,但正如前所述,多攝像機的應(yīng)用又會引入新的難題。

在視覺跟蹤研究中,準確性包括兩個方面,一是指對運動目標檢測的準確性,另一個是指對運動目標分割的準確性,對運動目標檢測準確性的目的是盡量避免運動目標虛檢和漏檢,從而提高對真實運動目標的檢測概率。由于實際復(fù)雜環(huán)境中存在大量噪聲。至今已經(jīng)出現(xiàn)了上千種各種類型的分割算法,但由于尚無通用的分割理論,目前并沒有一種適合于所有圖像的通用分割算法。

一個實用的視覺跟蹤系統(tǒng)必須能夠?qū)崿F(xiàn)對運動目標的實時跟蹤,這就要求視覺跟蹤算法必須具有快速性但是,視覺跟蹤算法處理的對象是包含巨大數(shù)據(jù)量的圖像,這些算法往往需要大量的運算時間,很難達到實時處理的要求,通常,簡單算法能夠?qū)崿F(xiàn)實時跟蹤,但跟蹤精度卻很差;復(fù)雜算法具有很高的跟蹤精度,實時性卻很差,一種通用的減小視覺跟蹤算法運算量的方法是利用金字塔分解或小波變換將圖像分層處理。

3 展望與結(jié)束語

3.1 展望

實現(xiàn)一個具有魯棒性、準確性和快速性的視覺跟蹤系統(tǒng)是當前視覺跟蹤技術(shù)努力的方向。但視覺跟蹤技術(shù)在這幾個方面中每前進一步都是非常困難的,因為該技術(shù)的發(fā)展與人的感知特性的研究緊密聯(lián)系在一起,由于目前對人的感知特性沒有一個主流的理論,其數(shù)學(xué)模型更是難以建立。同時,在計算機視覺中大多數(shù)問題是不確定的,這就更增加了視覺跟蹤技術(shù)發(fā)展的難度。但是,近幾十年來,數(shù)學(xué)理論方面取得了巨大的進步,因此合理的使用在數(shù)學(xué)理論方面的知識提高系統(tǒng)的性能能夠很好的解決視覺跟蹤問題。例如現(xiàn)在已經(jīng)應(yīng)用在諸多領(lǐng)域的模糊算法,神經(jīng)網(wǎng)絡(luò)等提高系統(tǒng)性能,簡化計算復(fù)雜度。

3.2 結(jié)束語

第6篇:計算機視覺研究現(xiàn)狀范文

一、數(shù)據(jù)融合

1.1概念的提出

1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。

7年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(dfs)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。

1998年1月,buchroithner和wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。

wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。

1.2基本內(nèi)容

信息融合是系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。

數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:

(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。

(2)多傳感器id/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當前或未來情況的估計。

(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測。

根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:

(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。

(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。

(3)決策層融合。首先

每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。

1.3處理模型

美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:

數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。

源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。

態(tài)勢評估。根據(jù)當前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當前的環(huán)境和對敵策略等因素,所以較為困難。

處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。

二、多傳感器在林業(yè)中的應(yīng)用

2.1在森林防火中的應(yīng)用

在用modis(moderateresolutionimagingspectroradiometer)數(shù)據(jù)測定森林火點時的2、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為25m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得gps接收機輸出的有關(guān)信息通過與rs實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。

2.2森林蓄積特征的估計

hampusholmstrom等在瑞典南部的試驗區(qū)將spot-4×s衛(wèi)星數(shù)據(jù)和carabas-iivhfsar傳感器的雷達數(shù)據(jù)進行了融合,采用knn(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。

knn方法就是采用目標樣地鄰近k個(k=1)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。

2.3用非垂直航空攝像數(shù)據(jù)融合gis信息更新調(diào)查數(shù)據(jù)

森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森

林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。 trevorjdavis等22年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的gis數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)

的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用gps對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的gis數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正。

試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。

三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望

3.1在木材檢測中的應(yīng)用

3.1.1木材缺陷及其影響

木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。

3.1.2單一傳感器在木材檢測中的應(yīng)用

對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。

隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。

新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。

美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。

在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析。

x射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。

3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望

單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,

造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和x射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷。

基于多傳感器(機器視覺及x射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。

3.2在精確林業(yè)中的應(yīng)用

美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;auburn大學(xué)的生物系統(tǒng)工程系和usda南方林業(yè)實驗站與有關(guān)公司合作開展用gps和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。

第7篇:計算機視覺研究現(xiàn)狀范文

0 引言

從X光圖像分析識別出鑄件或其他產(chǎn)品內(nèi)部缺陷的應(yīng)用越來越多,產(chǎn)品不同結(jié)構(gòu)形成的x射線圖像

>> 基于視覺特征的圖像聚類方法研究 基于特征的圖像網(wǎng)格生成方法 基于計算機視覺的構(gòu)件表面缺陷特征提取 基于加權(quán)特征空間信息視覺詞典的圖像檢索模型 一種基于小波變換的墻地磚缺陷圖像特征提取方法 鑄件缺陷的檢查與修補 基于圖像缺陷分割技術(shù)的綜述 圖像中輪廓結(jié)構(gòu)的視覺特征研究 淺談鑄件疏松和超聲波檢測的優(yōu)點 基于文本區(qū)域特征的圖像型垃圾郵件過濾算法 論城市視覺形象的生成與特征 鑄件缺陷無損檢測方法的研究現(xiàn)狀分析 消失模鑄件的常見缺陷及對策 基于互補特征的紋理圖像檢索 基于顏色特征的圖像檢索技術(shù) 基于局部特征的智能圖像融合 基于聯(lián)合特征的圖像檢索 基于紋理特征的道路圖像分類 一種基于圖像特征的圖像分類方法 基于機器視覺的瓷磚缺陷檢測機構(gòu) 常見問題解答 當前所在位置:中國 > 科技 > 基于定性視覺特征的鑄件疏松型缺陷圖像生成 基于定性視覺特征的鑄件疏松型缺陷圖像生成 雜志之家、寫作服務(wù)和雜志訂閱支持對公帳戶付款!安全又可靠! document.write("作者:未知 如您是作者,請告知我們")

申明:本網(wǎng)站內(nèi)容僅用于學(xué)術(shù)交流,如有侵犯您的權(quán)益,請及時告知我們,本站將立即刪除有關(guān)內(nèi)容。 0 引言

從X光圖像分析識別出鑄件或其他產(chǎn)品內(nèi)部缺陷的應(yīng)用越來越多,產(chǎn)品不同結(jié)構(gòu)形成的x射線圖像與缺陷識別算法密切相關(guān),算法的有效性魯棒性的調(diào)試檢測因而需要大量待測產(chǎn)品圖像樣本。在產(chǎn)品質(zhì)量較好的情況下。獲取大量帶缺陷樣本通常需要一個較長時期。由于算法測試需要在產(chǎn)品批量檢測之前進行,這使得樣本更加難以獲得。通過仿真缺陷并疊加至產(chǎn)品圖像的方法獲取樣本很早便受到關(guān)注,并長期基于計算機輔助畫圖(CAD)軟件技術(shù):一方面可以對包含缺陷的工件整體仿真;另一方面則是上述的缺陷圖像疊加。利用cAD軟件除了其計算量太、模型計算復(fù)雜,還有一個較大的局限是缺陷生成的隨機性差,cAD需在確定模型的基礎(chǔ)上形成缺陷,模型的產(chǎn)生因此成為瓶頸技術(shù)。從實際生產(chǎn)看,基本上每個產(chǎn)品所存在的缺陷都不相同,因此缺陷的仿真,更確切地說應(yīng)該是生成,就不是對某個具體對象的模仿和逼近,而應(yīng)在視覺上符合缺陷的定義,在缺陷圖像生成算法中滿足其特征的統(tǒng)計數(shù)值范圍。

第8篇:計算機視覺研究現(xiàn)狀范文

【關(guān)鍵詞】量子計算;量子計算機;量子算法;量子信息處理

1、引言

在人類剛剛跨入21山_紀的時刻,!日_界科技的重大突破之一就是量子計算機的誕生。德國科學(xué)家已在實驗室研制成功5個量子位的量子計算機,而美國LosAlamos國家實驗室正在進行7個量子位的量子計算機的試驗。它預(yù)示著人類的信息處理技術(shù)將會再一次發(fā)生巨大的飛躍,而研究面向量子計算機以量子計算為基礎(chǔ)的量子信息處理技術(shù)已成為一項十分緊迫的任務(wù)。

2、子計算的物理背景

任何計算裝置都是一個物理系統(tǒng)。量子計算機足根據(jù)物理系統(tǒng)的量子力學(xué)性質(zhì)和規(guī)律執(zhí)行計算任務(wù)的裝置。量子計算足以量子計算目L為背景的計算。是在量了力。4個公設(shè)(postulate)下做出的代數(shù)抽象。Feylllilitn認為,量子足一種既不具有經(jīng)典耗子性,亦不具有經(jīng)典渡動性的物理客體(例如光子)。亦有人將量子解釋為一種量,它反映了一些物理量(如軌道能級)的取值的離散性。其離散值之問的差值(未必為定值)定義為量子。按照量子力學(xué)原理,某些粒子存在若干離散的能量分布。稱為能級。而某個物理客體(如電子)在另一個客體(姻原子棱)的離散能級之間躍遷(transition。粒子在不同能量級分布中的能級轉(zhuǎn)移過程)時將會吸收或發(fā)出另一種物理客體(如光子),該物理客體所攜帶的能量的值恰好是發(fā)生躍遷的兩個能級的差值。這使得物理“客體”和物理“量”之問產(chǎn)生了一個相互溝通和轉(zhuǎn)化的橋梁;愛因斯坦的質(zhì)能轉(zhuǎn)換關(guān)系也提示了物質(zhì)和能量在一定條件下是可以相互轉(zhuǎn)化的因此。量子的這兩種定義方式是對市統(tǒng)并可以相互轉(zhuǎn)化的。量子的某些獨特的性質(zhì)為量了計算的優(yōu)越性提供了基礎(chǔ)。

3、量子計算機的特征

量子計算機,首先是能實現(xiàn)量子計算的機器,是以原子量子態(tài)為記憶單元、開關(guān)電路和信息儲存形式,以量子動力學(xué)演化為信息傳遞與加工基礎(chǔ)的量子通訊與量子計算,是指組成計算機硬件的各種元件達到原子級尺寸,其體積不到現(xiàn)在同類元件的1%。量子計算機是一物理系統(tǒng),它能存儲和處理關(guān)于量子力學(xué)變量的信息。量子計算機遵從的基本原理是量子力學(xué)原理:量子力學(xué)變量的分立特性、態(tài)迭加原理和量子相干性。信息的量子就是量子位,一位信息不是0就是1,量子力學(xué)變量的分立特性使它們可以記錄信息:即能存儲、寫入、讀出信息,信息的一個量子位是一個二能級(或二態(tài))系統(tǒng),所以一個量子位可用一自旋為1/2的粒子來表示,即粒子的自旋向上表示1,自旋向下表示0;或者用一光子的兩個極化方向來表示0和1;或用一原子的基態(tài)代表0第一激發(fā)態(tài)代表1。就是說在量子計算機中,量子信息是存儲在單個的自旋’、光子或原子上的。對光子來說,可以利用Kerr非線性作用來轉(zhuǎn)動一光束使之線性極化,以獲取寫入、讀出;對自旋來說,則是把電子(或核)置于磁場中,通過磁共振技術(shù)來獲取量子信息的讀出、寫入;而寫入和讀出一個原子存儲的信息位則是用一激光脈沖照射此原子來完成的。量子計算機使用兩個量子寄存器,第一個為輸入寄存器,第二個為輸出寄存器。函數(shù)的演化由幺正演化算符通過量子邏輯門的操作來實現(xiàn)。單量子位算符實現(xiàn)一個量子位的翻轉(zhuǎn)。兩量子位算符,其中一個是控制位,它確定在什么情況下目標位才發(fā)生改變;另一個是目標位,它確定目標位如何改變;翻轉(zhuǎn)或相位移動。還有多位量子邏輯門,種類很多。要說清楚量子計算,首先看經(jīng)典計算。經(jīng)典計算機從物理上可以被描述為對輸入信號序列按一定算法進行交換的機器,其算法由計算機的內(nèi)部邏輯電路來實現(xiàn)。經(jīng)典計算機具有如下特點:

a)其輸入態(tài)和輸出態(tài)都是經(jīng)典信號,用量子力學(xué)的語言來描述,也即是:其輸入態(tài)和輸出態(tài)都是某一力學(xué)量的本征態(tài)。如輸入二進制序列0110110,用量子記號,即10110110>。所有的輸入態(tài)均相互正交。對經(jīng)典計算機不可能輸入如下疊加Cl10110110>+C2I1001001>。

b)經(jīng)典計算機內(nèi)部的每一步變換都將正交態(tài)演化為正交態(tài),而一般的量子變換沒有這個性質(zhì),因此,經(jīng)典計算機中的變換(或計算)只對應(yīng)一類特殊集。

相應(yīng)于經(jīng)典計算機的以上兩個限制,量子計算機分別作了推廣。量子計算機的輸入用一個具有有限能級的量子系統(tǒng)來描述,如二能級系統(tǒng)(稱為量子比特),量子計算機的變換(即量子計算)包括所有可能的幺正變換。因此量子計算機的特點為:

a)量子計算機的輸入態(tài)和輸出態(tài)為一般的疊加態(tài),其相互之間通常不正交;

b)量子計算機中的變換為所有可能的幺正變換。得出輸出態(tài)之后,量子計算機對輸出態(tài)進行一定的測量,給出計算結(jié)果。由此可見,量子計算對經(jīng)典計算作了極大的擴充,經(jīng)典計算是一類特殊的量子計算。量子計算最本質(zhì)的特征為量子疊加性和相干性。量子計算機對每一個疊加分量實現(xiàn)的變換相當于一種經(jīng)典計算,所有這些經(jīng)典計算同時完成,并按一定的概率振幅疊加起來,給出量子計算的輸出結(jié)果。這種計算稱為量子并行計算,量子并行處理大大提高了量子計算機的效率,使得其可以完成經(jīng)典計算機無法完成的工作,這是量子計算機的優(yōu)越性之一。

4、量子計算機的應(yīng)用

量子計算機驚人的運算能使其能夠應(yīng)用于電子、航空、航人、人文、地質(zhì)、生物、材料等幾乎各個學(xué)科領(lǐng)域,尤其是信息領(lǐng)域更是迫切需要量子計算機來完成大量數(shù)據(jù)處理的工作。信息技術(shù)與量子計算必然走向結(jié)合,形成新興的量子信息處理技術(shù)。目前,在信息技術(shù)領(lǐng)域有許多理論上非常有效的信息處理方法和技術(shù),由于運算量龐大,導(dǎo)致實時性差,不能滿足實際需要,因此制約了信息技術(shù)的發(fā)展。量子計算機自然成為繼續(xù)推動計算速度提高,進而引導(dǎo)各個學(xué)科全面進步的有效途徑之一。在目前量子計算機還未進入實際應(yīng)用的情況下,深入地研究量子算法是量子信息處理領(lǐng)域中的主要發(fā)展方向,其研究重點有以下三個方面;

(1)深刻領(lǐng)悟現(xiàn)有量子算法的木質(zhì),從中提取能夠完成特定功能的量子算法模塊,用其代替經(jīng)典算法中的相應(yīng)部分,以便盡可能地減少現(xiàn)有算法的運算量;

(2)以現(xiàn)有的量子算法為基礎(chǔ),著手研究新型的應(yīng)用面更廣的信息處理量子算法;

(3)利用現(xiàn)有的計算條件,盡量模擬量子計算機的真實運算環(huán)境,用來驗證和開發(fā)新的算法。

5、量子計算機的應(yīng)用前景

目前經(jīng)典的計算機可以進行復(fù)雜計算,解決很多難題。但依然存在一些難解問題,它們的計算需要耗費大量的時間和資源,以致在宇宙時間內(nèi)無法完成。量子計算研究的一個重要方向就是致力于這類問題的量子算法研究。量子計算機首先可用于因子分解。因子分解對于經(jīng)典計算機而言是難解問題,以至于它成為共鑰加密算法的理論基礎(chǔ)。按照Shor的量子算法,量子計算機能夠以多項式時間完成大數(shù)質(zhì)因子的分解。量子計算機還可用于數(shù)據(jù)庫的搜索。1996年,Grover發(fā)現(xiàn)了未加整理數(shù)據(jù)庫搜索的Grover迭代量子算法。使用這種算法,在量子計算機上可以實現(xiàn)對未加整理數(shù)據(jù)庫Ⅳ的平方根量級加速搜索,而且用這種加速搜索有可能解決經(jīng)典上所謂的NP問題。量子計算機另一個重要的應(yīng)用是計算機視覺,計算機視覺是一種通過二維圖像理解三維世界的結(jié)構(gòu)和特性的人工智能。計算機視覺的一個重要領(lǐng)域是圖像處理和模式識別。由于圖像包含的數(shù)據(jù)量很大,以致不得不對圖像數(shù)據(jù)進行壓縮。這種壓縮必然會損失一部分原始信息。

作者簡介:

第9篇:計算機視覺研究現(xiàn)狀范文

Abstract:There are three stages about the development of video monitoring system, simulative video surveillance system, digital video monitoring system and digital control system, and the intelligent video surveillance system is the future and hope of video monitoring system. Intelligent video analysis technology is the key technology of intelligent video surveillance, the core of changing passive surveillance into active identification.

關(guān)鍵詞:視頻監(jiān)控系統(tǒng),智能視頻分析系統(tǒng),智能視頻分析技術(shù)

Key words:video monitoring system; intelligent video analysis system; intelligent video analysis technology

中圖分類號:TP27 文獻標識碼:A文章編號:1006-4311(2010)17-0097-02

0引言

俗話說“百聞不如一見”,視覺信息在人類活動所涉及的信息中占據(jù)的比重最大,而且由于其空間和結(jié)構(gòu)特性使其不能為任何其他信息所替代。智能視頻監(jiān)控(IVS,Intelligent Video surveillance)技術(shù)源于計算機視覺(CV,Computer Vision)技術(shù),作為人工智能(AI,Artificial Intelligent)研究的一個分支,是一項新興的安防技術(shù),有著廣闊的發(fā)展前景。智能視頻監(jiān)控技術(shù)是指利用計算機視覺的方法,在不需要人為干預(yù)的情況下,通過對視頻序列進行實時自動分析,實現(xiàn)對目標的定位、識別和跟蹤,并在此基礎(chǔ)上進行行為分析,以達到完成日常管理和對異常情況預(yù)警的目的?;镜闹悄芤曨l監(jiān)控系統(tǒng)主要由視頻數(shù)據(jù)采集、視頻數(shù)據(jù)編碼、視頻數(shù)據(jù)傳輸以及視頻數(shù)據(jù)分析處理和異常行為報警等部分組成。進入21世紀以來,國際反恐斗爭的形勢日趨嚴峻,智能視頻監(jiān)控作為安防系統(tǒng)的重要組成部分,廣泛應(yīng)用于各種公共場所和大型活動之中。我國的智能視頻監(jiān)控技術(shù)也在“平安城市”項目、奧運安防和上海世博會安防等各行業(yè)安防項目的強勁刺激和拉動下,進入了蓬勃發(fā)展階段。

1智能視頻監(jiān)控的發(fā)展歷程及研究現(xiàn)狀

近三十年來,視頻監(jiān)控系統(tǒng)的發(fā)展經(jīng)歷了模擬視頻監(jiān)控系統(tǒng)、數(shù)字視頻監(jiān)控系統(tǒng)、全數(shù)字化監(jiān)控系統(tǒng)(網(wǎng)絡(luò)攝像機和視頻服務(wù)器)三個階段的演變,得到了巨大的發(fā)展。

1.1 模擬視頻監(jiān)控系統(tǒng)早期的視頻監(jiān)控是以攝像機、監(jiān)視器(電視機)組成的純模擬的視頻監(jiān)控系統(tǒng),稱為閉路監(jiān)視系統(tǒng)。隨后出現(xiàn)了視頻切換設(shè)備,閉路監(jiān)視系統(tǒng)加入多路視頻切換、攝像機云臺/鏡頭控制和報警聯(lián)動等數(shù)字控制功能,實現(xiàn)了數(shù)字控制的模擬視頻監(jiān)控系統(tǒng),稱為第一代視頻監(jiān)控系統(tǒng)。

1.2 數(shù)字視頻監(jiān)控系統(tǒng)20世紀90年代中期,以DVR(Digital Video Recorder)為代表的第二代視頻監(jiān)控系統(tǒng)出現(xiàn)在視頻監(jiān)控市場上,大大提高了用戶對錄像信息的處理能力。DVR使用戶可以將模擬的視頻信號進行數(shù)字化并存儲在硬盤而不是盒式錄像帶上。用戶還可以通過DVR控制攝像機的啟閉,從而實現(xiàn)移動偵測功能,對于報警事件以及事前/事后報警信息的搜索也變得十分簡單。

1.3 網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)進入21世紀以后,隨著網(wǎng)絡(luò)帶寬、計算機處理能力和存儲器容量的迅速提高,以及各種實用視頻信息處理技術(shù)的出現(xiàn),視頻監(jiān)控進入了全數(shù)字化的網(wǎng)絡(luò)時代,稱為第三代視頻監(jiān)控系統(tǒng),即全數(shù)字視頻監(jiān)控系統(tǒng)或網(wǎng)絡(luò)數(shù)字視頻監(jiān)控系統(tǒng)。然而由于作為監(jiān)控者的人類自身生理上的弱點和視頻監(jiān)控設(shè)備在功能和性能上的局限性,使得各類視頻監(jiān)控系統(tǒng)均不同程度存在精確度差、報警不及時、誤報和漏報等現(xiàn)象,以至系統(tǒng)的安全性和實用性得不到保障。因此,能夠每天連續(xù)24小時實時智能監(jiān)視,并能夠自動分析攝像機捕捉的圖像數(shù)據(jù),當異常發(fā)生時又能向保衛(wèi)人員準確及時地發(fā)出警報的智能視頻監(jiān)控系統(tǒng)應(yīng)運而生,這樣即可以有效預(yù)防犯罪發(fā)生,同時也減少了雇傭大批監(jiān)視人員所需要的人力、財力和物力的投入。隨著計算機視覺技術(shù)的不斷發(fā)展和計算機處理能力的迅速提高,智能視頻監(jiān)控系統(tǒng)以其快速從海量視頻信息中自動分析和抽取關(guān)鍵信息的優(yōu)勢,迅速占領(lǐng)國內(nèi)外安防市場。

2智能視頻監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)及優(yōu)勢

所謂智能視頻監(jiān)控,就是指采用智能視頻分析算法,利用計算機視覺技術(shù)對視野范圍內(nèi)的目標進行行為的分析和內(nèi)容提取,當發(fā)現(xiàn)符合某種規(guī)則的行為(如越界、游蕩、滯留等)發(fā)生時,自動發(fā)出提示信號,采取特定對應(yīng)措施(如聲光報警、移動監(jiān)測并記錄)或通知監(jiān)控人員進行人工干預(yù)等。作為智能視頻監(jiān)控的關(guān)鍵技術(shù),智能視頻分析技術(shù)可分為動態(tài)視頻目標檢測定位、動態(tài)視頻目標跟蹤、動態(tài)視頻目標分類識別、行為理解與描述、異常事件分析等部分。

動態(tài)視頻目標檢測技術(shù)是智能視頻分析的基礎(chǔ),主要是指通過監(jiān)控畫面識別目標區(qū)域的圖像變化,從監(jiān)控場景中將目標提取出來。主要方法是背景減除法、時間差分法、光流法、特征檢測法等。動態(tài)視頻目標跟蹤是指結(jié)合物體的外表和運動特性,實現(xiàn)對不同形狀、顏色、不同背景的目標進行識別的技術(shù)。常用的方法有基于運動估計的跟蹤、基于特征的跟蹤、基于主動輪廓的跟蹤等。動態(tài)視頻目標分類識別包含目標的識別、目標行為模式的分析、目標的狀態(tài)分析等。行為理解與描述是最具挑戰(zhàn)的研究方向,因為觀察人的最終目標就是分析和理解人的個人行為、人與人之間及人與其它目標的交互行為等。近年來,利用機器學(xué)習工具構(gòu)建人行為的統(tǒng)計模型方面有了一定的進展,但特征選擇和機器學(xué)習仍然是行為理解的難點。主要方法是狀態(tài)空間法和模板匹配方法。異常事件分析報警則是智能視頻監(jiān)控的主要目的,是視頻監(jiān)控智能化的必然要求。智能視頻監(jiān)控系統(tǒng)較于以往的視頻監(jiān)控系統(tǒng)有很大的優(yōu)勢,它在很大程度上彌補了普通智能視頻監(jiān)控系統(tǒng)的缺陷,變被動監(jiān)控為主動識別。智能視頻監(jiān)控系統(tǒng)的優(yōu)勢很明顯,如全天候可靠的視頻監(jiān)控,減少了人為因素造成的誤報、漏報,將監(jiān)控人員從"目不轉(zhuǎn)睛"和主觀的分析判斷模式中解放出來。通過智能視頻分析模塊對監(jiān)控畫面的自動分析,實現(xiàn)對異常事件的主動編碼、報警和保存。提高報警精度和響應(yīng)速度,前端設(shè)備集成強大的數(shù)字圖像處理功能,并運行高級的智能視頻分析算法,使用戶可以更加精確的定義安全威脅的特征,識別可疑活動,在安全威脅發(fā)生之前提示監(jiān)控人員提前做好準備,并根據(jù)實際情況驅(qū)動預(yù)案生成和執(zhí)行。智能視頻監(jiān)控還可以有效的擴展視頻資源的用途,將視頻資源應(yīng)用到非安全領(lǐng)域中,如大型活動的人數(shù)統(tǒng)計、重要人物身份識別等。

3智能視頻監(jiān)控系統(tǒng)的應(yīng)用及發(fā)展方向

智能視頻監(jiān)控系統(tǒng)的應(yīng)用主要分為兩大類:安全相關(guān)類應(yīng)用和非安全相關(guān)類應(yīng)用。安全相關(guān)類應(yīng)用主要是在安防系統(tǒng)中。伴隨重大政治、經(jīng)濟、體育活動的增加,恐怖襲擊的頻繁發(fā)生,市場上對此類應(yīng)用的需求不斷增長。主要包括:高級視頻移動偵測(Advanced VMD)、物體追蹤(Motion Tracking)、人臉識別(Facial Detection)、車輛識別(Vehicle Identification)、非法滯留(ObjectPersistence)等。目前,智能視頻監(jiān)控系統(tǒng)已經(jīng)在高端的安防市場有了多年應(yīng)用,如在機場、監(jiān)獄、軍事基地和其他大型基礎(chǔ)設(shè)施中。以機場為例,它的周界太過分散,監(jiān)控人員無法完全監(jiān)控到所有周界。這時,智能化的監(jiān)控系統(tǒng)就可以充分展示它的才能了,它能夠自動探測在某些特定場所和時間內(nèi)進入或離開某一區(qū)域的可疑物體。除了安全相關(guān)類應(yīng)用之外,智能視頻監(jiān)控系統(tǒng)還可以應(yīng)用到非安全相關(guān)類應(yīng)用當中。這些應(yīng)用主要面向服務(wù)和零售行業(yè),可以看作管理和服務(wù)的輔助工具,有效提高服務(wù)水平和營業(yè)額。這類應(yīng)用主要有:人數(shù)統(tǒng)計(People Counting)、人群控制(Flow Control)、注意力控制(Attention Control)和交通流量控制(Traffic Flow)等。例如一些賓館或商場大堂的監(jiān)控錄像可以通過人數(shù)統(tǒng)計功能,計算客流量和銷售情況;通過人臉識別等功能加強對VIP客戶的服務(wù),智能視頻監(jiān)控系統(tǒng)自動識別VIP客戶的特征,并通過客服人員及時做好服務(wù)工作,有效提高工作效率和工作質(zhì)量。

目前,大部分智能視頻監(jiān)控系統(tǒng)的核心算法仍然掌握在歐美等先進國家,并迅速形成了相對成熟的產(chǎn)品應(yīng)用于安防系統(tǒng)中,如美國的Vidient、ObjectVideo,以色列的Mate,日本的NICE等。據(jù)IMS Research調(diào)查顯示,世界范圍內(nèi)IVS(Intelligent Video System)的市場占有率為35%~36%,其中美國的OV(Object Video)就占有了9%左右。在國內(nèi),智能視頻監(jiān)控也得到了長足的發(fā)展,如中國電信“全球眼”、中國網(wǎng)通“寬世界”、中國鐵通“智控眼”等品牌,大多面向行業(yè)用戶開展,市場收入不菲,競爭越來越激烈。2008年奧運會和2010年上海世博會更是使智能視頻監(jiān)控系統(tǒng)得到了廣泛的應(yīng)用和發(fā)展。

4結(jié)束語

綜上所述,智能化是視頻監(jiān)控發(fā)展的必然趨勢,智能視頻監(jiān)控系統(tǒng)正受到越來越多的關(guān)注,需求量也在不斷增加。雖然,目前仍存在許多問題,如:圖像質(zhì)量問題、安全檢查問題等。但隨著智能視頻分析技術(shù)的不斷發(fā)展,各種硬件費用的降低和通信運營商的投資發(fā)展,智能視頻監(jiān)控系統(tǒng)將得到更廣泛的應(yīng)用和發(fā)展。現(xiàn)在,它已完成了2008奧運安防的重大使命,也將為2010的"平安世博"保駕護航。

參考文獻:

[1]郭瑞霞, 吳運新,宋躍輝.智能跟蹤視頻監(jiān)視系統(tǒng)研究[J].電視技術(shù), 2006,(2):74-77.