前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計(jì)算機(jī)視覺中深度學(xué)習(xí)的應(yīng)用范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
摘要:闡述計(jì)算機(jī)視覺借助攝影機(jī)與計(jì)算機(jī)取代人眼對(duì)事物進(jìn)行識(shí)別、觀察和分析的一種機(jī)器視覺,深度學(xué)習(xí)技術(shù)在很大程度上促進(jìn)計(jì)算機(jī)視覺的發(fā)展,探討計(jì)算機(jī)視覺領(lǐng)域中的深度學(xué)習(xí)技術(shù)的應(yīng)用實(shí)例。
關(guān)鍵詞:計(jì)算機(jī)工程;視覺領(lǐng)域;深度學(xué)習(xí)技術(shù)
引言
計(jì)算機(jī)視覺簡(jiǎn)言之即是依靠電子設(shè)備成像來(lái)代替生物視覺系統(tǒng),隨后依靠提前寫好的程序?qū)Λ@取的圖像信息實(shí)施處理。該技術(shù)的短期應(yīng)用目的在于完成相對(duì)簡(jiǎn)單的智能視覺工作,而深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用,在很大程度上豐富了其功能,提高了識(shí)別效率,讓其能夠在更多行業(yè)發(fā)揮出自身價(jià)值。
1計(jì)算機(jī)視覺領(lǐng)域的深度學(xué)習(xí)技術(shù)
1.1圖像分類中的深度學(xué)習(xí)技術(shù)
基于深度學(xué)習(xí)技術(shù),卷積神經(jīng)網(wǎng)絡(luò)得到了進(jìn)一步的發(fā)展,其應(yīng)用范圍也更為寬泛,例如說(shuō)在圖像分類中的運(yùn)用。圖像分析需要對(duì)圖像實(shí)施掃描分析,隨后對(duì)其具體類別予以劃分,更加注重其整體語(yǔ)義。目前相對(duì)普遍進(jìn)行圖像分類的數(shù)據(jù)集為ImageNet,其中囊括了非常豐富的內(nèi)容,存儲(chǔ)了近1500萬(wàn)個(gè)圖像的URL并將圖像劃分為數(shù)萬(wàn)余個(gè)類型。ImageNet每年組織開展的大規(guī)模視覺識(shí)別挑戰(zhàn)賽(ILSVRC)中,圖像分類算法與技術(shù)也不斷創(chuàng)新,圖像分類的準(zhǔn)確性也持續(xù)提升。ImageNet數(shù)據(jù)集表現(xiàn)出規(guī)模大、類型多的突出特點(diǎn),所以更加適用于遷移學(xué)習(xí),即是把部分核心技術(shù)或結(jié)構(gòu)拓展應(yīng)用到各個(gè)領(lǐng)域,對(duì)于視覺領(lǐng)域的深度模型來(lái)說(shuō),能夠把模型內(nèi)的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)直接共享到其他數(shù)據(jù)集,從而對(duì)數(shù)據(jù)實(shí)施微調(diào)。圖像分類屬于計(jì)算機(jī)視覺領(lǐng)域最為基礎(chǔ)的環(huán)節(jié),對(duì)于圖像分類模型創(chuàng)建和數(shù)據(jù)分析處理經(jīng)驗(yàn)也能夠遷移應(yīng)用到其他領(lǐng)域中。
1.2目標(biāo)檢測(cè)中的深度學(xué)習(xí)技術(shù)
目標(biāo)檢測(cè)相對(duì)于圖像分類而言表現(xiàn)出更多的復(fù)雜性,主要任務(wù)是在囊括多種不同類型物體的圖像內(nèi)精確定位和識(shí)別某一物體,恰恰是出于這一目的,深度學(xué)習(xí)技術(shù)在目標(biāo)檢測(cè)中的應(yīng)用更為復(fù)雜,要實(shí)現(xiàn)更加精準(zhǔn)的效果也相對(duì)更難。近年來(lái)針對(duì)目標(biāo)檢測(cè)的算法日益更新,如優(yōu)化后的R-CNN算法,是借助于卷積神經(jīng)網(wǎng)絡(luò)思想,對(duì)物體進(jìn)行分類,提取物體特征。而SelectiveSearch算法的出現(xiàn)有了進(jìn)一步的創(chuàng)新和突破,有效促進(jìn)了檢測(cè)準(zhǔn)確性的提高,這也給通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)帶來(lái)了更多可能性,隨后的FastR-CNN算法極大地促進(jìn)了目標(biāo)檢測(cè)效率的提升,該算法對(duì)提取候選區(qū)的問(wèn)題予以優(yōu)化,大大減少了候選區(qū)提取和目標(biāo)檢測(cè)過(guò)程的時(shí)間。目標(biāo)檢測(cè)網(wǎng)絡(luò)以FastR-CNN算法作為支撐,于輸出位置設(shè)置滑動(dòng)窗同時(shí)和候選區(qū)域網(wǎng)絡(luò)實(shí)施連接,目標(biāo)檢測(cè)的關(guān)鍵在于卷積神經(jīng)網(wǎng)絡(luò),依靠它把各個(gè)點(diǎn)的特征進(jìn)行提取,再借助回歸算法獲得對(duì)應(yīng)范圍出現(xiàn)目標(biāo)的概率[1]。
1.3人臉識(shí)別中的深度學(xué)習(xí)技術(shù)
人臉識(shí)別主要是借助相應(yīng)算法對(duì)人臉特征實(shí)施提取,因?yàn)槠浣⒌娜四樐P捅憩F(xiàn)出一定的不穩(wěn)定性,因此模型建立往往也表現(xiàn)出一定的難度,相對(duì)于建立剛體模型而言更為困難。人臉識(shí)別通常來(lái)說(shuō)涉及人臉檢測(cè)定位以及特征提取兩個(gè)方面,人臉檢測(cè)定位是基于背景圖像中將人臉目標(biāo)分割出來(lái),實(shí)施歸一化處理,而人臉特征提取算法不變。前者存在的技術(shù)難點(diǎn)是人臉目標(biāo)具有多樣性以及背景圖像具有復(fù)雜性,所以對(duì)背景情境實(shí)施合理假設(shè)并予以簡(jiǎn)化是十分關(guān)鍵的。與此同時(shí),高維空間人臉模型的建立較為復(fù)雜,精確度估算難度較大,人臉特征提取的技術(shù)難度是因?yàn)槿四槍儆趶椥阅P?,其難度超過(guò)剛體模型。一般來(lái)說(shuō),較為常見對(duì)人臉特征實(shí)施提取與識(shí)別的方法有幾何特征法、特征臉?biāo)惴ㄒ约皬椥阅P头?,CNN算法和過(guò)去的特征提取算法比起來(lái)表現(xiàn)出更高的穩(wěn)定性和適用性,同時(shí)能夠有效抵抗外部干擾,促進(jìn)人臉識(shí)別技術(shù)的推廣應(yīng)用。
2應(yīng)用實(shí)例
2.1安防領(lǐng)域的應(yīng)用
深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域中的應(yīng)用可以為安防行業(yè)提供更佳的解決方案,比如說(shuō)人臉識(shí)別技術(shù)的應(yīng)用,很多大型企業(yè)如Facebook、騰訊、阿里巴巴等都將非常關(guān)注和重視。作為深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域應(yīng)用的重要內(nèi)容,人臉識(shí)別在安檢以及反恐等領(lǐng)域中也能夠發(fā)揮出很好的效果。與此同時(shí),對(duì)行人角度的REID技術(shù)實(shí)施研究,依托于深度學(xué)習(xí)強(qiáng)化目標(biāo)檢測(cè),對(duì)目標(biāo)特征實(shí)施提取和刻畫,能夠?yàn)楫惓P袨楸O(jiān)控和跟蹤帶來(lái)支持[2]。
2.2無(wú)人駕駛領(lǐng)域的應(yīng)用
對(duì)于無(wú)人駕駛領(lǐng)域來(lái)說(shuō),選擇激光或雷達(dá)這類傳感器的成本更高,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)也能夠提供新的解決方案。依靠攝像機(jī)對(duì)視頻畫面進(jìn)行采集,對(duì)獲取到的圖像實(shí)施分析,提供類似于前車碰撞預(yù)警等功能。在這一過(guò)程中,計(jì)算機(jī)視覺技術(shù)可以實(shí)現(xiàn)對(duì)目標(biāo)的檢測(cè)識(shí)別、對(duì)目標(biāo)車輛的跟蹤分析、對(duì)車道線是否偏離進(jìn)行檢測(cè)等?;谏疃葘W(xué)習(xí)技術(shù)的檢測(cè)識(shí)別表現(xiàn)出更加強(qiáng)大的優(yōu)勢(shì),現(xiàn)階段深度學(xué)習(xí)芯片日益增多,對(duì)于無(wú)人駕駛技術(shù)的發(fā)展也帶來(lái)了更加有力的支持。
2.3智能家居領(lǐng)域的應(yīng)用
過(guò)去的很多智能家居產(chǎn)品一般都是依靠智能手機(jī)藍(lán)牙或者WiFi等途徑來(lái)實(shí)現(xiàn)對(duì)家居產(chǎn)品的控制,這一方案即便能夠做到家居智能化,但其水平依舊有待提高?;谏疃葘W(xué)習(xí)技術(shù),能夠有效促進(jìn)智能家居行業(yè)的更新發(fā)展,除開語(yǔ)言、語(yǔ)音識(shí)別之外,還能夠利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)人際交流與互動(dòng),比如說(shuō)手勢(shì)識(shí)別控制。2.4教育領(lǐng)域和圖片搜索領(lǐng)域的應(yīng)用基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)也能夠在智慧教育中得以普及應(yīng)用,如近年來(lái)很多新的拍照解題App,使用者只需要利用手機(jī)相機(jī)拍照上傳即可獲得相關(guān)題目的分析解答,促進(jìn)學(xué)習(xí)者學(xué)習(xí)效率的提升。此時(shí)視覺技術(shù)包括了對(duì)文字的檢測(cè)與識(shí)別,另外針對(duì)個(gè)人簡(jiǎn)歷識(shí)別、文檔識(shí)別等方面也能夠進(jìn)行拓展應(yīng)用。同時(shí)計(jì)算機(jī)視覺技術(shù)還可以在圖片搜索領(lǐng)域中得以應(yīng)用,使用者通過(guò)拍攝上傳相應(yīng)的圖片,即可從數(shù)據(jù)庫(kù)中找出與原圖相似的圖片,深度學(xué)習(xí)屬于一種非常高效的技術(shù)手段,能夠提供更加快速高效的圖像檢測(cè)功能,結(jié)合圖像搜索引擎,為用戶帶來(lái)更加便捷的服務(wù)[3-5]。
2.5醫(yī)療影像數(shù)據(jù)中的應(yīng)用
醫(yī)學(xué)影像直接關(guān)系到對(duì)患者疾病診斷的準(zhǔn)確性,對(duì)于放射科的醫(yī)務(wù)人員來(lái)說(shuō),依靠醫(yī)學(xué)影像能夠促進(jìn)診斷效率的提升?,F(xiàn)階段國(guó)內(nèi)外諸多醫(yī)學(xué)專家隊(duì)伍,在心血管、腫瘤、神經(jīng)內(nèi)科以及五官科等都建立了精準(zhǔn)深度學(xué)習(xí)模型,極大地推動(dòng)醫(yī)療水平的提升,為廣大患者帶來(lái)了更加便捷和高效的醫(yī)療服務(wù)?;谏疃葘W(xué)習(xí)技術(shù)的計(jì)算機(jī)視覺在醫(yī)療影像數(shù)據(jù)中的應(yīng)用主要集中在如下幾個(gè)方面:(1)能夠提供臨床診斷輔助等醫(yī)療服務(wù);(2)依靠數(shù)據(jù)分析技術(shù),能夠在很大程度上促進(jìn)醫(yī)療機(jī)構(gòu)經(jīng)營(yíng)管理水平的提升;(3)在醫(yī)學(xué)影像中的應(yīng)用,能夠讓醫(yī)務(wù)工作者更加直觀便捷地獲取患者影像;(4)深度學(xué)習(xí)技術(shù)能夠?yàn)獒t(yī)療大數(shù)據(jù)的可視化帶來(lái)便利;(5)在藥企研發(fā)工作中的應(yīng)用,可以處理好過(guò)去一直以來(lái)藥物研發(fā)周期長(zhǎng)和成本居高不下的問(wèn)題;(6)在健康管理領(lǐng)域中的應(yīng)用,借助于可穿戴設(shè)備來(lái)對(duì)個(gè)人健康數(shù)據(jù)實(shí)施監(jiān)測(cè),進(jìn)而對(duì)疾病風(fēng)險(xiǎn)予以提前預(yù)測(cè)。
3結(jié)語(yǔ)
深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域中應(yīng)用的終極目標(biāo)是為了讓機(jī)器可以和人類一樣,觀察并讀懂世界。近年來(lái)AI技術(shù)的不斷發(fā)展與普及應(yīng)用,深度學(xué)習(xí)技術(shù)必然會(huì)在計(jì)算機(jī)視覺領(lǐng)域中發(fā)揮出更大的價(jià)值,為現(xiàn)代人的生活和工作帶來(lái)更多便利。
參考文獻(xiàn)
[1]尹黎明,魯屹華.基于深度學(xué)習(xí)的監(jiān)控視頻圖像增強(qiáng)方法[J].湖北科技學(xué)院學(xué)報(bào),2019,39(05):123-125+130.
[2]林成創(chuàng),單純,趙淦森,楊志榮,彭璟,陳少潔,黃潤(rùn)樺,李壯偉,易序晟,杜嘉華,李雙印,羅浩宇,樊小毛,陳冰川.機(jī)器視覺應(yīng)用中的圖像數(shù)據(jù)增廣綜述[J].計(jì)算機(jī)科學(xué)與探索,2021,15(04):583-611.
[3]白翔,龐彥偉,章國(guó)鋒.計(jì)算機(jī)視覺中的深度學(xué)習(xí)專題(2020)簡(jiǎn)介[J].中國(guó)科學(xué):信息科學(xué),2020,50(02):303-304.
[4]馬元元,李向偉,劉艷飛.海量監(jiān)控視頻分級(jí)摘要生成系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2017,40(13):34-37.
[5]陳昭,趙蘇艷.盲環(huán)境下稀疏編碼監(jiān)控視頻圖像降噪仿真[J].計(jì)算機(jī)仿真,2020,37(03):368-371.
作者:徐衛(wèi)軍 單位:河北大學(xué)
本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):--