网站首页
教育杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
医学杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
经济杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
金融杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
管理杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
科技杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
工业杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
SCI杂志
中科院1区 中科院2区 中科院3区 中科院4区
全部期刊
公務(wù)員期刊網(wǎng) 論文中心 正文

計(jì)算機(jī)視覺中深度學(xué)習(xí)的應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計(jì)算機(jī)視覺中深度學(xué)習(xí)的應(yīng)用范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

計(jì)算機(jī)視覺中深度學(xué)習(xí)的應(yīng)用

摘要:闡述計(jì)算機(jī)視覺借助攝影機(jī)與計(jì)算機(jī)取代人眼對(duì)事物進(jìn)行識(shí)別、觀察和分析的一種機(jī)器視覺,深度學(xué)習(xí)技術(shù)在很大程度上促進(jìn)計(jì)算機(jī)視覺的發(fā)展,探討計(jì)算機(jī)視覺領(lǐng)域中的深度學(xué)習(xí)技術(shù)的應(yīng)用實(shí)例。

關(guān)鍵詞:計(jì)算機(jī)工程;視覺領(lǐng)域;深度學(xué)習(xí)技術(shù)

引言

計(jì)算機(jī)視覺簡(jiǎn)言之即是依靠電子設(shè)備成像來(lái)代替生物視覺系統(tǒng),隨后依靠提前寫好的程序?qū)Λ@取的圖像信息實(shí)施處理。該技術(shù)的短期應(yīng)用目的在于完成相對(duì)簡(jiǎn)單的智能視覺工作,而深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用,在很大程度上豐富了其功能,提高了識(shí)別效率,讓其能夠在更多行業(yè)發(fā)揮出自身價(jià)值。

1計(jì)算機(jī)視覺領(lǐng)域的深度學(xué)習(xí)技術(shù)

1.1圖像分類中的深度學(xué)習(xí)技術(shù)

基于深度學(xué)習(xí)技術(shù),卷積神經(jīng)網(wǎng)絡(luò)得到了進(jìn)一步的發(fā)展,其應(yīng)用范圍也更為寬泛,例如說(shuō)在圖像分類中的運(yùn)用。圖像分析需要對(duì)圖像實(shí)施掃描分析,隨后對(duì)其具體類別予以劃分,更加注重其整體語(yǔ)義。目前相對(duì)普遍進(jìn)行圖像分類的數(shù)據(jù)集為ImageNet,其中囊括了非常豐富的內(nèi)容,存儲(chǔ)了近1500萬(wàn)個(gè)圖像的URL并將圖像劃分為數(shù)萬(wàn)余個(gè)類型。ImageNet每年組織開展的大規(guī)模視覺識(shí)別挑戰(zhàn)賽(ILSVRC)中,圖像分類算法與技術(shù)也不斷創(chuàng)新,圖像分類的準(zhǔn)確性也持續(xù)提升。ImageNet數(shù)據(jù)集表現(xiàn)出規(guī)模大、類型多的突出特點(diǎn),所以更加適用于遷移學(xué)習(xí),即是把部分核心技術(shù)或結(jié)構(gòu)拓展應(yīng)用到各個(gè)領(lǐng)域,對(duì)于視覺領(lǐng)域的深度模型來(lái)說(shuō),能夠把模型內(nèi)的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)直接共享到其他數(shù)據(jù)集,從而對(duì)數(shù)據(jù)實(shí)施微調(diào)。圖像分類屬于計(jì)算機(jī)視覺領(lǐng)域最為基礎(chǔ)的環(huán)節(jié),對(duì)于圖像分類模型創(chuàng)建和數(shù)據(jù)分析處理經(jīng)驗(yàn)也能夠遷移應(yīng)用到其他領(lǐng)域中。

1.2目標(biāo)檢測(cè)中的深度學(xué)習(xí)技術(shù)

目標(biāo)檢測(cè)相對(duì)于圖像分類而言表現(xiàn)出更多的復(fù)雜性,主要任務(wù)是在囊括多種不同類型物體的圖像內(nèi)精確定位和識(shí)別某一物體,恰恰是出于這一目的,深度學(xué)習(xí)技術(shù)在目標(biāo)檢測(cè)中的應(yīng)用更為復(fù)雜,要實(shí)現(xiàn)更加精準(zhǔn)的效果也相對(duì)更難。近年來(lái)針對(duì)目標(biāo)檢測(cè)的算法日益更新,如優(yōu)化后的R-CNN算法,是借助于卷積神經(jīng)網(wǎng)絡(luò)思想,對(duì)物體進(jìn)行分類,提取物體特征。而SelectiveSearch算法的出現(xiàn)有了進(jìn)一步的創(chuàng)新和突破,有效促進(jìn)了檢測(cè)準(zhǔn)確性的提高,這也給通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)帶來(lái)了更多可能性,隨后的FastR-CNN算法極大地促進(jìn)了目標(biāo)檢測(cè)效率的提升,該算法對(duì)提取候選區(qū)的問(wèn)題予以優(yōu)化,大大減少了候選區(qū)提取和目標(biāo)檢測(cè)過(guò)程的時(shí)間。目標(biāo)檢測(cè)網(wǎng)絡(luò)以FastR-CNN算法作為支撐,于輸出位置設(shè)置滑動(dòng)窗同時(shí)和候選區(qū)域網(wǎng)絡(luò)實(shí)施連接,目標(biāo)檢測(cè)的關(guān)鍵在于卷積神經(jīng)網(wǎng)絡(luò),依靠它把各個(gè)點(diǎn)的特征進(jìn)行提取,再借助回歸算法獲得對(duì)應(yīng)范圍出現(xiàn)目標(biāo)的概率[1]。

1.3人臉識(shí)別中的深度學(xué)習(xí)技術(shù)

人臉識(shí)別主要是借助相應(yīng)算法對(duì)人臉特征實(shí)施提取,因?yàn)槠浣⒌娜四樐P捅憩F(xiàn)出一定的不穩(wěn)定性,因此模型建立往往也表現(xiàn)出一定的難度,相對(duì)于建立剛體模型而言更為困難。人臉識(shí)別通常來(lái)說(shuō)涉及人臉檢測(cè)定位以及特征提取兩個(gè)方面,人臉檢測(cè)定位是基于背景圖像中將人臉目標(biāo)分割出來(lái),實(shí)施歸一化處理,而人臉特征提取算法不變。前者存在的技術(shù)難點(diǎn)是人臉目標(biāo)具有多樣性以及背景圖像具有復(fù)雜性,所以對(duì)背景情境實(shí)施合理假設(shè)并予以簡(jiǎn)化是十分關(guān)鍵的。與此同時(shí),高維空間人臉模型的建立較為復(fù)雜,精確度估算難度較大,人臉特征提取的技術(shù)難度是因?yàn)槿四槍儆趶椥阅P?,其難度超過(guò)剛體模型。一般來(lái)說(shuō),較為常見對(duì)人臉特征實(shí)施提取與識(shí)別的方法有幾何特征法、特征臉?biāo)惴ㄒ约皬椥阅P头?,CNN算法和過(guò)去的特征提取算法比起來(lái)表現(xiàn)出更高的穩(wěn)定性和適用性,同時(shí)能夠有效抵抗外部干擾,促進(jìn)人臉識(shí)別技術(shù)的推廣應(yīng)用。

2應(yīng)用實(shí)例

2.1安防領(lǐng)域的應(yīng)用

深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域中的應(yīng)用可以為安防行業(yè)提供更佳的解決方案,比如說(shuō)人臉識(shí)別技術(shù)的應(yīng)用,很多大型企業(yè)如Facebook、騰訊、阿里巴巴等都將非常關(guān)注和重視。作為深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域應(yīng)用的重要內(nèi)容,人臉識(shí)別在安檢以及反恐等領(lǐng)域中也能夠發(fā)揮出很好的效果。與此同時(shí),對(duì)行人角度的REID技術(shù)實(shí)施研究,依托于深度學(xué)習(xí)強(qiáng)化目標(biāo)檢測(cè),對(duì)目標(biāo)特征實(shí)施提取和刻畫,能夠?yàn)楫惓P袨楸O(jiān)控和跟蹤帶來(lái)支持[2]。

2.2無(wú)人駕駛領(lǐng)域的應(yīng)用

對(duì)于無(wú)人駕駛領(lǐng)域來(lái)說(shuō),選擇激光或雷達(dá)這類傳感器的成本更高,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)也能夠提供新的解決方案。依靠攝像機(jī)對(duì)視頻畫面進(jìn)行采集,對(duì)獲取到的圖像實(shí)施分析,提供類似于前車碰撞預(yù)警等功能。在這一過(guò)程中,計(jì)算機(jī)視覺技術(shù)可以實(shí)現(xiàn)對(duì)目標(biāo)的檢測(cè)識(shí)別、對(duì)目標(biāo)車輛的跟蹤分析、對(duì)車道線是否偏離進(jìn)行檢測(cè)等?;谏疃葘W(xué)習(xí)技術(shù)的檢測(cè)識(shí)別表現(xiàn)出更加強(qiáng)大的優(yōu)勢(shì),現(xiàn)階段深度學(xué)習(xí)芯片日益增多,對(duì)于無(wú)人駕駛技術(shù)的發(fā)展也帶來(lái)了更加有力的支持。

2.3智能家居領(lǐng)域的應(yīng)用

過(guò)去的很多智能家居產(chǎn)品一般都是依靠智能手機(jī)藍(lán)牙或者WiFi等途徑來(lái)實(shí)現(xiàn)對(duì)家居產(chǎn)品的控制,這一方案即便能夠做到家居智能化,但其水平依舊有待提高?;谏疃葘W(xué)習(xí)技術(shù),能夠有效促進(jìn)智能家居行業(yè)的更新發(fā)展,除開語(yǔ)言、語(yǔ)音識(shí)別之外,還能夠利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)人際交流與互動(dòng),比如說(shuō)手勢(shì)識(shí)別控制。2.4教育領(lǐng)域和圖片搜索領(lǐng)域的應(yīng)用基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)也能夠在智慧教育中得以普及應(yīng)用,如近年來(lái)很多新的拍照解題App,使用者只需要利用手機(jī)相機(jī)拍照上傳即可獲得相關(guān)題目的分析解答,促進(jìn)學(xué)習(xí)者學(xué)習(xí)效率的提升。此時(shí)視覺技術(shù)包括了對(duì)文字的檢測(cè)與識(shí)別,另外針對(duì)個(gè)人簡(jiǎn)歷識(shí)別、文檔識(shí)別等方面也能夠進(jìn)行拓展應(yīng)用。同時(shí)計(jì)算機(jī)視覺技術(shù)還可以在圖片搜索領(lǐng)域中得以應(yīng)用,使用者通過(guò)拍攝上傳相應(yīng)的圖片,即可從數(shù)據(jù)庫(kù)中找出與原圖相似的圖片,深度學(xué)習(xí)屬于一種非常高效的技術(shù)手段,能夠提供更加快速高效的圖像檢測(cè)功能,結(jié)合圖像搜索引擎,為用戶帶來(lái)更加便捷的服務(wù)[3-5]。

2.5醫(yī)療影像數(shù)據(jù)中的應(yīng)用

醫(yī)學(xué)影像直接關(guān)系到對(duì)患者疾病診斷的準(zhǔn)確性,對(duì)于放射科的醫(yī)務(wù)人員來(lái)說(shuō),依靠醫(yī)學(xué)影像能夠促進(jìn)診斷效率的提升?,F(xiàn)階段國(guó)內(nèi)外諸多醫(yī)學(xué)專家隊(duì)伍,在心血管、腫瘤、神經(jīng)內(nèi)科以及五官科等都建立了精準(zhǔn)深度學(xué)習(xí)模型,極大地推動(dòng)醫(yī)療水平的提升,為廣大患者帶來(lái)了更加便捷和高效的醫(yī)療服務(wù)?;谏疃葘W(xué)習(xí)技術(shù)的計(jì)算機(jī)視覺在醫(yī)療影像數(shù)據(jù)中的應(yīng)用主要集中在如下幾個(gè)方面:(1)能夠提供臨床診斷輔助等醫(yī)療服務(wù);(2)依靠數(shù)據(jù)分析技術(shù),能夠在很大程度上促進(jìn)醫(yī)療機(jī)構(gòu)經(jīng)營(yíng)管理水平的提升;(3)在醫(yī)學(xué)影像中的應(yīng)用,能夠讓醫(yī)務(wù)工作者更加直觀便捷地獲取患者影像;(4)深度學(xué)習(xí)技術(shù)能夠?yàn)獒t(yī)療大數(shù)據(jù)的可視化帶來(lái)便利;(5)在藥企研發(fā)工作中的應(yīng)用,可以處理好過(guò)去一直以來(lái)藥物研發(fā)周期長(zhǎng)和成本居高不下的問(wèn)題;(6)在健康管理領(lǐng)域中的應(yīng)用,借助于可穿戴設(shè)備來(lái)對(duì)個(gè)人健康數(shù)據(jù)實(shí)施監(jiān)測(cè),進(jìn)而對(duì)疾病風(fēng)險(xiǎn)予以提前預(yù)測(cè)。

3結(jié)語(yǔ)

深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域中應(yīng)用的終極目標(biāo)是為了讓機(jī)器可以和人類一樣,觀察并讀懂世界。近年來(lái)AI技術(shù)的不斷發(fā)展與普及應(yīng)用,深度學(xué)習(xí)技術(shù)必然會(huì)在計(jì)算機(jī)視覺領(lǐng)域中發(fā)揮出更大的價(jià)值,為現(xiàn)代人的生活和工作帶來(lái)更多便利。

參考文獻(xiàn)

[1]尹黎明,魯屹華.基于深度學(xué)習(xí)的監(jiān)控視頻圖像增強(qiáng)方法[J].湖北科技學(xué)院學(xué)報(bào),2019,39(05):123-125+130.

[2]林成創(chuàng),單純,趙淦森,楊志榮,彭璟,陳少潔,黃潤(rùn)樺,李壯偉,易序晟,杜嘉華,李雙印,羅浩宇,樊小毛,陳冰川.機(jī)器視覺應(yīng)用中的圖像數(shù)據(jù)增廣綜述[J].計(jì)算機(jī)科學(xué)與探索,2021,15(04):583-611.

[3]白翔,龐彥偉,章國(guó)鋒.計(jì)算機(jī)視覺中的深度學(xué)習(xí)專題(2020)簡(jiǎn)介[J].中國(guó)科學(xué):信息科學(xué),2020,50(02):303-304.

[4]馬元元,李向偉,劉艷飛.海量監(jiān)控視頻分級(jí)摘要生成系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2017,40(13):34-37.

[5]陳昭,趙蘇艷.盲環(huán)境下稀疏編碼監(jiān)控視頻圖像降噪仿真[J].計(jì)算機(jī)仿真,2020,37(03):368-371.

作者:徐衛(wèi)軍 單位:河北大學(xué)

免责声明

本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。

AI写作,高效原创

在线指导,快速准确,满意为止

立即体验
文秘服务 AI帮写作 润色服务 论文发表