公務(wù)員期刊網(wǎng) 論文中心 正文

計(jì)算機(jī)生成式對(duì)抗網(wǎng)絡(luò)研究進(jìn)展與展望

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計(jì)算機(jī)生成式對(duì)抗網(wǎng)絡(luò)研究進(jìn)展與展望范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

計(jì)算機(jī)生成式對(duì)抗網(wǎng)絡(luò)研究進(jìn)展與展望

摘要:生成對(duì)抗網(wǎng)絡(luò)(GAN)作為一種深層次的計(jì)算機(jī)學(xué)習(xí)模型,已經(jīng)成為近年來(lái)神經(jīng)網(wǎng)絡(luò)領(lǐng)域中非常具有發(fā)展前景的一項(xiàng)技術(shù)模型,本文通過(guò)對(duì)相關(guān)文獻(xiàn)的整理和查閱,首先簡(jiǎn)述了原始的生成對(duì)抗網(wǎng)絡(luò)的組成以及其相關(guān)特征,隨后基于原始網(wǎng)絡(luò)的一些嚴(yán)重缺陷介紹了相關(guān)的改進(jìn)網(wǎng)絡(luò)的優(yōu)化方法,最終對(duì)整篇論文進(jìn)行總結(jié),并對(duì)未來(lái)的發(fā)展進(jìn)行了展望。

關(guān)鍵詞:計(jì)算機(jī);生成式對(duì)抗網(wǎng)絡(luò);圖像處理;研究進(jìn)展

1緒論

Goodfellow基于博弈論中零和談判的觀點(diǎn)于2014年提出了“生成式對(duì)抗網(wǎng)絡(luò)”這一概念,這一方法是用深度學(xué)習(xí)網(wǎng)以及相關(guān)模型絡(luò)來(lái)驗(yàn)證圖像真?zhèn)螐亩蓴?shù)據(jù)樣本的。生成對(duì)抗網(wǎng)絡(luò)目前以及成為計(jì)算機(jī)領(lǐng)域以及圖像識(shí)別領(lǐng)域非常重要的方法之一,具有非常廣闊的發(fā)展前景,GAN網(wǎng)絡(luò)是不斷的通過(guò)生成模型以及判別模型兩者之間的競(jìng)爭(zhēng)得到所需的數(shù)據(jù)樣本的。GAN學(xué)習(xí)模型可適用多種不同情況下的數(shù)據(jù)處理分析[1]。

2原始生成式對(duì)抗網(wǎng)絡(luò)模型

2.1GAN網(wǎng)絡(luò)結(jié)構(gòu)

模型分為生成模型(GenerativeModel)和判別模型(Dis-criminativeModel)。下圖1就是GAN模型的結(jié)構(gòu)組成。

2.2生成網(wǎng)絡(luò)

生成器本質(zhì)上是一個(gè)可微分函數(shù),生成器接收隨機(jī)變量z的輸入,經(jīng)生成假樣本。在GAN中,生成器對(duì)輸入變量z基本沒有限制,z通常是一個(gè)100維的隨機(jī)編碼向量,z可以是隨機(jī)噪聲或者符合某種分布的變量。生成器理論上可以逐漸學(xué)習(xí)任何概率分布,經(jīng)訓(xùn)練后的生成網(wǎng)絡(luò)可以生成不和真實(shí)圖像完全一樣的逼真圖像,實(shí)際上是生成網(wǎng)絡(luò)學(xué)習(xí)了訓(xùn)練數(shù)據(jù)的一個(gè)分布,從而形成了相關(guān)的近似分布,這在數(shù)據(jù)增強(qiáng)應(yīng)用領(lǐng)域方面非常的重要[2]。

2.3判別網(wǎng)絡(luò)

判別器實(shí)際上本質(zhì)與生成器是一樣的都是一種可以微分的函數(shù),在生成對(duì)抗網(wǎng)絡(luò)中,其實(shí)判別器的作用同它的名字一樣就是判別輸入的樣本是否為真實(shí)樣本,并在此基礎(chǔ)上通過(guò)循環(huán)來(lái)指導(dǎo)生成器進(jìn)行下一步的訓(xùn)練與合成。

3改進(jìn)的生成式對(duì)抗網(wǎng)絡(luò)模型

生成對(duì)抗網(wǎng)絡(luò)含有多種優(yōu)點(diǎn)如具有更強(qiáng)大的預(yù)測(cè)能力;與強(qiáng)化學(xué)習(xí)相比,對(duì)抗式學(xué)習(xí)更接近人類的學(xué)習(xí)機(jī)理。但他也存在致命的缺點(diǎn),即網(wǎng)絡(luò)難以收斂。本文通過(guò)對(duì)文獻(xiàn)的梳理,整理出幾個(gè)被廣泛認(rèn)可的改進(jìn)模型如下:

3.1條件生成對(duì)抗網(wǎng)絡(luò)

基本GAN系統(tǒng)的圖像生成過(guò)程比較沒有約束,所以越大的圖像,用基本的GAN系統(tǒng)越難以控制。為了對(duì)這個(gè)情況進(jìn)行改進(jìn)以及研究,Mirza[3]等提出條件生成對(duì)抗模型(ConditionalGAN)。該模型除了像原始網(wǎng)絡(luò)一樣輸入之外,還會(huì)再輸入一個(gè)條件變量c,CGAN結(jié)構(gòu)如圖2。比如一段描述句子,鑲嵌到與之對(duì)應(yīng)的圖片中,經(jīng)過(guò)訓(xùn)練,模型可以“看圖說(shuō)話”;c同樣可以是對(duì)應(yīng)的目標(biāo)圖片,這樣GAN可以有目標(biāo)地去學(xué)習(xí)。

3.2深度卷積生成對(duì)抗網(wǎng)絡(luò)

該卷積模型相較于全連接模型更加適用于處理分析比較復(fù)雜的圖像數(shù)據(jù)。所以Radford等[4]研究者提出了深度卷積GAN(deepconvolutionalGAN,DC-GAN)它是把原始GAN中的兩個(gè)生成與判別模型改進(jìn)換成了兩個(gè)深度CNN。使用步幅卷積和微步幅卷積有效地保留了特征信息[5],從而能對(duì)較復(fù)雜的問(wèn)題以及圖像處理的更加完美。

3.3Wasserstein生成對(duì)抗網(wǎng)絡(luò)

原始GAN訓(xùn)練出現(xiàn)梯度消失和模式崩潰的主要原因是使用JS距離來(lái)衡量?jī)蓚€(gè)分布。

3.4基于能量的生成對(duì)抗網(wǎng)絡(luò)

文獻(xiàn)[6]從能量模型的角度改進(jìn)了原始網(wǎng)絡(luò),研究出來(lái)了基于能量的生成對(duì)抗網(wǎng)絡(luò)(EnergyBasedGAN,EB-GAN)模型。因?yàn)樗呐袆e器D主要由自編碼器(auto-encoder)構(gòu)成,這就使得它判別輸入圖像的真假是通過(guò)重新構(gòu)建圖像的像素質(zhì)量高低來(lái)決定的。EB-GAN的實(shí)驗(yàn)表明,在實(shí)驗(yàn)過(guò)程中其表現(xiàn)確實(shí)比原始GAN網(wǎng)絡(luò)更好,圖像更穩(wěn)定同時(shí)分辨率更高,對(duì)于整體起到了優(yōu)化的作用。

4結(jié)語(yǔ)

GAN目前是一個(gè)較為全新的領(lǐng)域,各個(gè)專家學(xué)者也在這個(gè)領(lǐng)域不斷的創(chuàng)新研究提出各種各樣的想法以及改進(jìn)措施,本文主要總結(jié)了原始生成對(duì)抗網(wǎng)絡(luò)的基本構(gòu)成以及特征,以及近些年來(lái)一些經(jīng)典的改進(jìn)網(wǎng)絡(luò)及其實(shí)現(xiàn)過(guò)程,在整理的過(guò)程中受益匪淺,學(xué)到了許多,也更加深入的了解了這一塊的內(nèi)容,日后也希望能更多的通過(guò)對(duì)生成網(wǎng)絡(luò)的了解,來(lái)發(fā)現(xiàn)更具有價(jià)值的改進(jìn)模型??萍疾粩嗟陌l(fā)展進(jìn)步,越來(lái)越智能的時(shí)代即將來(lái)臨,讓我們帶著創(chuàng)新上路,不斷學(xué)習(xí)進(jìn)步!

參考文獻(xiàn):

[1]朱秀昌,唐貴進(jìn).生成對(duì)抗網(wǎng)絡(luò)圖像處理綜述[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,39(3):1673-1682.

[2]梁俊杰,韋艦晶,蔣正鋒,等.生成對(duì)抗網(wǎng)絡(luò)GAN綜述[J].計(jì)算機(jī)科學(xué)與探索,2019,14(1):1-17.

[4]朱虹,李千目,李德強(qiáng).基于單個(gè)卷積神經(jīng)網(wǎng)絡(luò)的面部多特征點(diǎn)定位[J].計(jì)算機(jī)科學(xué),2018,45(4):273-279.

[5]曹仰杰,賈麗麗,陳永霞,等.生成式對(duì)抗網(wǎng)絡(luò)及其計(jì)算機(jī)視覺應(yīng)用研究綜述[J].中國(guó)圖像圖形學(xué)報(bào),2018,14(1):1-17.

作者:段風(fēng)磊 單位:安徽省淮南市廣播電視臺(tái)