公務(wù)員期刊網(wǎng) 精選范文 視覺(jué)算法培訓(xùn)范文

視覺(jué)算法培訓(xùn)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的視覺(jué)算法培訓(xùn)主題范文,僅供參考,歡迎閱讀并收藏。

視覺(jué)算法培訓(xùn)

第1篇:視覺(jué)算法培訓(xùn)范文

關(guān)鍵詞: 虛擬現(xiàn)實(shí); 雙目視差; 近距顯示; 視覺(jué)舒適度

中圖分類(lèi)號(hào): TN27?34; TM417 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)01?0140?05

Abstract: The virtual reality technology developed rapidly, and has been widely used in many fields, but the traditional CAVE system is difficult to promote and popularize due to the large floor space, high cost and difficult installation and adjustment, therefore, the research and development of the portable CAVE system has great significance to the popularization and development of the virtual reality technology. According to the features of the portable CAVE system, the visual optical system was designed, the distortion correction of the projected image and random dot stereogram generation algorithm are studied, and the close range stereoscopic display system based on visual optical system adjustment was built. The subjective evaluation experiment of the visual comfort degree was designed and implemented to explore the relationship between the visual fatigue degree and parallax caused by the close range display. The visual comfort degree of the stereoscopic display system based on visual optical system was assessed. This technology provides a reference foundation for the study of the portable CAVE system, and has a certain practical significance to the development of the virtual reality technology and the study of the stereoscopic visual comfort degree.

Keywords: virtual reality; binocular disparity; close range display; visual comfort degree

0 引 言

近年恚虛擬現(xiàn)實(shí)技術(shù)發(fā)展迅速,已經(jīng)被廣泛應(yīng)用于軍事訓(xùn)練、醫(yī)學(xué)實(shí)習(xí)、娛樂(lè)游戲等諸多領(lǐng)域。傳統(tǒng)的虛擬現(xiàn)實(shí)顯示系統(tǒng)雖然技術(shù)成熟,但存在一些弊端,因此便攜式CAVE系統(tǒng)的概念應(yīng)運(yùn)而生。本文搭建了近距立體顯示原型系統(tǒng),通過(guò)主觀實(shí)驗(yàn),探究了便攜式CAVE系統(tǒng)中雙目視差的感知深度和單眼聚焦感知深度的差異,以及用戶可接受的視覺(jué)舒適范圍,對(duì)基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺(jué)舒適度進(jìn)行評(píng)估。

1 立體視覺(jué)舒適度的評(píng)估方法

1.1 刺激方法的選擇

為了避免視差的時(shí)間積累效應(yīng),實(shí)驗(yàn)采用雙刺激連續(xù)分級(jí)法。為控制實(shí)驗(yàn)過(guò)程中產(chǎn)生的習(xí)慣誤差,不同視差的立體圖按照隨機(jī)序列交替呈現(xiàn),且各視差出現(xiàn)的次數(shù)相等,整個(gè)序列中在前在后的機(jī)會(huì)相等。

實(shí)驗(yàn)的具體刺激方法是:將波紋中心在零視差處的刺激物記為基準(zhǔn)圖波紋中心在其他位置的刺激物記為待評(píng)估圖每次施測(cè)依次顯示三個(gè)刺激物,其順序?yàn)榛蛘咂淠康氖菑?qiáng)迫用戶改變雙眼的輻輳角度。每個(gè)刺激物顯示1.5 s,三個(gè)刺激物共顯示4.5 s,不同視差的待評(píng)估圖像隨機(jī)出現(xiàn)。被試者要獨(dú)立地進(jìn)行觀測(cè),選出其中一個(gè)與其他兩個(gè)波動(dòng)方向不同的刺激物,并對(duì)該過(guò)程的視覺(jué)舒適度進(jìn)行主觀評(píng)分。同一組圖像需隨機(jī)顯示兩次以便對(duì)評(píng)分結(jié)果進(jìn)行一致性檢查。

1.2 反應(yīng)指標(biāo)的選擇

反應(yīng)指標(biāo)的選擇應(yīng)依據(jù)以下原則:

(1) 無(wú)害性。所選取的反應(yīng)指標(biāo)不應(yīng)對(duì)被試者產(chǎn)生身體傷害,同時(shí)不能對(duì)被試者產(chǎn)生負(fù)面心理影響,阻礙實(shí)驗(yàn)的繼續(xù)進(jìn)行。

(2) 無(wú)干擾性。所選取的反應(yīng)指標(biāo)在測(cè)量過(guò)程中不能干擾被試者正常觀看圖像。

(3) 敏感性。所選反應(yīng)指標(biāo)應(yīng)該能夠有效地反應(yīng)出視覺(jué)舒適度和視覺(jué)疲勞程度。

根據(jù)分析,實(shí)驗(yàn)主要采用主觀評(píng)估方法對(duì)視覺(jué)舒適度進(jìn)行研究。主觀評(píng)價(jià)方法更適用于對(duì)視覺(jué)舒適度進(jìn)行綜合評(píng)價(jià)。舒適度的主觀評(píng)價(jià)方法[1]主要是讓被試者在觀看立體圖像前后根據(jù)自身的視覺(jué)狀況填寫(xiě)問(wèn)卷,并對(duì)問(wèn)卷的結(jié)果進(jìn)行統(tǒng)計(jì)分析。

1.3 主觀量表設(shè)計(jì)方法

主觀量是指用戶對(duì)客觀刺激產(chǎn)生的主觀度量,又稱心理量[2]。在視覺(jué)實(shí)驗(yàn)中,主觀評(píng)估方法需對(duì)被試者心理量進(jìn)行測(cè)量。主觀實(shí)驗(yàn)中的心理度量表主要包括:強(qiáng)迫選擇度量表、圖示度量表和數(shù)值度量表。

(1) 強(qiáng)迫選擇度量表。強(qiáng)迫選擇度量表是在主觀評(píng)估實(shí)驗(yàn)時(shí)主試者提供一些對(duì)立相反的詞語(yǔ)讓被試者做出選擇。強(qiáng)迫選擇度量表可以避免被試者受到他人的影響,但可能會(huì)使被試者產(chǎn)生抵觸情緒,因?yàn)榇蠖鄶?shù)人不愿意讓自己處于兩難選擇的境地。

(2) 圖示度量表。圖示度量表好比一個(gè)溫度計(jì),通常用一條直線表示,直線兩端具有相反程度的詞語(yǔ)。這條直線可以是水平的,也可以是垂直的。實(shí)驗(yàn)中被試者需在直線上做標(biāo)記,實(shí)驗(yàn)后主試者用標(biāo)尺對(duì)標(biāo)記進(jìn)行度量,將它轉(zhuǎn)換成數(shù)字并進(jìn)行統(tǒng)計(jì)。圖示度量表的數(shù)據(jù)統(tǒng)計(jì)工作較為復(fù)雜和繁瑣,本文實(shí)驗(yàn)的數(shù)據(jù)量巨大,因此圖示度量表并不適用。

(3) 數(shù)值度量表。在數(shù)值度量表中,被試者根據(jù)事先定義的數(shù)字等級(jí)進(jìn)行評(píng)定,一般為7級(jí)評(píng)分或5級(jí)評(píng)分。在視覺(jué)舒適度研究中,可設(shè)計(jì)度量表如下:非常舒適、舒適、一般、不舒適、非常不舒適。設(shè)定等級(jí)分值時(shí)可以考慮“非常不舒適”為-2分,“不舒適”為-1分,“一般”為0分,“舒適”為1分,“非常舒適”為2分;也可以考慮“非常不舒適”為1分,“不舒適”為2分,“一般”為3分,“舒適”為4分,“非常舒適”為5分。通常情況下不管哪種處理和分析得到的結(jié)果是等效的。

本文實(shí)驗(yàn)為了使被試者容易理解,考慮一般人的思維模式,將數(shù)值度量表等級(jí)設(shè)計(jì)為:“非常舒適”為1分,“舒適”為2分,“一般”為3分,“不舒適”為4分,“極不舒適”為5分。舒適度量表如表1所示。

2 近距立體顯示實(shí)驗(yàn)系統(tǒng)

2.1 目視光學(xué)系統(tǒng)

在便攜式CAVE系統(tǒng)中,需要利用目視光學(xué)系統(tǒng)調(diào)節(jié)用戶眼睛的調(diào)節(jié)距離,使人眼不再聚焦于屏幕上。本文實(shí)驗(yàn)的目的是研究經(jīng)過(guò)目視光學(xué)系統(tǒng)調(diào)節(jié)后的單眼調(diào)節(jié)距離和雙眼輻輳距離的差異對(duì)用戶視覺(jué)舒適度的影響。實(shí)驗(yàn)中需通過(guò)改變目視光學(xué)系統(tǒng)的屈光度來(lái)改變被試者單眼的調(diào)節(jié)距離??紤]到人眼作為自然界的最高級(jí)光學(xué)接收系統(tǒng),具有極強(qiáng)的自我適應(yīng)和調(diào)節(jié)能力,因此,本系統(tǒng)選用單片式目鏡即可滿足基本的成像要求。

2.2 隨機(jī)點(diǎn)立體圖的生成

隨機(jī)點(diǎn)立體圖像對(duì)的生成算法如下:

設(shè)基面為視差面為

(1) 將基面沿縱方向均分成塊,左邊第一塊區(qū)域?yàn)樵紖^(qū),其余各塊區(qū)域均為重復(fù)區(qū)域。重復(fù)間距為d必須小于瞳距。

(2) 在原始區(qū)內(nèi)畫(huà)一個(gè)隨機(jī)點(diǎn)

(3) 令得到一新的點(diǎn)如果點(diǎn)在面內(nèi),則令如果點(diǎn)不在面內(nèi),則令然后在處畫(huà)出這個(gè)新點(diǎn)。

(4) 重復(fù)上述步驟(2)、步驟(3),直到圖面上布滿適當(dāng)密度的隨機(jī)點(diǎn)為止。

2.3 投影圖像的畸變矯正

本系統(tǒng)應(yīng)采用側(cè)投影的方式,在這種情況下投影圖像會(huì)產(chǎn)生畸變,應(yīng)進(jìn)行投影圖像的畸變矯正。進(jìn)行投影圖像的畸變矯正的模型是將真實(shí)投影機(jī)的投影圖像變換為虛擬投影機(jī)的投影圖像,從而恢復(fù)原始圖像[5]。其基本過(guò)程是:根據(jù)透視變換原理,先計(jì)算出投影機(jī)圖像平面到投影平面的單映矩陣,再將投影機(jī)圖像平面上的所有像素點(diǎn)乘以這個(gè)單映矩陣后進(jìn)行顯示,那么屏幕上獲得的圖像就是校正后的圖像。

3 近距立體顯示系統(tǒng)的舒適度評(píng)估實(shí)驗(yàn)

3.1 實(shí)驗(yàn)?zāi)康募霸?/p>

本實(shí)驗(yàn)的主要目的是研究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的近距立體顯示系統(tǒng)中單眼感知深度(調(diào)節(jié)距離)和雙眼感知深度(輻輳距離)[5]的差異對(duì)用戶視覺(jué)舒適度的影響。

由式(8)可知,當(dāng)眼睛到屏幕的距離和瞳距一定時(shí),通過(guò)改變立體圖像對(duì)的水平視差可以改變被試者的雙眼感知深度(輻輳距離)。

3.2 被試者篩選及培訓(xùn)

篩選工具:數(shù)字化立體視覺(jué)檢查圖(立體視覺(jué)檢查卡、立體視銳度檢查卡)、瞳距測(cè)量尺。

本實(shí)驗(yàn)被試者的篩選流程如下:

第一步:詢問(wèn)被試者眼部的健康狀況、有無(wú)色盲、是否做過(guò)眼部手術(shù)、是否有眼部病史,如結(jié)膜炎、眼眶骨折等,篩選出眼睛健康且無(wú)病史的被試者。

第二步:進(jìn)行立體視覺(jué)測(cè)試,檢查被試者的雙目立體視覺(jué)是否正常,排除立體盲。

第三步:對(duì)立體視覺(jué)正常的被試者進(jìn)行立體視銳度測(cè)試,篩選出立體視銳度小于60 arcmin的被試者。

第四步:對(duì)被試者的年齡、性別、視力、瞳距、有無(wú)主觀實(shí)驗(yàn)經(jīng)驗(yàn)、是否從事立體視覺(jué)相關(guān)工作等基本信息進(jìn)行記錄[6]。

榱吮苊獗皇哉哂捎誆皇煜な笛榱鞒毯筒僮鞴程而影響實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,實(shí)驗(yàn)前需對(duì)被試者進(jìn)行相關(guān)培訓(xùn)和模擬練習(xí)。

首先,采用無(wú)偏向性的語(yǔ)氣向被試者講解實(shí)驗(yàn)?zāi)康摹⒃u(píng)價(jià)類(lèi)型、評(píng)價(jià)等級(jí)和時(shí)間限制等內(nèi)容,使被試者正確透徹地理解評(píng)判標(biāo)準(zhǔn),并向被試者展示舒適度明顯不同的若干立體圖像示例。

然后,讓被試者進(jìn)行模擬練習(xí),模擬練習(xí)的內(nèi)容與正式的實(shí)驗(yàn)過(guò)程類(lèi)似。被試者連續(xù)觀看三組立體圖像后,用選擇器輸入差異圖像的編號(hào)并對(duì)該組立體圖像引起的視疲勞程度進(jìn)行評(píng)分,練習(xí)時(shí)間為3 min。

培訓(xùn)完成后,被試者即可進(jìn)行正式的主觀視覺(jué)舒適度評(píng)價(jià)實(shí)驗(yàn)。

3.3 實(shí)驗(yàn)過(guò)程

實(shí)驗(yàn)1:探究近距顯示引起的視覺(jué)疲勞與視差的關(guān)系

被試者佩戴屈光度為0的目視光學(xué)系統(tǒng),在距離屏幕0.6 m的位置觀察隨機(jī)出現(xiàn)的立體圖像,并進(jìn)行視覺(jué)任務(wù)測(cè)試和主觀舒適度評(píng)分。實(shí)驗(yàn)1設(shè)定刺激物的中心到被試者的距離(輻輳距離)分別為0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,3.75 m,且隨機(jī)出現(xiàn)。調(diào)節(jié)距離為0.6 m。

實(shí)驗(yàn)1共進(jìn)行36組小測(cè)試。每組測(cè)試會(huì)連續(xù)出現(xiàn)3幅立體圖像,被試者雙眼融像[7]后,可看到立體圖像出現(xiàn)正弦波紋的效果,被試者需選出一個(gè)與其他兩個(gè)正弦波動(dòng)方向不同的立體圖像,利用選擇器將它的編號(hào)輸入到主機(jī)系統(tǒng)中。然后對(duì)該組小測(cè)試產(chǎn)生的視覺(jué)疲勞癥狀進(jìn)行主觀評(píng)分。

時(shí)間安排及流程:三種位置(1,2,3)×6種輻輳距離(0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,3.75 m)×2種顯示序列(B?Xi?B或Xi?B?Xi)=36次施測(cè),每次施測(cè)時(shí)間為1 min×36次=36 min。

實(shí)驗(yàn)2:探究基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體視覺(jué)舒適度

被試者隨機(jī)佩戴屈光度分別為的目視光學(xué)系統(tǒng),在距離屏幕0.6 m的位置依次進(jìn)行3個(gè)亞組的實(shí)驗(yàn),實(shí)驗(yàn)2中設(shè)定刺激物的中心到被試者的距離(輻輳距離)分別為0.79 m,0.94 m,1.15 m,1.50 m,2.14 m,且隨機(jī)出現(xiàn)。人眼的調(diào)節(jié)距離分別為1.09 m,1.50 m,2.40 m。

實(shí)驗(yàn)2中每個(gè)亞組各進(jìn)行30組小測(cè)試。每組測(cè)試會(huì)連續(xù)出現(xiàn)3幅立體圖像,被試者雙眼融像后,可以看到立體圖像出現(xiàn)正弦波紋的效果,被試者需選出一個(gè)與其他兩個(gè)正弦波動(dòng)方向不同的立體圖像,利用選擇器將它的編號(hào)輸入主機(jī)中,然后對(duì)該組小測(cè)試產(chǎn)生的視覺(jué)疲勞癥狀進(jìn)行主觀評(píng)分。

時(shí)間安排及流程:3種透鏡度數(shù)×3種位置(1,2,3)×5種輻輳距離(0.79 m,0.94 m,1.15 m,1.50 m,2.14 m)×2種顯示序列(B?Xi?B或Xi?B?Xi)=90次施測(cè),每次施測(cè)調(diào)節(jié)時(shí)間為1 min×90+15 min間隔休息×2=120 min。

3.4 實(shí)驗(yàn)結(jié)果分析

(1) 近距顯示引起的視覺(jué)疲勞與視差絕對(duì)值[8]呈正相關(guān)

將實(shí)驗(yàn)1中24個(gè)被試者的舒適度主觀評(píng)分根據(jù)不同的輻輳距離進(jìn)行均值統(tǒng)計(jì)。當(dāng)視差取絕對(duì)值時(shí),視差絕對(duì)值和視覺(jué)舒適度主觀評(píng)分值經(jīng)過(guò)線性擬合后得到兩者的關(guān)系模型為:

視差絕對(duì)值和視覺(jué)舒適度主觀評(píng)分值的線性相關(guān)度為具體見(jiàn)圖2。實(shí)驗(yàn)結(jié)果表明,視覺(jué)舒適度的主觀評(píng)分與視差值呈線性關(guān)系,也就是說(shuō),對(duì)于近距立體顯示單眼聚焦和雙眼輻輳的不一致性所引起的視覺(jué)疲勞與立體視差值成正比關(guān)系。單眼聚焦和雙眼輻輳的差異越大,產(chǎn)生的視疲勞程度越大,這個(gè)結(jié)果與大部分研究結(jié)果相一致。

(2) 主觀舒適度與理論值的符合度基本一致

將實(shí)驗(yàn)2中24個(gè)被試者的視覺(jué)舒適度主觀評(píng)分根據(jù)不同的輻輳距離和調(diào)節(jié)距離進(jìn)行均值統(tǒng)計(jì),并將每個(gè)亞組的理論舒適度和實(shí)驗(yàn)獲得的主觀舒適度進(jìn)行比較。

目視光學(xué)系統(tǒng)的屈光度為0.75D,1.00D,1.25D的實(shí)驗(yàn)結(jié)果,如圖3~圖5所示。

實(shí)驗(yàn)結(jié)果表明,當(dāng)調(diào)節(jié)距離一定時(shí),分別為1.09 m,1.5 m,2.4 m,由輻輳距離的改變引起的視疲勞癥狀與理論計(jì)算得到的結(jié)果在總趨勢(shì)上大體一致。在基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中,輻輳距離越小,符合度越好。在相同視差條件下,經(jīng)過(guò)目視光學(xué)系統(tǒng)調(diào)節(jié)后產(chǎn)生更大的不適感。

(3) 視差舒適度曲線

將實(shí)驗(yàn)2中三個(gè)亞組的所有情況的視差值與主觀舒適度評(píng)分進(jìn)行綜合統(tǒng)計(jì),繪制舒適度曲線如圖6所示。

實(shí)驗(yàn)結(jié)果表明,基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)中,視差絕對(duì)值越小,視覺(jué)舒適度越高。在同等視差條件下,非交叉視差的舒適度優(yōu)于交叉視差。與傳統(tǒng)立體顯示設(shè)備相比,舒適視域向非交叉視差方向偏移。

4 結(jié) 論

本文在充分了解雙目立體視覺(jué)原理、視差型立體顯示技術(shù)原理、立體顯示引起視覺(jué)疲勞的根本原因等理論知識(shí)的基礎(chǔ)上,搭建近距虛擬現(xiàn)實(shí)顯示系統(tǒng)原型作為實(shí)驗(yàn)系統(tǒng),設(shè)計(jì)實(shí)驗(yàn)研究了基于目視光學(xué)系統(tǒng)調(diào)節(jié)的立體顯示系統(tǒng)的視覺(jué)舒適度問(wèn)題。對(duì)虛擬現(xiàn)實(shí)技術(shù)的發(fā)展和立體視覺(jué)舒適度的研究具有一定的實(shí)際意義。

參考文獻(xiàn)

[1] 張英靜,李素梅,衛(wèi)津津,等.立體圖像質(zhì)量的主觀評(píng)價(jià)方案[J].光子學(xué)報(bào),2012,41(5):602?607.

[2] KIM D, CHOI S, SOHN K. Visual comfort enhancement for stereoscopic video based on binocular fusion characteristics [J]. IEEE transactions on circuits and systems for video technology, 2013, 23(3): 482?487.

[3] 王飛,王晨升,劉曉杰.立體顯示技術(shù)的原理、體視因素和術(shù)語(yǔ)[J].工程圖學(xué)學(xué)報(bào),2010(5):69?73.

[4] 李志永.立體視覺(jué)基礎(chǔ)[J].現(xiàn)代電影技術(shù),2011(1):52?55.

[5] 顧郁蓮,蔡宣平.計(jì)算機(jī)立體視圖繪制技術(shù)[J].國(guó)防科技參考,1998,19(1):63?70.

[6] 敬萬(wàn)鈞.虛擬現(xiàn)實(shí)中的視覺(jué)系統(tǒng)與其實(shí)現(xiàn)技術(shù)[J].計(jì)算機(jī)應(yīng)用,1997,17(3):5?7.

第2篇:視覺(jué)算法培訓(xùn)范文

關(guān)健詞:ASTER;GeoTIFF數(shù)據(jù);DEM數(shù)據(jù);格式轉(zhuǎn)換;Creator地形建模

中圖分類(lèi)號(hào):TP15文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2011)17-4152-03

Three Dimensional Terrain Modeling Method with Creator Software Based on the ASTER Remote Sensing Data

TAO Hai-jun1, YANG Jing2, YE Xiao-jun1

(1.Artillery Academy.PLA, Hefei 230031, China; 2.Anhui Sanlian University, Hefei 230001, China)

Abstract: Large area real terrain modeling is the key technology in developing Visual simulation system. This paper provides a terrain modeling method with Creator software based on the ASTER remote sensing satellite data, the GeoTIFF data format provided by ASTER is being converted to the USGS DEM data by using format Conversion techniques, the terrain model of some region is established through Creator terrain modeling technology, the three-dimensional model of real terrain is established practically and quickly.

Key words: ASTER; GeoTIFF data; DEM data; format conversion; creator terrain modeling

視景仿真是三維地形建模技術(shù)、圖形處理和圖像生成技術(shù)、立體影像和信息合成技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、仿真技術(shù)等諸多高新技術(shù)的綜合應(yīng)用,在很多領(lǐng)域如軍事訓(xùn)練、城市規(guī)劃、健康醫(yī)療、教育培訓(xùn)等方面都有著廣泛的應(yīng)用。大面積真實(shí)地形三維建模技術(shù)是實(shí)時(shí)視景仿真系統(tǒng)開(kāi)發(fā)的關(guān)鍵技術(shù)之一,是近年來(lái)視景仿真領(lǐng)域研究的熱點(diǎn)。能獲取真實(shí)、準(zhǔn)確地表述地形起伏特征的地形數(shù)據(jù)源是進(jìn)行大面積真實(shí)地形三維建模的前提條件,地形數(shù)據(jù)源主要是指建立數(shù)字高程模型(Digital Elevation Model,DEM)用到的高程數(shù)據(jù),獲取方法主要有以下幾種:1)采用大地測(cè)量的方法直接從地形上測(cè)出高程;2)利用航空攝影測(cè)量照片,采用數(shù)字高程判斷儀從兩張對(duì)應(yīng)的照片上讀取高程;3)利用遙感衛(wèi)星星載設(shè)備獲取地形高程數(shù)據(jù);4)從小比例尺等高線地圖上讀取高程數(shù)據(jù);5)從現(xiàn)有的地理信息系統(tǒng)提取所需區(qū)域的地形高程數(shù)據(jù)[1]。其中利用遙感地形數(shù)據(jù)源進(jìn)行大面積地形三維建模是目前地形建模的主要方法之一,本文重點(diǎn)研究基于ASTER遙感數(shù)據(jù)的Creator三維地形建模過(guò)程、方法和技巧。

1 ASTER遙感地形數(shù)據(jù)源精度解析

ASTER(Advanced Spaceborne Thermal Emission and Reflection Radiometer)是美國(guó)航空航天局(NASA)與日本國(guó)際經(jīng)貿(mào)商業(yè)部(METI)合作的高分辨率衛(wèi)星成像設(shè)備,于1999年12月搭載NASA的EOS-AM1(Terra)平臺(tái)升空,目地是獲取地球表面溫度、輻射、反射和高程數(shù)據(jù),研究生物圈、水圈、巖石圈和大氣層之間的互動(dòng)反應(yīng),解決土地利用與覆蓋、自然災(zāi)害(火山噴發(fā)、水災(zāi)、森林火災(zāi)、地震和風(fēng)暴)、短期天氣變動(dòng)、水文等方面的問(wèn)題。ASTER有可見(jiàn)光和近紅外區(qū)(VNIR)三個(gè)波段,在短波紅外區(qū)(SWIR)有六個(gè)波段,在熱紅外區(qū)(TIR)有五個(gè)波段,它們的地面分辨率分別是15m、30m、90m。

2009年,美國(guó)航空航天局(NASA)官方網(wǎng)站提供了ASTER的最新全球遙感數(shù)據(jù),該數(shù)據(jù)源采用的是GeoTIFF數(shù)據(jù)格式的DEM數(shù)據(jù)(簡(jiǎn)稱ASTER GDEM),ASTER遙感數(shù)據(jù)記錄的地域非常廣闊,覆蓋范圍從北緯83度到南緯83度,除了部分極地區(qū)域,覆蓋絕大部分的地球區(qū)域。每個(gè)ASTER GDEM地形文件包含1度×1度的范圍,用一個(gè)3601×3601像素的TIFF圖片來(lái)記錄地形信息,采樣精度達(dá)到了30米,海拔精度為7-14米,基本滿足普通三維地形建模的數(shù)據(jù)精度要求[2]。

2 ASTER遙感數(shù)據(jù)格式轉(zhuǎn)換技術(shù)

ASTER遙感數(shù)據(jù)采用GeoTIFF(Geographic Tagged Image File Format)存儲(chǔ)格式,GeoTIFF是TIFF (Tag Image File Format)圖像文件格式的擴(kuò)展。TIFF (Tag Image File Format)圖像文件是圖形圖像處理中常用的格式之一,其圖像格式復(fù)雜,但由于它對(duì)圖像信息的存放靈活多變,可以支持很多色彩系統(tǒng),而且獨(dú)立于操作系統(tǒng),因此得到了廣泛應(yīng)用。在各種地理信息系統(tǒng)、攝影測(cè)量與遙感等應(yīng)用中,要求圖像具有地理編碼信息,如圖像所在的坐標(biāo)系、比例尺、圖像上點(diǎn)的坐標(biāo)、經(jīng)緯度、長(zhǎng)度單位及角度單位等等。對(duì)于存儲(chǔ)和讀取這些信息,純TIFF格式的圖像文件很難做到,而GeoTIFF作為T(mén)IFF的一種擴(kuò)展,在TIFF的基礎(chǔ)上定義了一些GeoTag(地理標(biāo)簽),對(duì)各種坐標(biāo)系統(tǒng)、橢球基準(zhǔn)、投影信息等進(jìn)行定義和存儲(chǔ),使圖像數(shù)據(jù)和地理數(shù)據(jù)存儲(chǔ)在同一圖像文件中,這樣就為開(kāi)發(fā)人員制作和使用帶有地理信息的圖像提供了方便途徑[3]。

目前可用于進(jìn)行三維地形建模的開(kāi)發(fā)軟件很多,比如3DS MAX、Auto CAD、Maya、MultiGen Creator等,使用的開(kāi)發(fā)環(huán)境不同,所需要的數(shù)據(jù)源格式也不相同。筆者選用MultiGen-Paradigm公司開(kāi)發(fā)的Creator軟件進(jìn)行三維地形開(kāi)發(fā),使用該軟件建立模型,可以在滿足實(shí)時(shí)性的前提下,生成面向仿真的、逼真度高的大面積地形。然而ASTER GDEM格式的DEM地形數(shù)據(jù)文件不能直接在MultiGen Creator中使用,必須首先將ASTER GDEM格式的地形數(shù)據(jù)文件轉(zhuǎn)換成MultiGen Creator支持的USGS DEM(U.S.Geological Survey Digital Elevation Models)格式或者DTED格式,然后利用Creator地形格式轉(zhuǎn)換模塊生成MultiGen Creator專用的數(shù)字高程數(shù)據(jù)(Digital Elevation Data,DED)格式文件,上述格式轉(zhuǎn)換的過(guò)程是三維地形生成的重要環(huán)節(jié),該轉(zhuǎn)換過(guò)程可用圖1所示的流程圖進(jìn)行描述。

轉(zhuǎn)換步驟為:

1)應(yīng)用Global Mapper軟件提取ASTER GDEM數(shù)據(jù)文件中的地形數(shù)據(jù)信息,其中每個(gè)采樣點(diǎn)用(經(jīng)度,緯度、高程)表示,Global Mapper會(huì)完成數(shù)據(jù)二維可視化圖像和3D模型的顯示。如圖2所示繪制的是北緯37度、東經(jīng)117度附近地域的ASTER GDEM格式的數(shù)字高程模型。

2)在File菜單下選取Export Raster and Elevation Data項(xiàng),在二級(jí)子菜單中選擇Export DEM Command菜單項(xiàng)輸出USGS DEM數(shù)據(jù)格式或者選擇Export DTED command菜單項(xiàng)輸出DTED數(shù)據(jù)格式。

3)在Options屬性頁(yè)中設(shè)定經(jīng)緯度方向的格網(wǎng)間距,在提取范圍屬性頁(yè)中設(shè)定地形數(shù)據(jù)的經(jīng)緯度范圍,生成采樣點(diǎn)的經(jīng)緯度高程信息。

4)打開(kāi)Multigen Creator,借助Creator平臺(tái)的Terrain模塊的DED Builder 工具,將DEM格式文件生成Creator專用的高程數(shù)據(jù)格式文件(DED),如圖3所示將USGS DEM數(shù)據(jù)格式轉(zhuǎn)化為DED數(shù)據(jù)格式。

圖2 Global Mapper繪制的GDEM數(shù)字高程模型圖3USGS DEM數(shù)據(jù)格式轉(zhuǎn)換成DED格式

3 Creator三維地形生成技術(shù)

根據(jù)仿真任務(wù)的不同需求,應(yīng)建立不同分辨率的三維地形,比如飛行仿真需要大范圍的地形,實(shí)時(shí)性要求高,但對(duì)地形細(xì)節(jié)要求不高,而基于地面的車(chē)輛駕駛和徒步行走的仿真,需要較高的分辨率,但是地形的使用范圍較小,開(kāi)發(fā)人員需要結(jié)合其仿真任務(wù)需求靈活設(shè)置不同的參數(shù)。進(jìn)行Creator三維地形的建模的關(guān)鍵內(nèi)容是地形的LOD(層次細(xì)節(jié))、投影方式、建模算法等參數(shù)的選取與設(shè)置。

3.1 層次細(xì)節(jié)模型參數(shù)設(shè)置

層次細(xì)節(jié)模型(Level of Details,LOD)技術(shù)的思想是在不影響畫(huà)面視覺(jué)效果的條件下,通過(guò)逐次簡(jiǎn)化景物的表面細(xì)節(jié)來(lái)減少場(chǎng)景的幾何復(fù)雜度,其目的是提高繪制算法的效率,增加仿真的實(shí)時(shí)性。例如,若有許多可見(jiàn)面在屏幕上的投影小于一個(gè)像素,則完全可以合并這些可見(jiàn)面而對(duì)畫(huà)面的視覺(jué)效果沒(méi)有任何影響。該技術(shù)通常對(duì)每一原始多面體模型建立幾個(gè)不同逼近精度的幾何模型,與原模型相比,每個(gè)模型均保留了一定層次的細(xì)節(jié)。由于LOD算法要涉及到動(dòng)態(tài)細(xì)分或規(guī)并三角網(wǎng),所以運(yùn)用LOD算法時(shí),常采用規(guī)則網(wǎng)格進(jìn)行地形建模。如圖4所示在Creator中設(shè)置LOD 為3層。

3.2 設(shè)置投影方式

Creator提供五種地圖投影方式:Flat Earth、Trapezoidal、Lambert Conic Conformal、UTM和Geocentric。Flat Earth在原點(diǎn)使用緯度,得到調(diào)整每個(gè)x值的單收斂因子,生成一個(gè)矩形的地形;Trapezoidal是一種方位角映射,在中心點(diǎn)最精確,離中心點(diǎn)越遠(yuǎn)越扭曲;Lambert Conic Conformal使用兩條標(biāo)準(zhǔn)緯線,在北緯84°和南緯80°的中間最精確,距離兩極越近越扭曲;UTM使用旋轉(zhuǎn)90°的柱面圓柱投影,在經(jīng)度上將地球分為六個(gè)區(qū)域,沿著中央子午線最精確,越遠(yuǎn)離子午線越扭曲;Geocentric方式使用圓形地球映射,Z軸以地球中心為起點(diǎn)通過(guò)北極。我國(guó)地處中緯度地區(qū),適合采用斜軸方位投影。選擇Trapezoidal地圖投影方式,較好地保持了地形的輪廓形狀和地理位置,使等變形線與制圖區(qū)域的輪廓基本一致,減少了變形,提高了精度。如圖5所示設(shè)置投影方式為T(mén)rapezoidal地圖投影方式。

3.3 建模算法

用Creator將數(shù)字高程數(shù)據(jù)轉(zhuǎn)換成地形時(shí),可以選擇四種轉(zhuǎn)換算法,分別是Polymesh、Delaunay、CAT和TCT四種算法。

Polymesh轉(zhuǎn)換算法主要適用于BSP進(jìn)行遮擋計(jì)算的實(shí)時(shí)系統(tǒng)?;舅枷胧?,通過(guò)在原數(shù)字高程數(shù)據(jù)文件中對(duì)高程信息進(jìn)行有規(guī)律的采用,從而獲取地形多邊形頂點(diǎn)坐標(biāo),創(chuàng)建矩形網(wǎng)絡(luò)的地形數(shù)據(jù)庫(kù)。

Delaunay轉(zhuǎn)換算法是一種基于Delaunay三角網(wǎng)的地形生成算法,主要適用于使用Z-buffering進(jìn)行遮擋計(jì)算的實(shí)時(shí)系統(tǒng)。與Polymesh算法相比,生成相同精度的系統(tǒng)模型,使用Delaunay算法的地形模型中包含的多邊形數(shù)量較少。使用Delaunay算法時(shí),數(shù)字高程數(shù)據(jù)中的每個(gè)高程點(diǎn)都會(huì)被采樣,而且會(huì)從最低的LOD地形模型生成,較低LOD模型中的多邊形頂點(diǎn)會(huì)被合并到較高的LOD地形模型中,以保證LOD地形之間的平滑過(guò)度。

TCT(Terrain Culture Triangulation)轉(zhuǎn)換算法相當(dāng)于一種限制性的Delaunay算法。當(dāng)使用TCT算法生成的地形時(shí)只能有一個(gè)單獨(dú)的LOD,而且只能用于批處理地形轉(zhuǎn)換中。

CAT(Continuous Adaptive Terrain)轉(zhuǎn)換算法是一種改進(jìn)型Delaunay轉(zhuǎn)換算法,該算法提高了相鄰LOD地形之間的平滑過(guò)渡,可以有效避免由Polymesh和Delaunay算法生成的多LOD地形模型轉(zhuǎn)換的視覺(jué)跳躍現(xiàn)象。

本文選擇Delaunay三角剖分算法,因?yàn)?,與規(guī)則網(wǎng)格算法(Polymesh)相比,生成相同精度的地形模型,使用Delaunay轉(zhuǎn)換算法的地形數(shù)據(jù)庫(kù)中包含的多邊形數(shù)量較少。

3.4 紋理貼圖

根據(jù)地形模型的LOD數(shù)量,將每張圖片調(diào)整為相應(yīng)數(shù)量和精度的分辨率,將它們加載到Creator的紋理調(diào)板,并定義為地形紋理,設(shè)置紋理圖片的紋理坐標(biāo)和地圖投影方式。

紋理坐標(biāo)必須對(duì)應(yīng)于地形模型的面積范圍和坐標(biāo)位置,地圖投影方式則必須和對(duì)應(yīng)地形模型的設(shè)置一致。然后通過(guò)Terrain/Batch GeoPut菜單命令,為對(duì)應(yīng)的LOD地塊模型映射紋理。

圖6 生成的不含紋理的三維模型 圖7 加入紋理映射后的三維模型

3.5 測(cè)試地形并進(jìn)一步優(yōu)化

整個(gè)三維地形生成完畢后,將其導(dǎo)入視景驅(qū)動(dòng)環(huán)境下,在計(jì)算機(jī)仿真硬件平臺(tái)上,通過(guò)視點(diǎn)變換、其它仿真應(yīng)用添加、網(wǎng)絡(luò)連接等多個(gè)綜合測(cè)試環(huán)節(jié),觀察場(chǎng)景運(yùn)行的實(shí)時(shí)性和逼真度。地形模型數(shù)據(jù)庫(kù)的生成是一個(gè)需要反復(fù)試驗(yàn)的過(guò)程,需要反復(fù)地優(yōu)化參數(shù)、完善模型,在實(shí)時(shí)性與逼真性之間進(jìn)行平衡,合理設(shè)置轉(zhuǎn)換參數(shù),最終達(dá)到最好的仿真效果[4]。

4 結(jié)論

本文采用我國(guó)東經(jīng)117度~117.5度,北緯37度~37.5度地域的ASTER GDEM數(shù)據(jù)及其衛(wèi)星遙感圖像作為原始數(shù)據(jù)和地表紋理圖像,地球橢球模型選擇美國(guó)的WGS-84地球橢球模型,地形轉(zhuǎn)換選用Delaunay地形算法,地形模型的LOD數(shù)目設(shè)為3,根據(jù)地形模型的LOD數(shù)量,將每張地表紋理圖片調(diào)整為256×256、128×128、64×64像素三種分辨率,映射到不同LOD分辨率的模型。最后生成的三維地形模型的范圍約為48×56km2,共259200個(gè)面,地形效果圖如圖7所示。通過(guò)仿真程序測(cè)試,利用ASTER遙感數(shù)據(jù)生成的大面積三維地形達(dá)到了精細(xì)度高、真實(shí)感強(qiáng)、實(shí)時(shí)性好的仿真要求。

參考文獻(xiàn):

[1] 王貴林,姚鑫.ASTER立體像對(duì)提取山地DEM精度研究[J].礦山測(cè)量,2008(6):34-35.

[2] 程博,劉少峰,楊巍然.Terra衛(wèi)星ASTER數(shù)據(jù)的特點(diǎn)與應(yīng)用[J].華東地質(zhì)學(xué)院學(xué)報(bào),2003(3):15-16.

[3] 蔣球偉.基于MGIS的GeoTIFF應(yīng)用研究[J].計(jì)算機(jī)工程與應(yīng)用,2007(15):201-202.

第3篇:視覺(jué)算法培訓(xùn)范文

【關(guān)鍵詞】虛擬現(xiàn)實(shí);協(xié)同訓(xùn)練;多用戶;網(wǎng)絡(luò)環(huán)境

【中圖分類(lèi)號(hào)】G434【文獻(xiàn)標(biāo)識(shí)碼】B【論文編號(hào)】1009―8097(2010)04―0120―03

引言

在國(guó)際上,VR與仿真技術(shù)非常普遍與成熟。在遠(yuǎn)程協(xié)作的分布式VR與仿真系統(tǒng)方面,他們制定了一系列標(biāo)準(zhǔn)、協(xié)議和算法。在國(guó)外虛擬環(huán)境中的協(xié)同式訓(xùn)練系統(tǒng)也有研究,比較有代表性的是SecuReVi系統(tǒng),它是利用MASCARET模型設(shè)計(jì)的虛擬環(huán)境中多人協(xié)同滅火的消防員訓(xùn)練系統(tǒng),還有些遠(yuǎn)程醫(yī)療手術(shù)協(xié)作訓(xùn)練系統(tǒng),這些系統(tǒng)多數(shù)是在研究階段,成型產(chǎn)品極為少數(shù)。和一些發(fā)達(dá)國(guó)家相比,我國(guó)協(xié)同VR與仿真技術(shù)還有一定的差距,其應(yīng)用也主要集中在軍事院校和研究所,也取得了一定研究成果[1][2],特別是在分布式VR與仿真領(lǐng)域里,國(guó)內(nèi)在這方面的研究也有所開(kāi)展[3][4]。

由于教育培訓(xùn)軟件的應(yīng)用長(zhǎng)期局限于平面的文字及圖像表述,即使近年來(lái)動(dòng)態(tài)圖形圖像表現(xiàn)形式大大提高了內(nèi)容的表現(xiàn)效果,但仍無(wú)法真正滿足人類(lèi)視覺(jué)、聽(tīng)覺(jué)……甚至是感覺(jué)上的認(rèn)同效應(yīng)。因此,當(dāng)前傳統(tǒng)的CBT(計(jì)算機(jī)支持的教育培訓(xùn)體系,Computer Based Training)訓(xùn)練方式已在一定程度上無(wú)法滿足高科技培訓(xùn)的需要,基于計(jì)算機(jī)虛擬現(xiàn)實(shí)仿真技術(shù)的協(xié)同式訓(xùn)練系統(tǒng)將視景仿真和協(xié)同工作的概念引入CBT中,它拋棄了傳統(tǒng)的訓(xùn)練必須在真實(shí)的環(huán)境和場(chǎng)地下進(jìn)行的觀念;同時(shí)也克服了傳統(tǒng)訓(xùn)練無(wú)法模擬某些現(xiàn)場(chǎng)環(huán)境的缺陷,如飛機(jī)上、地鐵中、商廈里等,它使受訓(xùn)人員不用再冒著一定的危險(xiǎn)、不用再在投入巨額的設(shè)備購(gòu)買(mǎi)和場(chǎng)地布置的情況下就能參加訓(xùn)練。通過(guò)應(yīng)用現(xiàn)代化的虛擬現(xiàn)實(shí)技術(shù)進(jìn)行協(xié)同式訓(xùn)練系統(tǒng)的研發(fā),將克服實(shí)際場(chǎng)地演練的諸多不足,不僅花費(fèi)小,對(duì)環(huán)境沒(méi)有污染,而且沒(méi)有危險(xiǎn),是未來(lái)技能培訓(xùn)的主要手段之一[5][6]。系統(tǒng)在各種高危領(lǐng)域和應(yīng)急處理場(chǎng)合有著廣泛的應(yīng)用,可應(yīng)用于工廠企業(yè)、航空、地鐵公司、社區(qū)、商店等大型場(chǎng)所的應(yīng)急訓(xùn)練;還可用于部隊(duì)演習(xí);學(xué)校、研究所大型實(shí)驗(yàn);網(wǎng)絡(luò)游戲;遠(yuǎn)程醫(yī)療等。該系統(tǒng)的研究將推動(dòng)計(jì)算機(jī)虛擬現(xiàn)實(shí)仿真技術(shù)的發(fā)展,促進(jìn)了計(jì)算機(jī)科學(xué)在現(xiàn)實(shí)生活中的應(yīng)用。本文以航空客艙乘務(wù)員應(yīng)急處理訓(xùn)練為例,介紹基于虛擬現(xiàn)實(shí)的協(xié)同訓(xùn)練系統(tǒng)的設(shè)計(jì)過(guò)程、原理及關(guān)鍵技術(shù)的實(shí)現(xiàn)。

一 系統(tǒng)描述

基于虛擬現(xiàn)實(shí)的協(xié)同訓(xùn)練系統(tǒng)是一個(gè)綜合應(yīng)用虛擬現(xiàn)實(shí)技術(shù)、網(wǎng)絡(luò)通信技術(shù)、三維圖形圖像技術(shù)和數(shù)據(jù)庫(kù)技術(shù)設(shè)計(jì)和開(kāi)發(fā)的一個(gè)虛擬仿真訓(xùn)練軟件,具有在虛擬仿真環(huán)境中進(jìn)行多用戶協(xié)同操作和基于知識(shí)庫(kù)的智能評(píng)判功能特點(diǎn)。系統(tǒng)利用三維技術(shù)構(gòu)建各種虛擬訓(xùn)練場(chǎng)景(如飛機(jī)、地鐵等),多個(gè)用戶在這樣的虛擬仿真環(huán)境中,通過(guò)網(wǎng)絡(luò)進(jìn)行文字和語(yǔ)音的通信、相互合作完成一個(gè)訓(xùn)練任務(wù)。同時(shí),系統(tǒng)提供任務(wù)的知識(shí)庫(kù)進(jìn)行操作過(guò)程的正確性判斷和提示,并詳細(xì)記錄各個(gè)用戶操作過(guò)程,提供專家進(jìn)行評(píng)判(如圖1所示)。系統(tǒng)采用了視景仿真、多用戶協(xié)同、知識(shí)庫(kù)與匹配策略的技術(shù),并在訓(xùn)練過(guò)程中具有多感知性、實(shí)時(shí)性、互操作性以及真實(shí)臨場(chǎng)性的特征,可廣泛應(yīng)用于特定環(huán)境下一個(gè)團(tuán)隊(duì)通過(guò)相互配合,相互協(xié)作來(lái)有效地完成訓(xùn)練任務(wù)

在此系統(tǒng)基礎(chǔ)上,加入具體應(yīng)用的環(huán)境(3D場(chǎng)景),利用系統(tǒng)接口和核心功能設(shè)計(jì)具體應(yīng)用的驅(qū)動(dòng)模塊,形成具體應(yīng)用的系統(tǒng)。如進(jìn)行飛機(jī)客艙火災(zāi)應(yīng)急處理訓(xùn)練,系統(tǒng)將裝入一個(gè)飛機(jī)機(jī)艙的場(chǎng)景和訓(xùn)練角色,多人通過(guò)網(wǎng)絡(luò)、視景等多種交互方式協(xié)同地進(jìn)行飛機(jī)客艙火災(zāi)應(yīng)急處理,形成了某一特定應(yīng)用的協(xié)同式訓(xùn)練的應(yīng)用系統(tǒng)。

基于虛擬現(xiàn)實(shí)的協(xié)同訓(xùn)練系統(tǒng)主要有如下應(yīng)用特點(diǎn):

1 基于虛擬現(xiàn)實(shí)的協(xié)同式訓(xùn)練系統(tǒng),通過(guò)模擬現(xiàn)場(chǎng)的實(shí)際情況,從而提高實(shí)際操作人員對(duì)各種實(shí)際環(huán)境的協(xié)同處理能力。系統(tǒng)尤其適合于模擬高危領(lǐng)域的操作訓(xùn)練,如火災(zāi)、地震、防恐等;

2 克服了傳統(tǒng)訓(xùn)練中實(shí)景再現(xiàn)困難、場(chǎng)地特殊、人員調(diào)度復(fù)雜等環(huán)境因素,適合機(jī)、地鐵、鬧市、商住大廈等情況較復(fù)雜地區(qū)的訓(xùn)練模擬;

3 降低對(duì)人員財(cái)物等的安全威脅,也便于人員時(shí)間上的安排與調(diào)度,減少人力、財(cái)力等各方開(kāi)支,并且間接性地減少了對(duì)周?chē)h(huán)境的污染。適合于要求團(tuán)隊(duì)組員同時(shí)在現(xiàn)場(chǎng)進(jìn)行協(xié)同訓(xùn)練的場(chǎng)合,如遠(yuǎn)程醫(yī)療專家合診、網(wǎng)絡(luò)游戲;

4 利用計(jì)算機(jī)手段,實(shí)現(xiàn)訓(xùn)練模擬,運(yùn)用多媒體的實(shí)現(xiàn)方式,提高人員訓(xùn)練熱情和整體訓(xùn)練效果,因而也適用于原理或操作較枯燥的訓(xùn)練內(nèi)容,如學(xué)校、研究所等實(shí)驗(yàn)仿真。

二 系統(tǒng)實(shí)現(xiàn)原理

整個(gè)系統(tǒng)實(shí)現(xiàn)由三層結(jié)構(gòu)組成(如圖2所示)。底層是操作系統(tǒng)與開(kāi)發(fā)API組成的支撐環(huán)境,中間層是由核心程序與接口組成的系統(tǒng)平臺(tái),頂層是三維場(chǎng)景模型與系統(tǒng)功能驅(qū)動(dòng)組成的應(yīng)用程序。

系統(tǒng)平臺(tái)主要由三維場(chǎng)景子系統(tǒng)、協(xié)同通信子系統(tǒng)和訓(xùn)練管理子系統(tǒng)組成。其主要特點(diǎn):將多用戶協(xié)同處理計(jì)算機(jī)模擬的理念,具體應(yīng)用到行業(yè)技能訓(xùn)練的領(lǐng)域中,并在訓(xùn)練過(guò)程中,采用了視景仿真、協(xié)同、知識(shí)庫(kù)的技術(shù)。

(1) 三維場(chǎng)景子系統(tǒng)

三維場(chǎng)景子系統(tǒng)是用三維造型來(lái)模擬現(xiàn)實(shí)訓(xùn)練環(huán)境的一種實(shí)時(shí)渲染圖形系統(tǒng)。系統(tǒng)完成的主要模塊有模型導(dǎo)入、運(yùn)動(dòng)仿真、場(chǎng)景設(shè)置、碰撞檢測(cè)等。

模型導(dǎo)入利用功能強(qiáng)大的三維造型軟件,如3DS Max,MAYA制作三維模型,紋理以及動(dòng)畫(huà)等,然后輸入至訓(xùn)練場(chǎng)景中,具體包括:3D對(duì)象導(dǎo)入、角色導(dǎo)入、動(dòng)畫(huà)導(dǎo)入、材質(zhì)和紋理的設(shè)置、坐標(biāo)設(shè)置、比例變換等等。運(yùn)動(dòng)仿真是對(duì)場(chǎng)景中人和物體運(yùn)動(dòng)的一種數(shù)學(xué)物理描述以及控制,它包括各種運(yùn)動(dòng)類(lèi)型,如走、跑、轉(zhuǎn)身、站立、蹲下、取物等等。場(chǎng)景設(shè)置主要是提供改變某些場(chǎng)景的參數(shù),改善視覺(jué)效果,便于觀察和響應(yīng)不同的訓(xùn)練要求,具體包括:燈光設(shè)置、視角設(shè)置、環(huán)境設(shè)置、特殊效果設(shè)置(如火,煙霧)、聲音設(shè)置、紋理材質(zhì)設(shè)置、動(dòng)態(tài)對(duì)象的位置、方向和比例設(shè)置、坐標(biāo)設(shè)置等等。碰撞檢測(cè)主要是防止物體間的相互干涉以及作為某些事件的觸發(fā)器,由檢測(cè)類(lèi)型和檢測(cè)算法二大部分組成。檢測(cè)類(lèi)型主要有視線范圍檢測(cè)(LOS line-of-sight)、三腳架法(TRIPOD)、凸塊檢測(cè)方法(BUMP)。LOS、TRIPOD、BUMP的算法主要是加入按一定規(guī)則分布的線段矢量,計(jì)算與干涉物體的交點(diǎn),距離,方向以及設(shè)置回調(diào)函數(shù)。

(2) 同步通信子系統(tǒng)

協(xié)作通信系統(tǒng)完成的功能由語(yǔ)音通信、場(chǎng)景同步通信二大部分組成。

語(yǔ)音通信主要提供學(xué)員之間相互協(xié)調(diào)聯(lián)絡(luò)的通信平臺(tái),也是協(xié)同訓(xùn)練中對(duì)講、交談等的語(yǔ)音工具。

這里語(yǔ)音通信部分主要采用點(diǎn)對(duì)點(diǎn)(也可組播)的語(yǔ)音通信,是針對(duì)一個(gè)點(diǎn)實(shí)現(xiàn)話音的實(shí)時(shí)采集、處理、播放,同時(shí)可與其它點(diǎn)進(jìn)行可靠的網(wǎng)絡(luò)語(yǔ)音數(shù)據(jù)傳送和接收。對(duì)于前者,采用Windows MDK的低層音頻服務(wù),因?yàn)榈蛯右纛l服務(wù)中的回調(diào)機(jī)制為我們提供了音頻數(shù)據(jù),設(shè)備驅(qū)動(dòng)程序控制音頻設(shè)備在后成錄音和放音的具體操作,通過(guò)回調(diào)機(jī)制,我們又可以檢測(cè)到什么時(shí)候用完一個(gè)數(shù)據(jù)塊,并及時(shí)傳送下一個(gè)數(shù)據(jù)塊,從而保證了聲音的連續(xù),有了這種單機(jī)上的實(shí)時(shí)采集、回放功能后,接下來(lái)的工作就是在網(wǎng)絡(luò)上傳送語(yǔ)音數(shù)據(jù)。在點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò)傳輸方面,選擇基于無(wú)連接的UDP協(xié)議,UDP用戶數(shù)據(jù)報(bào)協(xié)議能夠向若干臺(tái)目標(biāo)計(jì)算機(jī)發(fā)送數(shù)據(jù),接收發(fā)自若干個(gè)源計(jì)算機(jī)的數(shù)據(jù)。在采集話音回放之前,一方面將自己的語(yǔ)音傳給網(wǎng)絡(luò),另一方面接收網(wǎng)絡(luò)傳來(lái)的語(yǔ)音,具體是利用Windows Socket API實(shí)現(xiàn)的。

場(chǎng)景同步通信主要提供多用戶之間場(chǎng)景一致的功能,它由服務(wù)器、會(huì)話、用戶、網(wǎng)絡(luò)消息和分布式對(duì)象組成。

多用戶服務(wù)器是基于客戶/服務(wù)器技術(shù),所有用戶之間的通信必須通過(guò)服務(wù)器。一個(gè)用戶與其他用戶交互必須連接到一個(gè)會(huì)話上,一個(gè)用戶同時(shí)只能連接一個(gè)會(huì)話,并且只能與連接到同一會(huì)話的用戶通信。用戶有二個(gè)參數(shù),一是用戶名,二是用戶ID,一個(gè)客戶在連接或產(chǎn)生會(huì)話前必須設(shè)置用戶名。網(wǎng)絡(luò)消息是用戶之間通信的主要方法,這個(gè)消息類(lèi)似窗口消息,可以在消息中附帶數(shù)據(jù)。分布式對(duì)象是另一個(gè)用戶間傳送信息的機(jī)制,它相關(guān)于場(chǎng)景中某一個(gè)實(shí)體,且按照一定規(guī)則分布到所有用戶機(jī)上,分布式對(duì)象是類(lèi)的一個(gè)實(shí)例,它有自己的屬性,需要時(shí)可以通過(guò)網(wǎng)絡(luò)通信來(lái)更新。同步通信技術(shù)借鑒了國(guó)外的DIS(分布式交互系統(tǒng))和HLA(高層架構(gòu))等技術(shù)。

(3) 訓(xùn)練管理子系統(tǒng)

訓(xùn)練管理系統(tǒng)主要是用于處理訓(xùn)練相關(guān)的信息,它完成的功能有訓(xùn)練知識(shí)庫(kù)、實(shí)時(shí)跟蹤記錄、沖突解決機(jī)制等。

訓(xùn)練知識(shí)庫(kù)主要包括訓(xùn)練數(shù)據(jù)庫(kù)、訓(xùn)練規(guī)則和匹配策略。訓(xùn)練數(shù)據(jù)庫(kù)主要有學(xué)員信息、課程信息、訓(xùn)練信息等等。訓(xùn)練規(guī)則主要有角色定義與分配規(guī)則、評(píng)判規(guī)則、記分規(guī)則,其中評(píng)判規(guī)則包括動(dòng)作執(zhí)行者、動(dòng)作間的關(guān)系、施加對(duì)象以及次數(shù)等等。匹配策略主要是有序無(wú)序的匹配、規(guī)則樹(shù)的遍歷。

實(shí)時(shí)跟蹤記錄實(shí)際上是對(duì)學(xué)員的操作流進(jìn)行管理的一個(gè)模塊,它主要有觸發(fā)事件、操作信息收集、發(fā)送與接收(操作信息)和記錄器組成。

沖突解決機(jī)制主要是多學(xué)員在協(xié)同訓(xùn)練中發(fā)生操作沖突時(shí)的一種消除機(jī)制。其中簡(jiǎn)單的方法是加鎖解鎖、延時(shí)的方法,比較高級(jí)的有優(yōu)先級(jí)和擁有權(quán)的處理。

三 系統(tǒng)應(yīng)用示例

客艙火災(zāi)應(yīng)急處理訓(xùn)練是利用協(xié)同訓(xùn)練平臺(tái)開(kāi)發(fā)的一個(gè)應(yīng)用實(shí)例,主要是在模擬飛機(jī)機(jī)艙內(nèi)協(xié)作完成滅火訓(xùn)練任務(wù)。這個(gè)訓(xùn)練任務(wù)描述如下:

客機(jī)平穩(wěn)而正常地行駛著,乘客們安靜地享受著舒適的空中之旅,艙內(nèi)的乘務(wù)員出現(xiàn)在各自的位置上,此時(shí),公共信息廣播:此次航班由上海飛往北京,祝各位旅客旅途愉快。30秒后,前工作區(qū)的學(xué)員看到屬于她的信息窗顯示:附近有怪異的煙味,請(qǐng)速核查。并且她看到絲絲煙霧飄散。該學(xué)員先去查核哪里發(fā)生火情,確定是在壁櫥的衣帽間,用手試探門(mén)的涼熱,其信息窗口顯示兩級(jí)溫度信息:門(mén)是涼的/門(mén)很燙手;該學(xué)員使用話機(jī)通知乘務(wù)長(zhǎng),并請(qǐng)求附近的乘務(wù)員速帶滅火器材來(lái)協(xié)助,本人去駕駛艙拿應(yīng)急斧,取來(lái)應(yīng)急斧,在門(mén)上開(kāi)一個(gè)小洞,來(lái)支援的乘務(wù)員拿海倫滅火器來(lái)了,對(duì)著洞口噴滅火劑,直至火滅,開(kāi)門(mén)檢查燃燒物,防止死灰復(fù)燃。最后把火災(zāi)的處理結(jié)果報(bào)告乘務(wù)長(zhǎng),由乘務(wù)長(zhǎng)報(bào)告給機(jī)長(zhǎng)。

該應(yīng)用實(shí)例包括一個(gè)三維實(shí)例場(chǎng)景和一個(gè)實(shí)例驅(qū)動(dòng)模型。三維實(shí)例場(chǎng)景就是飛機(jī)機(jī)艙、火、煙霧、角色及其他設(shè)施,驅(qū)動(dòng)模型是具體應(yīng)用的情節(jié)腳本,由滅火操作、協(xié)作規(guī)則、評(píng)判規(guī)則等許多事件構(gòu)成的。應(yīng)用實(shí)例系統(tǒng)主要界面如圖3所示。

四 結(jié)束語(yǔ)

在網(wǎng)絡(luò)環(huán)境和多用戶視景交互的支持下,人們可以通過(guò)交互設(shè)備,利用聽(tīng)覺(jué)、視覺(jué)、觸覺(jué)在虛擬的環(huán)境中協(xié)作完成訓(xùn)練任務(wù),從而形成一套具有“視景”和“協(xié)同”特色的訓(xùn)練軟件。本文主要描述了一個(gè)基于虛擬現(xiàn)實(shí)的多用戶協(xié)同訓(xùn)練系統(tǒng)的結(jié)構(gòu)設(shè)計(jì)、技術(shù)架構(gòu)、網(wǎng)絡(luò)通信和應(yīng)用示例。隨著基于虛擬現(xiàn)實(shí)技術(shù)的CBT系統(tǒng)正在逐步取代過(guò)去單機(jī)、單一任務(wù)的CBT系統(tǒng),將給計(jì)算機(jī)培訓(xùn)提供一種嶄新的系統(tǒng)訓(xùn)練方式,能使許多特殊場(chǎng)合的訓(xùn)練變得非常方便,同時(shí)極大提高培訓(xùn)的效果。本系統(tǒng)中設(shè)計(jì)的技術(shù)和方法希望對(duì)于其他分布式訓(xùn)練系統(tǒng)的開(kāi)發(fā)具有借鑒作用。

參考文獻(xiàn)

[1] 龐津津,戴述賈.分布式系統(tǒng)仿真技術(shù)研究及其實(shí)現(xiàn)[J].火力與指揮控制, 2001,(1): 37-40.

[2] 洪津,張萬(wàn)軍,謝慶華,陳明宏,王永健.虛擬維修訓(xùn)練系統(tǒng)發(fā)展綜述及其關(guān)鍵技術(shù)探討[J].理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2000,(1):63-67.

[3] 王潤(rùn)崗,花傳杰,唐科群,王艾萍.坦克車(chē)炮長(zhǎng)協(xié)同訓(xùn)練仿真系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].火力與指揮控制, 2008,(9):112-114.

[4] 袁海波,劉厚泉,吳雪峰.虛擬場(chǎng)景動(dòng)態(tài)交互式可視化的研究[J].電腦與信息技術(shù),2008,(6):7-9.

[5] 湯衛(wèi)華,滅火救援協(xié)同戰(zhàn)術(shù)訓(xùn)練探析[J].公安研究, 2007,

第4篇:視覺(jué)算法培訓(xùn)范文

關(guān)鍵字: 模擬器; 飛行訓(xùn)練; 虛擬仿真; 逼真顯示效果

中圖分類(lèi)號(hào): TN964?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2013)08?0042?03

0 引 言

虛擬現(xiàn)實(shí)技術(shù)又稱為“靈境技術(shù)”,它最早可以追溯到20世紀(jì)80年代。虛擬現(xiàn)實(shí)技術(shù)是綜合了計(jì)算機(jī)仿真技術(shù)、圖形技術(shù)、遙感技術(shù)和傳感技術(shù)等諸多領(lǐng)域,營(yíng)造了一個(gè)逼真的三維虛擬環(huán)境,人們可以通過(guò)一系列的工具與環(huán)境中的對(duì)象進(jìn)行交互,從而達(dá)到一種身臨其境的感覺(jué)[1]。

如今,虛擬現(xiàn)實(shí)技術(shù)已經(jīng)滲透到生活的各個(gè)方面,并在各大領(lǐng)域里發(fā)揮著重要的作用[2]。虛擬仿真技術(shù)在訓(xùn)練飛行員方面也大有用武之地。目前,很多國(guó)家就利用虛擬現(xiàn)實(shí)技術(shù)開(kāi)發(fā)的飛行訓(xùn)練模擬器使飛行員進(jìn)入VR世界來(lái)進(jìn)行訓(xùn)練,接下來(lái)將討論虛擬技術(shù)在飛行模擬訓(xùn)練中的研究和貢獻(xiàn)。

模擬訓(xùn)練具有節(jié)能、安全、不受場(chǎng)地與天氣影響、花銷(xiāo)較低等一系列的優(yōu)點(diǎn),因此模擬訓(xùn)練被廣泛地應(yīng)用在軍事訓(xùn)練當(dāng)中[3]。在模擬訓(xùn)練中,虛擬環(huán)境的真實(shí)性和逼真性會(huì)影響到飛行員的訓(xùn)練效果,而人對(duì)環(huán)境的感知是通過(guò)聽(tīng)覺(jué)、觸覺(jué)、視覺(jué)、和嗅覺(jué)等來(lái)獲得的,而其中70%的感知是通過(guò)視覺(jué)來(lái)獲得的,因此,虛擬環(huán)境的建立是模擬器中極為重要的組成部分[4?7]。

1 虛擬仿真平臺(tái)的結(jié)構(gòu)

該平臺(tái)的總體方案如圖1所示。

在圖1中,用于仿真計(jì)算的計(jì)算機(jī)主要完成的仿真工作有:飛機(jī)動(dòng)力學(xué)和飛行動(dòng)力學(xué)模型、自動(dòng)飛行控制系統(tǒng)、導(dǎo)航系統(tǒng)、地形地貌仿真等功能模塊,將計(jì)算機(jī)計(jì)算得到的航跡實(shí)時(shí)顯示在平面的數(shù)字地圖上,并將仿真得到的飛行器的狀況、方位和儀表數(shù)據(jù)等一系列的信息傳遞給另一臺(tái)計(jì)算機(jī),這時(shí)第二臺(tái)計(jì)算機(jī)就來(lái)計(jì)算實(shí)時(shí)的實(shí)景。這臺(tái)計(jì)算機(jī)利用得到的信息,使得3D的飛機(jī)模型飛行在三維空間中,2臺(tái)計(jì)算機(jī)間是通過(guò)IPX協(xié)議進(jìn)行通信的。

2 飛機(jī)空間運(yùn)動(dòng)模型的建立

在建立數(shù)據(jù)模型的過(guò)程中,要采用了氣動(dòng)參數(shù)進(jìn)行動(dòng)態(tài)插值的方法建立飛機(jī)運(yùn)動(dòng)模型[5]。

2.1 飛機(jī)動(dòng)力學(xué)方程

飛機(jī)飛行時(shí)受到了發(fā)動(dòng)機(jī)推力FT、重力g、氣動(dòng)側(cè)力Y、氣動(dòng)升力L和氣動(dòng)阻力D共同作用。根據(jù)牛頓第二定律,在地面坐標(biāo)系下的飛機(jī)飛行動(dòng)力學(xué)方程為[5]:

[F=mdVdt=md(ui+vj+wk)dx=m(ui+vj+wk+ω×V)] (1)

[M=r×dF=vr×dVdtdV] (2)

在坐標(biāo)系下展開(kāi)式(1)后得到以下方程:

[V=1mRcos(φ+α)cosβ-FTcosβ+Zsinβ-g(cosαcosβsinθ-sinαcosβcosθcos?-sinβcosθsin?)][α=r-tanβ(pcosα-qsinα)+gVcosβ(sinαsinθ+ cosαcosθcos?)-1mVcosβ(Rsin(φ+α)+Y)]

式中:[α]為迎角;[β]為側(cè)滑角; [φ]為偏航角;[θ]為俯仰角;V為飛行速度; p,q,r為飛機(jī)角速度在機(jī)體軸系中的分量。分解式(2),可以得出以下的飛機(jī)繞質(zhì)心轉(zhuǎn)動(dòng)的方程:

[p=φ-?sinθq=θcosφ+?cosθsinφr=-θsinφ+?cosθcosφ]

2.2 飛機(jī)運(yùn)動(dòng)學(xué)方程

以上面得到的飛機(jī)動(dòng)力學(xué)方程組為基礎(chǔ)。在地面坐標(biāo)系中的地速u(mài)e,ve,we可表示為:

[uevewe=ATuvw]

式中[AT]是從地軸系轉(zhuǎn)換到機(jī)體軸系的方向余弦矩陣。

2.3 空氣動(dòng)力及力矩

在氣動(dòng)模型中,飛機(jī)是使用多維數(shù)據(jù)來(lái)表示的,在開(kāi)發(fā)視景系統(tǒng)時(shí)以采用某型運(yùn)輸機(jī)飛行仿真氣動(dòng)數(shù)據(jù)包為基礎(chǔ),采用線性插值的方法得到飛行中的飛機(jī)狀態(tài)的氣動(dòng)參數(shù)。

機(jī)體軸上的氣動(dòng)力及力矩為:

[FA,x=(CXsinα-CDcosα)QSFA,y=CyQSFA,z=(-CDsinα-CLcosα)QS]

[LA=(Clcosα-CDsinα)QSbwNA=(Cncosα+Clsinα)QSbwMA=CmQScw]

式中:A為空氣;bw為機(jī)翼翼展;c為機(jī)翼平均空氣動(dòng)弦;S為機(jī)翼面積;Q為動(dòng)壓。從而得到飛機(jī)所受的總力及力矩(沿著機(jī)體軸x,y,z)

[Fx=FA,x+FT,x+FG,x+GxFy=FA,y+FT,y+FG,y+GyFz=FA,z+FT,z+FG,z+Gz]

[L=LA+LGM=MA+MT+MGN=NA+NT+NG]

式中:T為發(fā)動(dòng)機(jī);G為起落架(Gx,Gy,Gz為飛機(jī)所受重力在機(jī)體軸x,y,z上的分量),M,L,N分別為俯仰、滾轉(zhuǎn)、偏航力矩。

3 視景仿真系統(tǒng)的開(kāi)發(fā)

3.1 視景仿真系統(tǒng)的結(jié)構(gòu)

場(chǎng)景生成可以生成地面、高山、流水以及建筑物等的地面場(chǎng)景;模型控制可以用來(lái)控制系統(tǒng)中的模型;語(yǔ)音技術(shù)能夠模仿飛機(jī)的聲音效果;特殊效果包括風(fēng)霜雪雨等效果;視點(diǎn)變換可以改變飛行員的觀察角度;字體顯示可以用來(lái)顯示顯示器上的數(shù)據(jù)等。如圖2所示。

3.2 三維場(chǎng)景建立

虛擬飛行模擬系統(tǒng)的三維場(chǎng)景的建立需要幾個(gè)步驟:

步驟1:飛行模擬器的機(jī)體的繪制。要對(duì)飛行器內(nèi)部的結(jié)構(gòu)數(shù)據(jù)和外表的一些復(fù)雜的線條和面做簡(jiǎn)化后,用OpenGL對(duì)機(jī)體外形進(jìn)行建模。

步驟2:飛行模擬器的實(shí)體繪制。首先,要將OpenGL 初始化;其次,計(jì)算飛行器的中心位置,并用轉(zhuǎn)移矩陣進(jìn)行坐標(biāo)轉(zhuǎn)換,使飛行器到達(dá)最佳視覺(jué)狀態(tài);再次是材質(zhì)及明暗處理方式;最后是開(kāi)始繪制飛行器。

步驟3:三維場(chǎng)景層次結(jié)構(gòu)的確定和場(chǎng)景的繪制。在構(gòu)造飛行系統(tǒng)的三維場(chǎng)景時(shí),根據(jù)飛行器與機(jī)場(chǎng)景物以及天空背景的交互運(yùn)動(dòng)關(guān)系決定了層次結(jié)構(gòu)。場(chǎng)景的繪制可以采用與實(shí)體繪制相類(lèi)似的方法。

4 結(jié) 語(yǔ)

本系統(tǒng)在結(jié)合飛機(jī)動(dòng)力學(xué)方程和空氣動(dòng)力學(xué)方程所建立的虛擬環(huán)境下進(jìn)行虛擬操作訓(xùn)練,不僅大大降低了開(kāi)銷(xiāo)和危險(xiǎn)系數(shù),而且其可視的、三維實(shí)體的與物理原型無(wú)異,使得訓(xùn)練人員具有身臨其境的感覺(jué),便于培訓(xùn)人員考察、判斷和訓(xùn)練飛行技能[4]。本系統(tǒng)打破了傳統(tǒng)的培訓(xùn)飛行員的方式,給人以直觀的感覺(jué),駕駛員可以直接從顯示的動(dòng)畫(huà)中判斷飛行狀況是否正常,它具有逼真的三維視覺(jué)效果,可以反復(fù)在地面進(jìn)行虛擬操作訓(xùn)練,適應(yīng)了飛行訓(xùn)練的發(fā)展需要。

參考文獻(xiàn)

[1] 王昊鵬,劉兵.飛行器虛擬現(xiàn)實(shí)仿真的研究[J].現(xiàn)代電子技術(shù),2008,31(13):46?48.

[2] 范玉青.現(xiàn)代飛機(jī)制造技術(shù)[M].北京:北京航空航天大學(xué)出版社, 2001.

[3] LIU Chang?you. Modeling and simulating on flight push?out conflicts based on colored Petri net [C]// 2010 29th Chinese Control Conference (CCC). Beijing, China: CCC, 2010: 5447?5452.

[4] 蘇新兵.虛擬制造技術(shù)在飛行器設(shè)計(jì)中的應(yīng)用[J].現(xiàn)代制造工程,2007(2):127?129.

[5] 張華磊.大型運(yùn)輸機(jī)綜合訓(xùn)練器虛擬仿真環(huán)境的設(shè)計(jì)[J].計(jì)算機(jī)仿真,2008(5):64?68.

[6] 劉偉.人?飛機(jī)?環(huán)境系統(tǒng)模擬中數(shù)學(xué)模型的研究與分析[J].人類(lèi)工效學(xué),2001(3):2?5.

[7] 崔漢國(guó).基于VRML的分布式裝備維修仿真訓(xùn)練系統(tǒng)[J].計(jì)算機(jī)仿真,2003(3):15?17.

第5篇:視覺(jué)算法培訓(xùn)范文

申萬(wàn)計(jì)算機(jī)指數(shù)漲跌幅在所有申萬(wàn)一級(jí)行業(yè)中排名第二十八(28/28)。分版塊來(lái)看,上周各主題板塊指數(shù)不同程度下跌,電子商務(wù)指數(shù)、第三方支付指數(shù)、在線教育指數(shù)表現(xiàn)位居前列,人工智能指數(shù)、云計(jì)算指數(shù)、區(qū)塊鏈指數(shù)表現(xiàn)最差。上周計(jì)算機(jī)板塊有25家公司上漲,11家公司持平,158家公司下跌。其中漲幅比較大的公司有中新賽克(+23.38%)、科藍(lán)軟件(+12.73%)、絲路視覺(jué)(+12.7%)、中威電子(+6.96%)、正元智慧(+6.96%)。

本周行業(yè)觀點(diǎn):上周,谷歌推出了一套全新的人工智能服務(wù)工具CloudAutoML。該工具能夠幫助開(kāi)發(fā)者自動(dòng)生成一個(gè)定制化的機(jī)器學(xué)習(xí)模型,即通過(guò)人工智能的方法來(lái)產(chǎn)生定制化的人工智能模型。目前AutoML還處在測(cè)試階段,僅支持計(jì)算機(jī)視覺(jué)模型,后續(xù)可能將服務(wù)拓展到語(yǔ)音、翻譯、視頻、自然語(yǔ)言處理等所有標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)模型。對(duì)AutoML的計(jì)算機(jī)視覺(jué)模式而言,在使用時(shí),開(kāi)發(fā)者需要上傳帶有數(shù)據(jù)標(biāo)簽的圖片,隨后谷歌的系統(tǒng)會(huì)自動(dòng)生成定制的圖像識(shí)別模型。在整個(gè)過(guò)程中,開(kāi)發(fā)者僅需要參與少量的如數(shù)據(jù)準(zhǔn)備、調(diào)參、評(píng)價(jià)和迭代等工作。我們認(rèn)為,目前雖然人工智能技術(shù)發(fā)展和應(yīng)用落地速度較快,但對(duì)于大多數(shù)公司而言人工智能技術(shù)發(fā)展所需要的人才及資金仍然是瓶頸所在。谷歌、微軟、百度這樣的科技巨頭利用其在人才、技術(shù)、資金方面的優(yōu)勢(shì)向外輸出人工智能技術(shù),有利于降低人工智能技術(shù)門(mén)檻,有利于人工智能應(yīng)用的進(jìn)一步落地。而對(duì)這些科技巨頭而言,開(kāi)發(fā)者調(diào)用其AI能力越頻繁,所積累的有價(jià)值數(shù)據(jù)也越多。但這種基于云端的定制化人工智能模型也存在一定缺陷,主要體現(xiàn)在數(shù)據(jù)隱私及安全、應(yīng)用復(fù)雜程度不夠、模型的持續(xù)提升有困難等方面。從對(duì)產(chǎn)業(yè)的影響來(lái)看,AutoML工具的推出再次印證了未來(lái)AI能力的開(kāi)放將成為大趨勢(shì),業(yè)內(nèi)AI企業(yè)在算法、技術(shù)層面的差距將會(huì)逐漸縮小,產(chǎn)業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)越來(lái)越集中于高質(zhì)量數(shù)據(jù)、高層次人工智能人才、平臺(tái)及生態(tài)構(gòu)建等方面。

重點(diǎn)推薦公司:(1)恒華科技:“十三五”期間電網(wǎng)建設(shè)投入依舊可觀,配電網(wǎng)側(cè)建設(shè)是重點(diǎn),智能化投入比例也有望提升。公司也在積極推進(jìn)電力信息化領(lǐng)域的SaaS服務(wù),云平臺(tái)業(yè)務(wù)進(jìn)展順利,2017年年中總用戶數(shù)達(dá)到54,520家,相比去年同期增長(zhǎng)約50%。新一輪電改的核心是售電側(cè)市場(chǎng)的放開(kāi),公司可以為新興售電公司提供從業(yè)務(wù)培訓(xùn)、投融資、配網(wǎng)建設(shè)到信息系統(tǒng)建設(shè)的售電側(cè)一體化服務(wù),公司有望受益于電改的深入推進(jìn);(2)佳都科技:公司以智能軌道交通和智慧城市為核心業(yè)務(wù),兩項(xiàng)業(yè)務(wù)上半年均取得了重要進(jìn)展。在軌道交通領(lǐng)域,2017年3月公司在武漢成立分公司,標(biāo)志著公司繼廣州之外又一個(gè)根據(jù)地的確立。在智慧城市領(lǐng)域,公司積極推動(dòng)人工智能技術(shù)、大數(shù)據(jù)技術(shù)和以視頻監(jiān)控為基礎(chǔ)的社會(huì)治安防控體系的結(jié)合,以形成特色產(chǎn)品、增強(qiáng)行業(yè)競(jìng)爭(zhēng)力。

第6篇:視覺(jué)算法培訓(xùn)范文

早在1990年,美國(guó)波音公司的研究員湯姆?考德?tīng)枺═om Caudell)就提出了AR一詞,只是當(dāng)時(shí)并未流行開(kāi)來(lái),不僅手持AR小產(chǎn)品沒(méi)有身臨其境之感,而且智能眼鏡很昂貴,看上去也很古怪。如今,隨著AR技術(shù)逐步為人們所接受,以及智能手機(jī)、平板電腦、谷歌眼鏡等頭戴式電腦的到來(lái),增強(qiáng)現(xiàn)實(shí)技術(shù)變得更為實(shí)用,將真正顛覆教育培訓(xùn)行業(yè)。

縮短工作和學(xué)習(xí)場(chǎng)景的距離

傳統(tǒng)企業(yè)培訓(xùn)有四個(gè)亟待解決的痛點(diǎn)。

第一,以往的培訓(xùn)方式――面授培訓(xùn)、e-Learning或者M(jìn)-Learning很難做到個(gè)性化培訓(xùn);

第二,在工業(yè)環(huán)境下,企業(yè)很注重以實(shí)踐為主,但是學(xué)習(xí)與練習(xí)往往無(wú)法并重,無(wú)法解放雙手;

第三,由于大部分員工幾乎使用不到互聯(lián)網(wǎng)和信息技術(shù),培訓(xùn)師無(wú)法管理到一線員工的工作和培訓(xùn)細(xì)節(jié),大數(shù)據(jù)無(wú)法客觀采集和輸出;

第四,企業(yè)學(xué)習(xí)最常見(jiàn)的痛點(diǎn)是,傳統(tǒng)企業(yè)培訓(xùn)無(wú)法解決員工“學(xué)時(shí)不能用,用時(shí)不能學(xué)”和“遺忘曲線”的困境――員工從培訓(xùn)所學(xué)到的知識(shí),只有10%能夠用在工作上,而且員工70%的學(xué)習(xí)經(jīng)驗(yàn)來(lái)源于工作中的鍛煉,20%來(lái)源于自我學(xué)習(xí),僅10%來(lái)源于培訓(xùn)(見(jiàn)圖表1)。

因此,要提高培訓(xùn)效果,核心是解決“遺忘曲線”和“721模型”帶來(lái)的兩個(gè)問(wèn)題,而這兩個(gè)問(wèn)題的核心就在于工作場(chǎng)景與學(xué)習(xí)場(chǎng)景的距離。如果當(dāng)下能夠把學(xué)習(xí)到的東西立即無(wú)縫使用在工作上,遺忘問(wèn)題將能得到有效解決,工作中獲得的經(jīng)驗(yàn)也可以有助于即時(shí)鞏固所學(xué)內(nèi)容。AR的出現(xiàn)掙脫了傳統(tǒng)培訓(xùn)的束縛,帶來(lái)了全新的培訓(xùn)方式,達(dá)成了培訓(xùn)所強(qiáng)調(diào)的“即需、即學(xué)、即用、即評(píng)”。

培訓(xùn)可被分為培訓(xùn)1.0、2.0、3.0三個(gè)階段,在此過(guò)程中,一個(gè)明顯的演變特征是,縮短了工作場(chǎng)景和學(xué)習(xí)場(chǎng)景的距離(見(jiàn)圖表2)。在培訓(xùn)1.0(傳統(tǒng)面授培訓(xùn))階段,老師是主導(dǎo)者,學(xué)生是被動(dòng)學(xué)習(xí)。一對(duì)多的培訓(xùn),導(dǎo)致個(gè)性化較弱,個(gè)人學(xué)習(xí)者無(wú)法根據(jù)自身需求進(jìn)行個(gè)性化學(xué)習(xí)。

在培訓(xùn)2.0階段,老師變成輔導(dǎo)者,學(xué)生主動(dòng)學(xué)習(xí)的環(huán)境和條件相對(duì)成熟。此階段的標(biāo)志性學(xué)習(xí)方式是混合式學(xué)習(xí),由于PC和手機(jī)的特性,學(xué)習(xí)者擁有自主選擇權(quán),個(gè)性化培訓(xùn)得到了一定的加強(qiáng)。

到了培訓(xùn)3.0階段,AR的發(fā)展,有效解決了“遺忘曲線”和“721模型”這兩個(gè)長(zhǎng)久的痛點(diǎn)。此階段的培訓(xùn)方式是實(shí)時(shí)的工作輔助,讓培訓(xùn)場(chǎng)景與工作場(chǎng)景無(wú)限接近直至重疊。

AR成就高效的培訓(xùn)

我們可以看到, AR智能眼鏡的特性使得培訓(xùn)場(chǎng)景與工作場(chǎng)景無(wú)限接近直至重疊。這意味著所學(xué)的知識(shí)可以完整滲透到工作中,讓無(wú)論是面授培訓(xùn)還是e-Learning都難以解決的問(wèn)題得到解決,完成高效的培訓(xùn)。

體驗(yàn)感是AR培訓(xùn)的關(guān)鍵

要實(shí)現(xiàn)最高效的培訓(xùn),作為連接兩個(gè)場(chǎng)景的核心硬件――AR智能眼鏡,需要擁有良好的使用體驗(yàn)。無(wú)論在工業(yè)中還是實(shí)操類(lèi)培訓(xùn)中,反復(fù)抬頭低頭、操作流程復(fù)雜、身體不停移動(dòng)、操作過(guò)程久、雙手握物料工具等使用場(chǎng)景,都對(duì)AR智能眼鏡提出了體驗(yàn)方面的高要求。

專業(yè)級(jí)的使用場(chǎng)景通常要進(jìn)行長(zhǎng)時(shí)間的培訓(xùn)與實(shí)操,這就要求AR智能眼鏡戴得穩(wěn)、戴得久、看得清。很遺憾的是,目前國(guó)內(nèi)、國(guó)外的AR智能眼鏡都不能算完全合格:?jiǎn)文渴降闹悄苎坨R看不清;市面上雙目式的智能眼鏡戴不穩(wěn);頭箍式雙目AR智能眼鏡則戴不久。

因此,在設(shè)計(jì)AR智能眼鏡時(shí),戴得穩(wěn)、戴得久、看得清成為嚴(yán)格的標(biāo)準(zhǔn),三者缺一不可。合格的AR智能眼鏡應(yīng)視角大、真實(shí)感強(qiáng)、無(wú)眩暈,顯示屏能夠根據(jù)需要隱藏、出現(xiàn)、移動(dòng),攝像頭中置,觀看圖像場(chǎng)景與現(xiàn)實(shí)場(chǎng)景更貼合。

軟件,讓培訓(xùn)無(wú)限接近工作場(chǎng)景

在硬件滿足要求的情況下,軟件是實(shí)現(xiàn)完美培訓(xùn)功能的核心。以0glass為例,我們開(kāi)發(fā)了三大SDK(軟件開(kāi)發(fā)工具包),包括增強(qiáng)現(xiàn)實(shí)NginAR SDK、大數(shù)據(jù)處理NginBD SDK、機(jī)器視覺(jué)NginCV SDK。

在培訓(xùn)場(chǎng)景中,通過(guò)增強(qiáng)現(xiàn)實(shí)NginAR SDK,能夠自動(dòng)或半自動(dòng)生成AR圖形/圖像,對(duì)現(xiàn)有與培訓(xùn)相關(guān)的圖文聲像等素材進(jìn)行可視化編輯,開(kāi)發(fā)出基于培訓(xùn)場(chǎng)景的各類(lèi)AR應(yīng)用;大數(shù)據(jù)處理NginBD SDK實(shí)現(xiàn)了“以人為中心”的企業(yè)大數(shù)據(jù)采集、清洗、儲(chǔ)存、挖掘、推送,幫助企業(yè)培訓(xùn)實(shí)時(shí)追蹤信息;機(jī)器視覺(jué)NginCV SDK能夠敏捷識(shí)別圖像,實(shí)時(shí)追蹤物件,滿足企業(yè)培訓(xùn)領(lǐng)域中不同場(chǎng)景、不同環(huán)境的使用需求。

我們基于此三大SDK開(kāi)發(fā)了一套工作輔助與培訓(xùn)系統(tǒng)――PSS(Performance Support & Training System)。只要將與培訓(xùn)相關(guān)的文字、圖片、視頻、語(yǔ)音信息導(dǎo)入這個(gè)系統(tǒng)進(jìn)行編輯和處理,智能眼鏡就能將數(shù)字信息疊加在真實(shí)操作對(duì)象上,提示、指引學(xué)員使用何種工具、何種操作姿勢(shì)、如何搭配物料。這樣,學(xué)習(xí)場(chǎng)景與工作場(chǎng)景無(wú)限接近直至重疊,從根本上解決了師資有限、培訓(xùn)周期長(zhǎng)、評(píng)價(jià)不客觀等問(wèn)題。

解放雙手 讓培訓(xùn)與實(shí)踐同步

經(jīng)過(guò)不斷研究與實(shí)踐,我們發(fā)現(xiàn)可以通過(guò)四大模塊來(lái)展開(kāi)AR培訓(xùn):實(shí)時(shí)指導(dǎo)、透明管理、個(gè)人教練、知識(shí)沉淀。

第一,實(shí)時(shí)指導(dǎo)。企業(yè)將現(xiàn)有的與培訓(xùn)相關(guān)的文字、圖片、視頻、語(yǔ)音信息導(dǎo)入相應(yīng)軟件系統(tǒng)進(jìn)行編輯和處理,AR智能眼鏡便能將維修數(shù)字信息疊加在真實(shí)操作對(duì)象上,提示并指引學(xué)員正確地使用工具、采用操作姿勢(shì)、搭配物料。

第二,透明管理。PSS通過(guò)人與智能眼鏡之間的交互、第一視角采集圖像、視覺(jué)算法識(shí)別等方式獲取學(xué)員平時(shí)工作的細(xì)節(jié),經(jīng)軟件系統(tǒng)中的數(shù)據(jù)模型進(jìn)行對(duì)比得到其工作數(shù)據(jù)報(bào)表,并給出針對(duì)個(gè)人的、具體到步驟的改進(jìn)建議。與此同時(shí),系統(tǒng)能夠積累分析數(shù)據(jù),提前預(yù)防并糾正錯(cuò)誤,加深維修學(xué)員對(duì)錯(cuò)誤操作的記憶,避免壞習(xí)慣的形成。同時(shí),管理人員或老師能夠自由選擇學(xué)員的第一視角了解其真實(shí)動(dòng)手過(guò)程,結(jié)合數(shù)據(jù)分析了解其真正痛點(diǎn),優(yōu)化培訓(xùn)課程,給出具體到某個(gè)操作細(xì)節(jié)的改進(jìn)建議。

第三,個(gè)人教練。我們將現(xiàn)有培訓(xùn)系統(tǒng)與AR培訓(xùn)系統(tǒng)連接,將課程要求和操作指引可視化、流程規(guī)范化,讓理論與實(shí)踐無(wú)限接近直至重疊,讓學(xué)員學(xué)習(xí)理論知識(shí)的同時(shí)體驗(yàn)實(shí)操。利用智能眼鏡特殊的圖像呈現(xiàn)方式,AR培訓(xùn)系統(tǒng)猶如一名優(yōu)秀的培訓(xùn)教師站在學(xué)員的眼前,用最標(biāo)準(zhǔn)的動(dòng)作、最規(guī)范的流程,教導(dǎo)學(xué)員識(shí)別每一個(gè)部件,完成每一個(gè)步驟。

第四,知識(shí)沉淀。PSS利用AR智能眼鏡天然的第一視角和自然的交互方式,采集維修學(xué)員的培訓(xùn)數(shù)據(jù)(利用文字、語(yǔ)音、圖片、視頻、動(dòng)作圖像識(shí)別記錄其工作過(guò)程中的每個(gè)細(xì)節(jié)),實(shí)時(shí)捕獲學(xué)員操作過(guò)程中好的經(jīng)驗(yàn)和技能,智能生成實(shí)戰(zhàn)型課件。AR培訓(xùn)系統(tǒng)能夠?qū)㈦[性知識(shí)結(jié)構(gòu)化,沉淀于平臺(tái),按需獲取,同時(shí),將結(jié)構(gòu)知識(shí)行為化,固化操作行為,讓系統(tǒng)成為知識(shí)管理的過(guò)濾器和沉淀器。

四大模塊可以解決“記不住、管不了、學(xué)不好、難傳承”等企業(yè)培訓(xùn)痛點(diǎn)。針對(duì)那些操作繁瑣、操作規(guī)范/流程長(zhǎng)、對(duì)效率有要求、對(duì)工作結(jié)果的安全性要求高的行業(yè),如能源、制造、維修、生產(chǎn)、航空、醫(yī)療、培訓(xùn)等領(lǐng)域/行業(yè),AR培訓(xùn)讓工作場(chǎng)景與學(xué)習(xí)場(chǎng)景距離甚遠(yuǎn)的問(wèn)題迎刃而解。

第7篇:視覺(jué)算法培訓(xùn)范文

關(guān)鍵詞:機(jī)器人;計(jì)算機(jī);教學(xué)

1、引言

隨著制造業(yè)和信息產(chǎn)業(yè)的迅速發(fā)展,機(jī)器人已在軍事、工業(yè)生產(chǎn)、救災(zāi)、探險(xiǎn)、醫(yī)療和教育等眾多領(lǐng)域內(nèi)開(kāi)始使用。未來(lái)機(jī)器人將在我們生活的各個(gè)方面扮演重要的角色,并大大提高人們的生活水平和質(zhì)量。機(jī)器人的研究開(kāi)發(fā)離不開(kāi)計(jì)算機(jī)技術(shù)的應(yīng)用,計(jì)算機(jī)是機(jī)器人的“大腦”,決定著機(jī)器人的智能水平,因此,在計(jì)算機(jī)的教學(xué)中,可以引入機(jī)器人來(lái)促進(jìn)相關(guān)技術(shù)和知識(shí)的學(xué)習(xí)?;谶@種理念,本人組織研發(fā)團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)智能機(jī)器人教學(xué)平臺(tái),在我校開(kāi)展面向大學(xué)生的智能機(jī)器人教學(xué)研究,以提高我校學(xué)生的計(jì)算機(jī)應(yīng)用水平,并為培養(yǎng)出復(fù)合型創(chuàng)新性人才做出了一些探索。

2、計(jì)算機(jī)程序設(shè)計(jì)教學(xué)現(xiàn)狀

目前,國(guó)內(nèi)外高校對(duì)計(jì)算機(jī)技術(shù)教學(xué)都比較重視,在所有高校的理工科大學(xué)生中都開(kāi)展了計(jì)算機(jī)程序設(shè)計(jì)教學(xué),程序設(shè)計(jì)課程在培養(yǎng)學(xué)生的邏輯思維能力和計(jì)算機(jī)應(yīng)用能力方面取得了比較好的效果。但是,反思目前程序設(shè)計(jì)教學(xué)中存在的問(wèn)題是必要的。由于大多數(shù)教學(xué)方案都是把重點(diǎn)放在程序設(shè)計(jì)語(yǔ)言與語(yǔ)法上,忽視程序設(shè)計(jì)的實(shí)際應(yīng)用。在教學(xué)過(guò)程中,學(xué)生看不到具體的應(yīng)用效果與價(jià)值,從而使得很多優(yōu)秀的學(xué)生在學(xué)完計(jì)算機(jī)程序設(shè)計(jì)課程之后,還是不知道怎樣開(kāi)展應(yīng)用研究。

對(duì)于初學(xué)程序設(shè)計(jì)的大學(xué)生來(lái)說(shuō)興趣是學(xué)習(xí)的動(dòng)力,傳統(tǒng)的程序設(shè)計(jì)教學(xué)表現(xiàn)媒介一般有字符和圖形兩種,特別是C語(yǔ)言程序的教學(xué),大部分教師采用的是字符的展現(xiàn)形式,初學(xué)者很難看到程序設(shè)計(jì)的應(yīng)用效果,體驗(yàn)成功的樂(lè)趣。引入智能機(jī)器人平臺(tái)開(kāi)展計(jì)算機(jī)技術(shù)教學(xué),使得程序轉(zhuǎn)化為機(jī)器人的思維和能力,學(xué)生在編寫(xiě)完程序后,可以馬上看到效果,這將徹底改變目前的這種教學(xué)狀態(tài)。

目前,國(guó)內(nèi)外有很多大學(xué)和科研機(jī)構(gòu)及公司開(kāi)發(fā)了各種各樣的教學(xué)機(jī)器人,有的是面向中小學(xué)信息教育的,一般是圖形化開(kāi)發(fā)工具,學(xué)生學(xué)不到真正的機(jī)器人開(kāi)發(fā)中必要的程序設(shè)計(jì)知識(shí);有的是用專用的機(jī)器人開(kāi)發(fā)套件,需要學(xué)習(xí)專門(mén)的技術(shù)才能掌握機(jī)器人的開(kāi)發(fā),不適合普及教育。而專門(mén)針對(duì)一般理工類(lèi)大學(xué)生的程序設(shè)計(jì)教學(xué)的機(jī)器人比較少見(jiàn),本項(xiàng)目中研究開(kāi)發(fā)的智能機(jī)器人平臺(tái)主要用于高校計(jì)算機(jī)程序設(shè)計(jì)教學(xué)中,研究開(kāi)發(fā)緊密結(jié)合教學(xué)實(shí)際,研究目標(biāo)明確,是一種創(chuàng)新性的應(yīng)用研究。

3、巡線機(jī)器人開(kāi)發(fā)方案

盡管智能機(jī)器人可以有各種各樣的外表,但是,它們都有共同的特征,智能機(jī)器人擁有一個(gè)“大腦”,能夠像人類(lèi)一樣進(jìn)行“思考”,其核心是一臺(tái)嵌入到機(jī)器人上的計(jì)算機(jī)。目前,智能機(jī)器人還沒(méi)有一個(gè)統(tǒng)一的定義,大多數(shù)專家認(rèn)為智能機(jī)器人至少要具備以下三個(gè)要素:一是感覺(jué)要素,用來(lái)認(rèn)識(shí)外部環(huán)境狀態(tài);二是運(yùn)動(dòng)要素,對(duì)外界環(huán)境做出反應(yīng)性動(dòng)作;三是思考要素,根據(jù)感覺(jué)要素所得到的信息,計(jì)算出采用什么樣的動(dòng)作。智能機(jī)器人是具有感知、思維和行動(dòng)功能的機(jī)器,它可獲取、處理和識(shí)別多種信息,自主地完成較為復(fù)雜的操作任務(wù)[1]。

在輔導(dǎo)學(xué)生參加全國(guó)大學(xué)生“飛思卡爾”杯智能汽車(chē)競(jìng)賽的過(guò)程中,本人經(jīng)過(guò)總結(jié)和完善,設(shè)計(jì)出了一個(gè)可適合于不同層次教學(xué)的巡線機(jī)器人教學(xué)方案。在該教學(xué)方案中有使用激光傳感器和電磁傳感器的兩種巡線機(jī)器人,可以自動(dòng)識(shí)別專門(mén)制作的道路自由駕駛。本教學(xué)方案中開(kāi)發(fā)的巡線機(jī)器人是一種自主型智能機(jī)器人,這種自主型機(jī)器人具有感知、處理、決策和執(zhí)行等模塊,可以像一個(gè)自主的人一樣獨(dú)立地活動(dòng)和處理問(wèn)題,硬件上,這種具有一定智能的機(jī)器人需要有多種傳感器,功能強(qiáng)大的計(jì)算機(jī)和靈活精確的驅(qū)動(dòng)系統(tǒng)[2]。

巡線機(jī)器人采用結(jié)構(gòu)化設(shè)計(jì),硬件和軟件模塊都按一定的規(guī)則定義好接口,使得初學(xué)者可以快速入門(mén)學(xué)習(xí)機(jī)器人的開(kāi)發(fā)。巡線機(jī)器人系統(tǒng)結(jié)構(gòu)可分為硬件和軟件兩大模塊,如圖 1所示。

圖 1 巡線機(jī)器人系統(tǒng)結(jié)構(gòu)

在硬件設(shè)計(jì)方面,機(jī)器人的硬件實(shí)現(xiàn)模塊化設(shè)計(jì),學(xué)生可以選擇不同的傳感器模塊組裝不同類(lèi)型的機(jī)器人,對(duì)于電子類(lèi)專業(yè)的學(xué)生,也可以由學(xué)生設(shè)計(jì)開(kāi)發(fā)新的硬件模塊。軟件設(shè)計(jì)方面,在該機(jī)器人平臺(tái)上,編寫(xiě)程序?qū)⒂嘘P(guān)的微控制器硬件接口封裝,降低學(xué)生學(xué)習(xí)程序設(shè)計(jì)的難度。

采用激光傳感器的巡線機(jī)器人通過(guò)光學(xué)反射原理來(lái)檢測(cè)識(shí)別道路,是一種視覺(jué)導(dǎo)航機(jī)器人[3]。激光傳感器發(fā)射管發(fā)射一定波長(zhǎng)的激光,經(jīng)地面反射到接收管。由于在黑色和白色道路上反射系數(shù)不同,黑色區(qū)域反色回的光線很少,而白色區(qū)域反射回足夠強(qiáng)的光線,接收管接收到的反射光強(qiáng)度不同,使得接收管兩端輸出電壓不同,從而可以將黑白路面區(qū)分開(kāi)來(lái),使得機(jī)器人可以識(shí)別貼有黑色引導(dǎo)線的白色道路。

采用電磁傳感器的巡線機(jī)器人,能夠識(shí)別道路定頻率的磁場(chǎng)。在道路引導(dǎo)線上(漆包線)通上一定頻率的的脈沖信號(hào),導(dǎo)線中有變化的電流流過(guò),從而在道路的周?chē)a(chǎn)生變化的磁場(chǎng)。電磁傳感器道路識(shí)別模塊能夠探測(cè)到這個(gè)變化的磁場(chǎng),并將探測(cè)到的信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)。

電源管理模塊為整個(gè)系統(tǒng)各個(gè)模塊提供所需要的電源,主要包含電機(jī)驅(qū)動(dòng)電源、控制計(jì)算機(jī)供電電源、傳感器驅(qū)動(dòng)電源等模塊。可靠的電源方案是整個(gè)硬件電路穩(wěn)定可靠運(yùn)行的基礎(chǔ)。在設(shè)計(jì)電源模塊時(shí)標(biāo)注好各個(gè)模塊連接線的功能和名稱,以方便組裝和調(diào)試機(jī)器人。

巡線機(jī)器人實(shí)時(shí)測(cè)量出自己的運(yùn)行速度,才能實(shí)現(xiàn)閉環(huán)控制,達(dá)到精確的控制目的。測(cè)速傳感器一般可選成本比較低的霍爾傳感器和價(jià)格比較高的光電編碼器,霍爾傳感器是根據(jù)霍爾效應(yīng)制作的一種磁場(chǎng)傳感器,價(jià)格低廉但一般精度比較低。光電編碼器是一種通過(guò)光電轉(zhuǎn)換將輸出軸上的機(jī)械幾何位移量轉(zhuǎn)換成脈沖或數(shù)字量的傳感器,其精度相對(duì)比較高,但價(jià)格也比較貴。在教學(xué)中,可由學(xué)生根據(jù)實(shí)際的精度要求來(lái)選定測(cè)速傳感器。

舵機(jī)用來(lái)控制巡線機(jī)器人的左右運(yùn)動(dòng)方向,直流電機(jī)用來(lái)驅(qū)動(dòng)巡線機(jī)器人,控制前后運(yùn)動(dòng),這兩種電機(jī)都可通過(guò)PWM脈寬調(diào)制信號(hào)的占空比來(lái)控制,一般的嵌入式計(jì)算機(jī)都具有輸出PWM脈寬調(diào)制信號(hào)的功能,所以比較容易得到電機(jī)控制信號(hào)。巡線機(jī)器人的舵機(jī)和驅(qū)動(dòng)電機(jī)采用經(jīng)典的PID控制算法。用函數(shù)封裝好PWM脈寬調(diào)制信號(hào)產(chǎn)生代碼和PID控制算法 的基本代碼,學(xué)習(xí)的學(xué)生只要簡(jiǎn)單理解算法的思想和和函數(shù)參數(shù)的意義,便可參與巡線機(jī)器人控制程序的編寫(xiě)。

4、分層教學(xué)方法研究

智能機(jī)器人的開(kāi)發(fā)有一定的難度,涉及機(jī)械、電子、自動(dòng)控制、計(jì)算機(jī)和傳感器等許多專業(yè)知識(shí),一般需要組建跨學(xué)科的開(kāi)發(fā)團(tuán)隊(duì)來(lái)進(jìn)行綜合的開(kāi)發(fā)。對(duì)于不同專業(yè)和學(xué)習(xí)能力的學(xué)生,需要有不同的教學(xué)方法因材施教。

通過(guò)在計(jì)算機(jī)基礎(chǔ)、計(jì)算機(jī)程序設(shè)計(jì)、嵌入式開(kāi)發(fā)和智能汽車(chē)競(jìng)賽培訓(xùn)等課程的教學(xué)實(shí)踐活動(dòng)中,研究并總結(jié)出分層次教學(xué)方案。即在計(jì)算機(jī)教學(xué)中按三個(gè)不同層次,引入智能機(jī)器人教學(xué)的一系列創(chuàng)新性方法:

第一個(gè)層次,面向所有專業(yè)的學(xué)生,在大學(xué)一年級(jí)計(jì)算機(jī)概論課時(shí),講解機(jī)器人原理,以及機(jī)器人與計(jì)算機(jī)技術(shù)的關(guān)系,通過(guò)視頻或現(xiàn)場(chǎng)演示機(jī)器人,提高學(xué)生對(duì)學(xué)習(xí)計(jì)算機(jī)和機(jī)器人等科學(xué)研究的興趣。并在相關(guān)學(xué)生科技活動(dòng)中,演示原理簡(jiǎn)單的巡線機(jī)器人,講解開(kāi)發(fā)原理,激發(fā)學(xué)生對(duì)計(jì)算機(jī)技術(shù)的學(xué)習(xí)興趣。由于所面向的學(xué)生既有理工科的也有文科的,每個(gè)人的知識(shí)結(jié)構(gòu)差異非常大,所以教學(xué)的重點(diǎn)在于講解機(jī)器人與計(jì)算機(jī)的關(guān)系,使得他們了解機(jī)器人技術(shù)和計(jì)算機(jī)技術(shù)的基本原理。

第二個(gè)層次,在計(jì)算機(jī)程序設(shè)計(jì)課程中,主要是《C程序設(shè)計(jì)》與《單片機(jī)和嵌入式系統(tǒng)開(kāi)發(fā)》等課程中,設(shè)計(jì)一系列機(jī)器人編程開(kāi)發(fā)實(shí)驗(yàn),學(xué)生在實(shí)驗(yàn)課時(shí)可選擇一種實(shí)驗(yàn),體驗(yàn)開(kāi)發(fā)機(jī)器人的樂(lè)趣,加深學(xué)生對(duì)計(jì)算機(jī)技術(shù)的深入理解和體驗(yàn)。學(xué)生在實(shí)驗(yàn)中有更多和教師交流的機(jī)會(huì),學(xué)習(xí)更加主動(dòng),并可以將自己的作品與同學(xué)進(jìn)行交流比較。從而,吸引一批優(yōu)秀的學(xué)生加入到機(jī)器人開(kāi)發(fā)的教學(xué)和實(shí)驗(yàn)項(xiàng)目中來(lái)。

第三個(gè)層次,組織學(xué)生參加相關(guān)的大學(xué)生機(jī)器人競(jìng)賽,近年來(lái),機(jī)器人競(jìng)賽的教育價(jià)值逐漸得到人們的認(rèn)可和重視,機(jī)器人競(jìng)賽對(duì)學(xué)生的科學(xué)認(rèn)識(shí),科學(xué)探究以及科學(xué)態(tài)度都有積極的影響[4]。目前,已面向全校理工科學(xué)生,跨學(xué)科組建全國(guó)大學(xué)生智能汽車(chē)競(jìng)賽團(tuán)隊(duì),在競(jìng)賽培訓(xùn)過(guò)程中,組織學(xué)生開(kāi)發(fā)智能車(chē)(巡線機(jī)器人)的硬件和軟件模塊,提高他們的計(jì)算機(jī)嵌入式系統(tǒng)開(kāi)發(fā)能力。這部分優(yōu)秀的學(xué)生可以培養(yǎng)成具有扎實(shí)的自動(dòng)化、電子和計(jì)算機(jī)等項(xiàng)目開(kāi)發(fā)能力的復(fù)合型人才。

5、結(jié)束語(yǔ)

本文對(duì)在計(jì)算機(jī)教學(xué)中引入智能機(jī)器人的教學(xué)方法進(jìn)行了探討和描述,在計(jì)算機(jī)程序設(shè)計(jì)課程中,用機(jī)器人來(lái)展現(xiàn)程序設(shè)計(jì)的魅力,取得了比較好的教學(xué)效果。同時(shí),吸引一大批優(yōu)秀的學(xué)生參與到相關(guān)項(xiàng)目開(kāi)發(fā)和競(jìng)賽中,機(jī)器人的制作與競(jìng)賽涵蓋了電子、計(jì)算機(jī)、控制、模式識(shí)別、傳感技術(shù)、電氣及機(jī)械等多個(gè)學(xué)科,對(duì)培養(yǎng)學(xué)生的綜合工程開(kāi)發(fā)能力、創(chuàng)新精神、實(shí)踐動(dòng)手能力及團(tuán)結(jié)協(xié)作精神均具有良好的促進(jìn)作用。本教學(xué)項(xiàng)目的研究和實(shí)施,為培養(yǎng)有創(chuàng)新能力的復(fù)合型人才探索出了一條可行的道路。

參考文獻(xiàn):

[1] 胡蓮君,宋弘.移動(dòng)智能機(jī)器人避障規(guī)劃研究[J].四川理工學(xué)院學(xué)報(bào),2008, 21(4):88-89.

[2] 朱孟強(qiáng),盧博有等.基于ARM的智能機(jī)器人小車(chē)控制系統(tǒng)設(shè)計(jì)[J]. 微計(jì)算機(jī)信息,2008,24(5).

第8篇:視覺(jué)算法培訓(xùn)范文

虛擬現(xiàn)實(shí)在醫(yī)學(xué)上的應(yīng)用起源于醫(yī)務(wù)人員對(duì)復(fù)雜的三維醫(yī)學(xué)解剖體數(shù)據(jù)的可視化需求,進(jìn)而發(fā)展到能對(duì)可視化的數(shù)據(jù)進(jìn)行實(shí)時(shí)操作,從而建立可供手術(shù)和手術(shù)前規(guī)劃使用的虛擬環(huán)境。在醫(yī)學(xué)手術(shù)教學(xué)和仿真訓(xùn)練等方面,虛擬現(xiàn)實(shí)技術(shù)有著不可替代的和令人鼓舞的應(yīng)用前景。運(yùn)用該技術(shù)可以使醫(yī)務(wù)工作者沉浸于虛擬的場(chǎng)景內(nèi),體驗(yàn)并學(xué)習(xí)如何應(yīng)付各種臨床手術(shù)的實(shí)際情況,可以通過(guò)視、聽(tīng)、觸覺(jué)感知并學(xué)習(xí)各種手術(shù)實(shí)際操作。這樣大大的節(jié)約了培訓(xùn)醫(yī)務(wù)人員的費(fèi)用和時(shí)間,使非熟練人員實(shí)習(xí)手術(shù)的風(fēng)險(xiǎn)性大大降低,并利用專家學(xué)者的手術(shù)經(jīng)驗(yàn)和實(shí)例對(duì)年輕醫(yī)生特別是小醫(yī)院、邊遠(yuǎn)地區(qū)醫(yī)院的醫(yī)生進(jìn)行培訓(xùn),這對(duì)提高醫(yī)學(xué)教育與訓(xùn)練的效率和質(zhì)量以及改善我國(guó)醫(yī)學(xué)手術(shù)水平發(fā)展不平衡的現(xiàn)狀有著非常重大的意義。

2國(guó)內(nèi)外的現(xiàn)狀及分析

目前與醫(yī)學(xué)相關(guān)的虛擬現(xiàn)實(shí)應(yīng)用主要包括:手術(shù)、內(nèi)窺鏡檢查和放射外科等。其中,虛擬醫(yī)學(xué)手術(shù)仿真訓(xùn)練是一種技術(shù)難度較大的應(yīng)用。與其它虛擬現(xiàn)實(shí)應(yīng)用相比,它的特點(diǎn)是:①虛擬場(chǎng)景復(fù)雜;需要產(chǎn)生多層次、多種形態(tài)、相聯(lián)關(guān)系復(fù)雜的三維虛擬人體組織;②人機(jī)交互性強(qiáng),要求定位和反饋精確度高。當(dāng)前,國(guó)外已經(jīng)有許多研究機(jī)構(gòu)和商業(yè)公司對(duì)醫(yī)學(xué)虛擬現(xiàn)實(shí)尤其是在虛擬醫(yī)學(xué)手術(shù)仿真訓(xùn)練等方面都進(jìn)行了一定的研究和實(shí)踐。如美國(guó)達(dá)特茅斯醫(yī)學(xué)院開(kāi)發(fā)的“交互式多媒體虛擬現(xiàn)實(shí)系統(tǒng)”。對(duì)于手術(shù)訓(xùn)練方面處于較前沿的是美國(guó)波士頓力學(xué)研究中心,他們采用的方式是利用偏振眼鏡觀看場(chǎng)景、虛擬手術(shù)器械模擬操作,另外還有加利福尼亞的舊金山大學(xué)外科系與伯克利學(xué)院的電子工程與計(jì)算機(jī)科學(xué)系對(duì)虛擬腹腔手術(shù)的研究等項(xiàng)目。在國(guó)內(nèi),大部分的研究工作集中在對(duì)醫(yī)學(xué)圖像的三維重建及其可視化等基礎(chǔ)技術(shù)方面,清華大學(xué)和浙江大學(xué)等院校及研究單位在基于計(jì)算機(jī)圖形學(xué)的醫(yī)學(xué)圖像三維可視化算法研究領(lǐng)域也取得了較大的成果。

3當(dāng)前虛擬醫(yī)學(xué)手術(shù)仿真訓(xùn)練的技術(shù)難點(diǎn)

隨著計(jì)算機(jī)技術(shù)、傳感器技術(shù)的飛速發(fā)展,虛擬醫(yī)學(xué)手術(shù)仿真訓(xùn)練的研究在模型實(shí)時(shí)顯示、器官組織紋理的制作、碰撞檢測(cè)與定位和觸覺(jué)傳感等方面已經(jīng)取得了一定的進(jìn)展,并已有個(gè)別的成型系統(tǒng)研制成功,但當(dāng)前虛擬醫(yī)學(xué)手術(shù)仿真訓(xùn)練的研究還需解決如下技術(shù)難點(diǎn):①仿真的逼真性較低,主要原因是虛擬人體組織的精確解剖結(jié)構(gòu)和實(shí)時(shí)顯示算法仍有待改進(jìn);②虛擬組織的各種行為模型(如實(shí)時(shí)形變等)的建立還不夠完善和真實(shí);③多通道感覺(jué)的缺乏,目前研究大多集中于視覺(jué)虛擬,對(duì)其他感覺(jué)通道如聽(tīng)覺(jué)、觸覺(jué)等較為缺乏,而在醫(yī)學(xué)手術(shù)中力的反饋是非常重要的;④多種不同來(lái)源的三維醫(yī)學(xué)影像數(shù)據(jù)的融合和復(fù)雜模型的LOD模型優(yōu)化等技術(shù)尚有待發(fā)展;⑤由于西方人種與黃色人種在生理結(jié)構(gòu)上有一定的差異,國(guó)外人體模型并不能完全適應(yīng)我國(guó)的需要。因此,目前還沒(méi)有適合于我國(guó)虛擬手術(shù)用的人體模型。

4虛擬醫(yī)學(xué)手術(shù)仿真訓(xùn)練的技術(shù)實(shí)現(xiàn)

4.1醫(yī)學(xué)圖像三維重建

4.1.1醫(yī)學(xué)圖像可視化對(duì)醫(yī)學(xué)圖像的三維重建主要是為了實(shí)現(xiàn)醫(yī)學(xué)圖像可視化。這屬于科學(xué)計(jì)算可視化的研究范疇,在該領(lǐng)域被稱為三維標(biāo)量數(shù)據(jù)場(chǎng)可視化技術(shù)。它是虛擬手術(shù)技術(shù)的實(shí)現(xiàn)基礎(chǔ)。目前,三維標(biāo)量數(shù)據(jù)場(chǎng)可視化技術(shù)主要分為兩類(lèi):一類(lèi)是通過(guò)抽取中間面的表面繪制技術(shù);一類(lèi)是基于體元的體繪制技術(shù)。

4•1•1•1通過(guò)抽取中間面的表面繪制技術(shù)主要包括:基于二維輪廓線的斷層掃描線表面重構(gòu)和基于單元網(wǎng)格結(jié)構(gòu)的等值面抽取等。

4•1•1•2基于體元的體繪制技術(shù)體繪制技術(shù)直接基于體元繪制,能顯示對(duì)象體豐富的內(nèi)部細(xì)節(jié)。目前實(shí)現(xiàn)數(shù)據(jù)場(chǎng)體繪制主要有兩種策略:直接對(duì)三維離散數(shù)據(jù)場(chǎng)作體繪制;從三維離散數(shù)據(jù)場(chǎng)重構(gòu)出連續(xù)數(shù)據(jù)場(chǎng),再對(duì)連續(xù)數(shù)據(jù)場(chǎng)進(jìn)行重采樣并繪制圖像。

4.1.2醫(yī)學(xué)圖像分段為了獲得局部的人體組織器官模型,需要將感興趣的區(qū)域從醫(yī)學(xué)圖像中分離出來(lái),人們對(duì)醫(yī)學(xué)圖像的分段技術(shù)進(jìn)行了研究。

4•1•2•1二維圖像的輪廓線技術(shù)三維重建的數(shù)據(jù)源通常是一組一定間隔掃描獲得的二維圖像(如CT圖片),將每張圖片上相同組織的輪廓提取出來(lái),然后將產(chǎn)生的圖片堆疊起來(lái)構(gòu)成三維二進(jìn)制圖像。最后再采用可視化技術(shù)進(jìn)行三維重建,從而獲得感興趣的組織器官的模型。

4•1•2•2體數(shù)據(jù)的分段對(duì)于體數(shù)據(jù)的分段,有一個(gè)簡(jiǎn)單的技術(shù)是采用閾值方法,只有光強(qiáng)大于該閾值的像素點(diǎn)才被顯示。而另外一個(gè)更通用的方法是采用圖像處理中的邊緣檢測(cè)技術(shù)(如卷積等)或綜合對(duì)數(shù)據(jù)集進(jìn)行過(guò)濾處理,以獲得所需的分段閾值。

4.2虛擬人體組織器官的物理建模

4.2.1自由體變形方法(FFD)1986年,人們提出了自由體變形方法,該方法的思想是通過(guò)變形物體所在的空間而實(shí)現(xiàn)物體的變形。其第一步是計(jì)算物體頂點(diǎn)在格子中的位置,然后格子在控制點(diǎn)的運(yùn)動(dòng)下產(chǎn)生形變。但FFD不能模擬局部的變形。

4.2.2基于物理學(xué)的變形模型(physicallybaseddeformation)體現(xiàn)物體在內(nèi)外力的作用下產(chǎn)生形狀上的變化。其中,外力包括重力、碰撞產(chǎn)生的排斥力等;內(nèi)力包括彈性力和非彈性力。

4.3虛擬手術(shù)器械與虛擬組織器官的碰撞檢測(cè)和力反饋手術(shù)操作是非常精細(xì)的工作,要求較為精確的力反饋。在虛擬手術(shù)過(guò)程中,碰撞檢測(cè)是力反饋、組織變形的前提,因此是非常重要的。而基于bbox的算法由于其計(jì)算量小、實(shí)時(shí)性高的特點(diǎn),被虛擬現(xiàn)實(shí)領(lǐng)域廣泛采用。在虛擬手術(shù)操作中,可根據(jù)力學(xué)的彈性方程用計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn)對(duì)虛擬手術(shù)器械的機(jī)電部分的控制,再反饋在虛擬手術(shù)器械上。由于人體的手部的觸覺(jué)非常敏感所以對(duì)于力反饋中的定位精度和曲線力覺(jué)變化均有較高的技術(shù)要求。需要定位精確的手術(shù)傳感器械和比較復(fù)雜的彈性模型。

5虛擬現(xiàn)實(shí)技術(shù)在醫(yī)學(xué)手術(shù)仿真訓(xùn)練中的應(yīng)用虛擬現(xiàn)實(shí)技術(shù)在醫(yī)學(xué)手術(shù)仿真訓(xùn)練領(lǐng)域有著廣泛的應(yīng)用前景,其具體應(yīng)用主要有以下幾個(gè)方面。

5.1人體解剖結(jié)構(gòu)教學(xué)通過(guò)虛擬現(xiàn)實(shí)技術(shù)建立起人體結(jié)構(gòu)模型,可以使學(xué)生通過(guò)人機(jī)交互對(duì)人體模型進(jìn)行瀏覽,在模型內(nèi)部“漫游”,能讓學(xué)生非常直觀、輕松學(xué)習(xí)解剖結(jié)構(gòu)。

5.2醫(yī)療手術(shù)方案和治療效果預(yù)測(cè)對(duì)于病灶,可以在虛擬模型上進(jìn)行方位的顯示,依據(jù)其方位和虛擬系統(tǒng)中的專家?guī)熨Y料,制定手術(shù)和治療的方案,或模擬治療的結(jié)果,進(jìn)行評(píng)判。

第9篇:視覺(jué)算法培訓(xùn)范文

下一波浪潮和AI的未來(lái)

今天大家都覺(jué)得AI“大風(fēng)”來(lái)了,必須趕快前進(jìn)不要掉隊(duì)。但是如果冷靜想想,AI還是面臨很多挑戰(zhàn)。

研究方面的挑戰(zhàn)更大一些。國(guó)務(wù)院2017年7月印發(fā)的《新一代人工智能發(fā)展規(guī)劃》提出:我國(guó)到2030年人工智能理論、技術(shù)與應(yīng)用總體達(dá)到*水平,成為世界主要人工智能創(chuàng)新中心,智能經(jīng)濟(jì)、智能社會(huì)取得明顯成效,為躋身創(chuàng)新型國(guó)家前列和經(jīng)濟(jì)強(qiáng)國(guó)奠定重要基礎(chǔ)。這對(duì)研究工作提出了很高的要求。同時(shí),中國(guó)工程院也了新一代人工智能發(fā)展報(bào)告。新一代人工智能也稱為AI

2.0,我國(guó)的人工智能發(fā)展正從AI 1.0向AI 2.0過(guò)渡。

AI現(xiàn)在的主要缺陷或者說(shuō)不足是在機(jī)器學(xué)習(xí)上。深度學(xué)習(xí)即深度神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一種方法,這種方法確實(shí)可以解決很多問(wèn)題,在實(shí)踐中也取得了很大的成功。但深度學(xué)習(xí)也要發(fā)展。我去美國(guó)開(kāi)會(huì)時(shí),馬里蘭大學(xué)一位很知名的AI專家調(diào)侃說(shuō),現(xiàn)在“深度學(xué)習(xí)有深度而無(wú)學(xué)習(xí)”(Deep Learning——Deep YES,LearningNO)。因?yàn)檫@樣的“學(xué)習(xí)”嚴(yán)格說(shuō)不是學(xué)習(xí),而是訓(xùn)練,是用大數(shù)據(jù)在訓(xùn)練一個(gè)數(shù)學(xué)模型,而不是真的通過(guò)學(xué)習(xí)獲得知識(shí)。

CONTENTS

目錄

贊譽(yù)序言前言

第一章春暖花開(kāi)——人工智能復(fù)興

曠世棋局的幕后英雄002

人機(jī)博弈之戰(zhàn)004

AI大潮席卷007

各國(guó)政府的應(yīng)對(duì)策略011

第二章酷暑與寒冬——人工智能60年艱難歷程

1956年達(dá)特茅斯會(huì)議與AI誕生016

初期的繁榮與樂(lè)觀019

遭遇計(jì)算能力瓶頸021

復(fù)興與再度冰凍023

20年寒冬027

第三章杰弗里·欣頓——突破人工智能關(guān)鍵技術(shù)的人

實(shí)習(xí)生培訓(xùn)班的老人030

人工神經(jīng)網(wǎng)絡(luò)道路崎嶇034

寒冬中的堅(jiān)持036

深度學(xué)習(xí)登場(chǎng)038

第四章助飛的雙翼——深度學(xué)習(xí)成功的秘密

不是只要有好算法就能成功042

瘋狂冒險(xiǎn)家黃仁勛與GPU 046

“拼命三郎”李飛飛締造ImageNet 050

讓深度學(xué)習(xí)升華052

第五章數(shù)據(jù)魔方——數(shù)據(jù)科學(xué)崛起

華爾街?jǐn)?shù)據(jù)爭(zhēng)奪戰(zhàn)056

AI眼中的歷史與未來(lái)058

造就神奇的數(shù)據(jù)科學(xué)060

來(lái)自大數(shù)據(jù)的挑戰(zhàn)062

異軍突起的數(shù)據(jù)可視化065

硬幣的另一面067

第六章機(jī)器在聆聽(tīng)——語(yǔ)音識(shí)別的歷史性突破

人類(lèi)的美好夢(mèng)想與歷史探索070

統(tǒng)計(jì)語(yǔ)言學(xué)打破沉寂071

劍橋語(yǔ)音的黃金十年073

技術(shù)高門(mén)檻與壟斷076

深度學(xué)習(xí)帶來(lái)歷史性突破078

廣闊的創(chuàng)新領(lǐng)域080

第七章讓霍金傾談——語(yǔ)音合成創(chuàng)造奇跡

機(jī)器制造“完美的保羅”086

語(yǔ)音合成的漫漫長(zhǎng)路089

科大訊飛,一名在校生書(shū)寫(xiě)的傳奇090

語(yǔ)音交互大戰(zhàn)打響093

第八章重建巴別塔——機(jī)器翻譯拆除語(yǔ)言樊籬

機(jī)器翻譯嶄露頭角100

冷戰(zhàn)催生的機(jī)器翻譯101

語(yǔ)言的規(guī)則太復(fù)雜103

統(tǒng)計(jì)翻譯成為主角105

見(jiàn)證歷史的活樣板107

科技巨頭的競(jìng)技場(chǎng)108

第九章第二雙眼睛——計(jì)算機(jī)視覺(jué)大放異彩

央視節(jié)目引起熱議114

計(jì)算機(jī)視覺(jué)前史115

學(xué)科奠基人戴維·馬爾117

走上快車(chē)道119

中國(guó)力量崛起122

谷歌貓與計(jì)算機(jī)視覺(jué)的未來(lái)124

第十章忠實(shí)的朋友與助手——形形的機(jī)器人

美的收購(gòu)“德國(guó)國(guó)寶”128

機(jī)器人的前世今生130

現(xiàn)代制造業(yè)與工業(yè)機(jī)器人132

服務(wù)機(jī)器人大合唱134

巨大的沖擊波139

第十一章飛翔的機(jī)器——無(wú)人機(jī)的廣闊天地

無(wú)人機(jī)“黑飛”事件142

漫長(zhǎng)發(fā)展史143

汪滔與大疆145

給“硅谷狂人”上了一課148

廣闊的應(yīng)用領(lǐng)域149

微小型化與集群應(yīng)用152

無(wú)人機(jī)的未來(lái)154

第十二章智能交通革命——自動(dòng)駕駛的夢(mèng)想與現(xiàn)實(shí)

收購(gòu)狂潮158自動(dòng)駕駛概念與無(wú)人車(chē)的歷史159

伊拉克戰(zhàn)場(chǎng)引發(fā)的無(wú)人車(chē)挑戰(zhàn)賽161

民用研究趁勢(shì)而上162

“狂人”馬斯克來(lái)了165

不同的聲音——無(wú)人駕駛還需60年168

無(wú)人車(chē)暢想曲170

第十三章無(wú)形機(jī)器人——無(wú)處不在的虛擬機(jī)器人

一場(chǎng)官司的背后172

什么是Bot 174

Bot今昔175

創(chuàng)業(yè)的新機(jī)會(huì)177

虛擬機(jī)器人大顯神通179

未來(lái)的競(jìng)爭(zhēng)利器180

第十四章終身學(xué)習(xí)時(shí)代來(lái)臨——人工智能塑造新人生

教育史上的“一場(chǎng)數(shù)字海嘯”186

機(jī)器人給考試評(píng)分190

高考機(jī)器人亮相192

AI帶來(lái)個(gè)性化教育193

超越大學(xué),終身學(xué)習(xí)196

第十五章電腦神醫(yī)——精準(zhǔn)醫(yī)學(xué)帶來(lái)的福音

AI挑戰(zhàn)醫(yī)生200

破解醫(yī)學(xué)影像處理難題202

手術(shù)機(jī)器人205

精準(zhǔn)醫(yī)學(xué)應(yīng)運(yùn)而生208

新藥研制走上新路210

時(shí)刻不離的遠(yuǎn)程AI醫(yī)生212

第十六章二十三條軍規(guī)——對(duì)人工智能者的回答

烏鎮(zhèn)內(nèi)外216

AI為什么是錯(cuò)的219

今天的AI可能還處于胚胎階段221

樂(lè)觀的信號(hào)出現(xiàn)223

未雨綢繆的“二十三條軍規(guī)”225

第十七章美麗新世界——AI的未來(lái)

AI 2.0新篇章230

通用AI的追求231

深度學(xué)習(xí)的未來(lái)232

挑戰(zhàn)摩爾定律234

向人腦學(xué)習(xí)237

人類(lèi)的新征程240

第十八章中國(guó)傳奇正在書(shū)寫(xiě)

AI名人堂里來(lái)了中國(guó)人244

244國(guó)際學(xué)術(shù)會(huì)議因春節(jié)改期246

246美國(guó)媒體關(guān)注中國(guó)AI 247

247開(kāi)放環(huán)境創(chuàng)造雙贏249

249美國(guó)政府的新?lián)鷳n251

創(chuàng)業(yè)大潮風(fēng)起云涌252

宏偉的國(guó)家AI發(fā)展藍(lán)圖255