前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的識別技術論文主題范文,僅供參考,歡迎閱讀并收藏。
1、概述生物識別技術,又稱為生物特征識別技術,是通過計算機與生物傳感器、生物統(tǒng)計學等高科技手段緊密結合,利用人體固有的生理特征和行為特征識別身份的技術。該技術被稱為數(shù)字時代的安全衛(wèi)士。在實際應用中,生物特征識別通過特定的設備進行特征取樣測量,轉化成數(shù)字代碼;對代碼取樣后形成特征模板;用特征模板與實際個體取樣進行比對;根據(jù)比對結果是否匹配來決定接受或拒絕該用戶。常用于識別的生物特征有指紋、人臉、掌紋、血管紋路、DNA等;行為特征有簽名、語音、步態(tài)等。
2、生物識別技術的特點與應用優(yōu)勢生物特征是與生俱來的,與傳統(tǒng)身份識別方式相比,生物識別技術具有以下優(yōu)勢[4]:(1)能夠進行身份識別。傳統(tǒng)身份認證識別采用用戶名+口令驗證的方式來驗證用戶身份。生物特征同樣可以完成身份識別的功能。(2)生物特征具有唯一性,防偽性好,難以被偽造或盜用。傳統(tǒng)身份識別技術中的用戶名和密碼會因為信息泄露而帶來身份認證漏洞。生物特征則是個人特有的,極難被仿造或盜用。(3)攜帶方便,不會遺忘或丟失。傳統(tǒng)身份識別技術采用口令驗證或實物驗證,兩者都有遺忘和丟失的風險。而生物特征是人類的體貌和行為特征,攜帶方便,也不存在丟失和遺忘的風險。(4)用戶使用體驗好,不容易被損壞。傳統(tǒng)身份識別技術依賴數(shù)據(jù)庫記錄用戶名和密碼,常因為字符輸入錯誤而被拒識;IC卡一類的實物驗證技術則有因損壞而被拒識的風險。生物特征大大降低了此類風險。即使是容易受到手指表層皮膚破損而影響驗證的指紋識別也可以通過存儲多個手指的指紋來達到順利驗證身份的目的。此外因為生物識別技術使用友好度高,用戶體驗好。
3、常用生物識別技術的特性分析在眾多的生物特征中,最常使用的用戶接受度較高的是指紋識別、人臉識別和簽名識別。指紋識別是應用最早、應用面最廣的生物特征識別技術。早在幾千年前人們就已經(jīng)發(fā)現(xiàn)了指紋的特點,開始使用指紋進行身份的識別。指紋識別主要是利用指紋記錄儀和計算機等電子設備,通過人類手指表層皮膚上交替出現(xiàn)的脊和谷進行指紋圖像的讀取、提取指紋特征、制成特征模板,再通過模式匹配,最終實現(xiàn)身份的自動識別。每一個人都有自己獨特的而且終身不會變化的指紋。指紋識別技術可靠性高,識別簡便,是一項成熟的生物特征識別技術。在應用面上也體現(xiàn)出無與倫比的優(yōu)勢,目前國內(nèi)外指紋識別應用已經(jīng)覆蓋了公安刑偵領域、公共安全領域等。由于指紋識別技術是將輸入的指紋和數(shù)據(jù)庫中預存的指紋模板進行比對從而驗證身份,因此要求指紋信息數(shù)據(jù)庫的容量足夠大,并且要不斷更新。人臉識別技術是近年來迅速發(fā)展的一種生物識別技術。人臉識別技術涉及了計算機視覺、人工智能、感知學習和模式識別技術等科學領域。人臉識別是通過攝像機讀取人類臉部特征信息,分析現(xiàn)實人臉的空間圖像映射到機器空間的過程,分析人類臉部共有特征和個體人臉特征之間的關系,形成人臉圖像模板,最終實現(xiàn)人臉自動識別。人臉識別技術具有方便、直接、友好等特點,在使用者接受度方面表現(xiàn)極好。但是人臉圖像信息的數(shù)據(jù)量巨大,為了提高人臉識別的運算速度,必須對原始圖像數(shù)據(jù)進行壓縮,這就有可能降低識別率,造成一定的誤識率和拒識率。簽名識別是通過分析使用者簽署自己名字的方式來進行身份鑒別。簽名識別與指紋識別、人臉識別不同,它屬于人類行為識別技術。簽名識別分成在線驗證和離線驗證兩種形式。離線驗證是使用紙張上的字跡通過掃描儀等電子設備轉化成數(shù)字圖像再與數(shù)據(jù)庫中模板信息比對;在線驗證則通過手寫板或壓敏筆等傳感器設備記錄簽名過程中的各項動態(tài)特征數(shù)值(寫字速度、力度、角度、加速度等)。簽名的動態(tài)特征是難以模仿的,因此簽名的在線驗證方式比離線驗證方式要更加可靠。此外簽名識別與人們平時的簽字行為極為相似,因此具有很高的用戶接受度。
二、生物識別技術在電子商務中的應用
伴隨電子商務的發(fā)展,解決電子商務中的安全問題和尋找更加可靠方便的身份認證方式成為進一步發(fā)展電子商務的新需求。另一方面,隨著全球信息化的發(fā)展,生物識別技術在技術發(fā)展和市場培育上都日趨完善,人們對生物識別技術的認知度和認可度也不斷提高。全球生物識別技術產(chǎn)業(yè)化發(fā)展程度在不斷擴大。2002年11月,中國科學院計算機技術研究所承擔的“面像檢測與識別核心技術”項目獲得突破性成果,該系統(tǒng)能夠在1/10~1/20秒之內(nèi)自動檢測到人臉,并且在1秒內(nèi)完成身份識別。2003年阿拉伯聯(lián)合酋長國宣布啟用基于虹膜認證技術的針對被驅逐外國人的國界控制系統(tǒng)。2006年北京農(nóng)村商業(yè)銀行在國內(nèi)試點使用指紋識別認證,用戶可以通過指紋識別認證進入銀行系統(tǒng),自助完成各項操作。2007年中國建設銀行和中國郵政儲蓄銀行分別在全國營業(yè)網(wǎng)點內(nèi)推廣應用柜員指紋身份認證系統(tǒng)。2008年北京奧運會,奧運村使用了基于人臉識別的酒店門禁管理系統(tǒng)。2010年波蘭BPSSA銀行宣布引入采用生物識別技術的自動取款機。國際民航組織確定從2010年起,其所有的成員國和地區(qū)必須使用基于人臉識別的機讀護照,此項規(guī)定已經(jīng)成為國際標準。此外日本三菱銀行開發(fā)了基于手指靜脈的認證系統(tǒng)用于金庫管理。歐美國家將生物認證技術廣泛用于醫(yī)院病人資料庫管理、政府信息中心出入境管理、小學生信息管理等多個領域。由此可以期待,在不遠的將來,基于生物特征識別技術的更加平民化的電子商務應用走入我們的生活,帶來更加安全更加便利的使用體驗。
三、生物識別技術對電子商務的影響趨勢
現(xiàn)代社會生活各方面都需要可靠方便的身份認證識別技術,尤其是在電子商務領域內(nèi),目前電子商務的運營過程中不乏因為過程監(jiān)控不夠周密而出現(xiàn)的貨物丟失、冒領,并由此引發(fā)糾紛事件。未來,基于生物識別技術的身份認證識別能夠覆蓋電子商務的全領域,徹底解決電子商務運營過程中的身份認證問題。
1、在電子商務領域內(nèi)的全領域覆蓋電子商務在運行過程中涉及了買賣雙方的身份認證、訂單信息認證、支付安全認證、物流運輸安全認證等多項認證。其流程之繁瑣,認證技術運用頻率之高是其他行業(yè)所無法比擬的??煽勘憷纳锾卣髯R別認證技術能夠確保電子商務系統(tǒng)的正常運轉。未來,電子商務的買賣雙方可以通過生物特征認證技術證明自己的身份;通過生物特征認證和數(shù)字簽名的雙因子認證確定訂單的真實有效,并完成相應的支付;物流公司的物流派送人員通過指紋驗證確認接收到需要派發(fā)的貨物;最終收貨人通過提供帶有生物特征信息的簽收信息表明身份,確保貨物安全送達。由此,生物特征技術確保了電子商務安全領域內(nèi)的安全性、可用性、可控性、保密性和不可否認性,保障電子商務系統(tǒng)正常有序運行。
2、多項生物特征融合應用從目前的應用看來生物識別技術雖然前景良好,但仍存在有漏洞。例如,利用塑膠可塑性的特點采集指紋應對指紋驗證系統(tǒng);利用3D打印技術欺騙靜態(tài)人臉識別驗證系統(tǒng)。多項生物特征的融合使用就是生物特征識別技術的多因子驗證。這種對多項生物特征的采集、融合、聯(lián)合驗證的新型理論和技術就是生物特征識別的未來發(fā)展趨勢。該項技術能夠對所采集的生物特征信息進行多方面、多級別的處理,得到更加完備的數(shù)據(jù)特征信息,從而完成精準度更高的身份認證,為安全可靠的身份認證技術的實施奠定了基礎。
四、結論
無線射頻識別技術[1](radio frequency identification,RFID)是一種非接觸的自動識別技術, 它通過射頻信號自動識別目標對象并獲取相關數(shù)據(jù)。在RFID系統(tǒng)工作時,數(shù)據(jù)碰撞將導致讀寫器的接收機不能正確而及時地讀出數(shù)據(jù),從而降低RFID系統(tǒng)的工作性能及其效率。標簽防碰撞算法可以實現(xiàn)多個標簽與讀寫器之間的正確通信,其性能決定了標簽的識別速度和效率。因此, 標簽防碰撞算法是RFID系統(tǒng)中的關鍵技術之一,其優(yōu)劣性在很大程度上決定了射頻識別過程的時間性能以及識別成功率。
傳統(tǒng)的標簽防碰撞算法可分為ALOHA算法[2-3]和樹形算法[4-5]2類。ALOHA算法是1種完全隨機接入的多址接入?yún)f(xié)議算法,比如:PALOHA算法(隨機推遲算法)、時隙ALOHA算法(SA算法)、幀時隙ALOHA算法(FSA算法)、動態(tài)幀時隙ALOHA算法(DFSA算法)和分組ALOHA算法等。該類算法在標簽試圖發(fā)送數(shù)據(jù)時,并不考慮信道當前的忙閑狀態(tài),一旦產(chǎn)生數(shù)據(jù),就立刻決定將其發(fā)送至信道,這種發(fā)送控制策略有嚴重的盲目性。隨著用戶數(shù)量或發(fā)送信息量的增加,這種完全隨機接入的算法將使信道重疊現(xiàn)象加劇,碰撞概率增大,傳輸性能下降。
近幾年,有學者提出了采用CDMA技術進行防碰撞的方法,其性能有明顯改善。文獻[6]提出在標簽識別過程中,使用碼分多址技術,實現(xiàn)一個時隙可以同時傳輸多個標簽。文獻[7]提出了一種基于碼分多址思想的時隙ALOHA算法,來解決射頻識別中的防碰撞問題,此算法的系統(tǒng)穩(wěn)定范圍要大于時隙ALOHA系統(tǒng),并且當選用的擴頻碼組階數(shù)為N時,此算法的最大吞吐量可達原時隙ALOHA的N倍。上述2個文獻所提到的算法,當標簽數(shù)量很多時,數(shù)據(jù)碰撞的概率明顯增加,使系統(tǒng)的吞吐量急劇下降,影響了系統(tǒng)的整體性能?;谝陨显?本論文提出了1種改進的基于CDMA技術的防碰撞算法,能夠適應大量標簽的識別應用,減少了識別碰撞的發(fā)生,使系統(tǒng)吞吐量得到明顯改善。
1基于CDMA技術的新型防碰撞算法
n×1-1Nn-1(2)由于傳統(tǒng)的基于ALOHA的防碰撞算法中一個時隙最多只能正確識別一個標簽的信息,所以當標簽數(shù)目過大時,系統(tǒng)的吞吐率,即正確識別標簽數(shù)目所占的百分比將會大幅度的降低,所以對于過量的標簽,本算法將會采取對所有標簽進行分組識別,當標簽需要分成2組時(系統(tǒng)識別幀最大時隙數(shù)N為256):nN×1-1Nn-1=n2N×1-1Nn2-1 (3)用上述公式可知n=354,所以當標簽數(shù)量大于354時,系統(tǒng)將會對標簽分組識別。
本文提出的新型算法如下:依據(jù)分組幀時隙ALOHA算法,通過此算法的分組規(guī)則,完成識別的所有標簽的分組。分組幀時隙ALOHA算法的分組規(guī)則如下:當標簽數(shù)量≤354時,無論幀長選擇8個時隙還是256個時隙,標簽都不分組,按照一個大組來進行識別;當標簽數(shù)量>354時,幀長選擇256個時隙比較適合讀寫器的識別;當標簽數(shù)量在355707時,標簽分為2組;當標簽數(shù)量在708~1 416時,標簽分成4組更適合信息的傳輸識別。當標簽數(shù)量更多時,按照這個規(guī)律分成合適的組數(shù)再進行識別,詳細過程如圖1所示。標簽分組工作完成后,在每個分組中分別采用碼分多址技術,利用其技術的保密性、抗干擾性和多址通信能力,對標簽中的數(shù)據(jù)進行擴頻處理并傳輸。然后讀寫器端利用碼組的自相關特性對不同標簽所發(fā)的數(shù)據(jù)進行解調(diào),從而達到防碰撞的目的,進而完成對全部標簽的識別,也實現(xiàn)了同一時隙可以傳輸多個信息的情況。本論文中提到的新型防碰撞算法需要預先在待識別的標簽中植入擴頻性良好的正交碼組,以防止接收端沒有辦法正確解擴接收,本文選用Walsh序列。該算法可以有效減少圖1算法執(zhí)行過程示意圖標簽識別過程中的碰撞次數(shù),從而減少了識別時間并且降低了功耗。本論文將分組幀時隙ALOHA算法和碼分多址技術相結合,實現(xiàn)在每個分組內(nèi)可以有多個標簽同時進行擴頻傳輸,并且在接收端采用并行接收技術進行多個標簽的同時接收。本發(fā)明在識別標簽過程中,每個組內(nèi)均為一個獨立的識別過程,在分組幀長不改變的前提下,提高了標簽數(shù)量龐大時的系統(tǒng)性能。有效地減小標簽之間的碰撞概率,縮短讀寫器操作時間,提高吞吐率, 很適合應用于具有較大數(shù)量標簽的RFID系統(tǒng)中。
2仿真結果
本論文提出了采用碼分多址技術的新型防碰撞算法,并仿真了固定時隙數(shù)下ALOHA算法的系統(tǒng)吞吐率和本文所提出的算法改進后的系統(tǒng)吞吐量。
RFID系統(tǒng)中時隙ALOHA算法的幀長取值從16個時隙到256個時隙變化,根據(jù)公式2,系統(tǒng)吞吐率如圖2所示。其中,系統(tǒng)仿真設定的信息幀長F即時隙數(shù)設定按2的冪次方遞增,即F取值從16個時隙變化到256個時隙,橫坐標為標簽數(shù)N從1變化到500,縱坐標為吞吐率。當幀長設定為256個時隙,標簽數(shù)量少于256個時,系統(tǒng)吞吐量隨著標簽數(shù)量的增加而增加,直到標簽數(shù)量達到256時系統(tǒng)的吞吐量達到最大值。隨著標簽數(shù)量的逐漸增多,系統(tǒng)的吞吐量又呈現(xiàn)下降趨勢。從圖2可以得出2點結論:一、當標簽個數(shù)接近信息幀長時,系統(tǒng)的吞吐率比較高;二、隨著幀長取值的增加,系統(tǒng)對標簽的識別性能有明顯改善。
本論文提出的基于碼分多址技術的新型防碰撞算法選用Walsh序列碼,其在對標簽的ID號進行擴頻處理后,即可實現(xiàn)在同一時刻有2個以上的標簽同時進入讀寫器的識別區(qū)域,它們同時發(fā)送各自的ID號后,讀寫器在接收到這些在空間疊加后的信號時也能完整地分離出不同標簽的ID號,突破了時隙ALOHA算法在同一時刻不能有2個以上標簽到達的限制。此時,系統(tǒng)的吞吐量為(Walsh序列的階數(shù)為r)esucc=∑t=2rt=1N×P(N,n,t)(4)固定時隙數(shù)的ALOHA算法的系統(tǒng)吞吐量仿真圖和其與基于碼分多址技術的新型防碰撞算法的比較仿真結果如圖3所示。仿真條件為標簽的到達情況符合泊松過程。仿真圖3給出了RFID系統(tǒng)的讀寫器閱讀100個標簽的識別結果,其中新型算法選用的是Walsh序列,其階數(shù)r取值從2變化到3,固定時隙數(shù)的ALOHA算法的信息幀長F取值從32變化到64,橫坐標為標簽數(shù)N從1變化到100,縱坐標為吞吐量。從仿真結果看,在同樣的到達率的條件下,階數(shù)越大,算法的吞吐量越高,系統(tǒng)的識別性能有明顯改善。并且隨著到達率的增加,新型算法的吞吐量也隨著增加,當標簽到達量與階數(shù)相等時,系統(tǒng)吞吐量達到最大,但到達量大于階數(shù)時,吞吐量隨著到達率的增加而呈下降趨勢。這是由于當在同一時隙內(nèi)到達的標簽數(shù)量增加到一定程度后,基于Walsh序列階數(shù)r的有限性,選用相同的Walsh序列作為擴頻碼的標簽數(shù)量將會增加,此時必然導致碰撞的增加。當選用的Walsh序列階數(shù)為3時,基于碼分多址技術的新型防碰撞算法的系統(tǒng)吞吐量可高達3.2,遠高于時隙ALOHA的0.368。而且隨著Walsh序列階數(shù)的提高,吞吐量的最大值還可以提高,但這會以增加讀寫器和標簽的硬件復雜度為代價,在實際使用中必須根據(jù)需求在吞吐量和Walsh序列階數(shù)中作出折中選擇。
1 文獻統(tǒng)計分析
1.1 文獻數(shù)量統(tǒng)計 筆者通過中國知網(wǎng)的“中國學術文獻網(wǎng)絡出版總庫”,分別以“圖書館*RFID”、“RFID*圖書館”兩組關鍵詞為檢索路徑,采用高級檢索的方式,以2004~2013年為檢索年限,檢索時間截至2013年12月31日,檢索結果如表1所示。
■
1.2 文獻學科類別 以“圖書館?RFID”為關鍵詞檢索到的332篇文獻作為統(tǒng)計基礎,根據(jù)文獻研究內(nèi)容主題進行統(tǒng)計,共涉及9個學科類別,其中199篇為圖書情報專業(yè)學科,占發(fā)表文獻總量的59.9%(見表2)。
■
1.3 發(fā)文年代分布
■
2 從文獻量化分析看研究進程
2.1 圖書館RFID研究文獻的起步 關于我國“圖書館RFID”的文獻研究起步于2004年。2004年西華大學圖書館李欣榮發(fā)表了《RFID在現(xiàn)代圖書館管理系統(tǒng)中的應用》,文章探討了RFID的定義、RFID系統(tǒng)的組成、RFID的優(yōu)點,指出RFID及時是一種市場前景和應用規(guī)模巨大的高新技術,這種技術的應用將給現(xiàn)代圖書館管理系統(tǒng)帶來革命性變化。2004年杭州師范學院圖書館沈嶸發(fā)表了《無線射頻識別技術(RFID)及其在圖書館的應用》,指出射頻識別技術RFlD與條形碼識別技術相比的優(yōu)越性,在圖書館應用方面,射頻識別技術彌補了條形碼識別技術的不足。
2.2 圖書館RFID研究文獻的發(fā)展 2004~2013年間,共發(fā)表有關“圖書館RFID”的文章332篇,這些論文分別來自54種國內(nèi)公開出版的學術期刊,其中包括圖書館學專業(yè)及人文社會科學其他專業(yè)。
從論文年代分布對其發(fā)展進程進行分析,10年的研究大體上分為2個階段:第一階段:起步階段,2004~2006年,這一階段涉及到的論文有17篇。第二階段:高峰階段,2007~2013年,研究的論文數(shù)量逐漸增多,7年共發(fā)表324篇論文,占文獻總量的97.6%,并逐漸形成研究熱點。這一階段可以看作是圖書館RFID研究的高峰平臺期,且還沒結束。
3 文獻研究的內(nèi)容
3.1 RFID的理論以及應用模式研究 通過對10年發(fā)表的332篇論文主題的歸納分析,發(fā)現(xiàn)關于圖書館RFID的理論以及應用研究占大多數(shù),都從RFID的介紹、特點、優(yōu)越性在圖書館中應用的可行性以及應用效果等方面對圖書館應用RFID進行了充分的論述。
河北師范大學圖書館劉紹榮、杜也麗、張麗娟在《RFID在圖書館使用現(xiàn)狀分析》一文中通過對國內(nèi)外圖書館實施RFID技術情況的調(diào)研,就其在國內(nèi)的總體發(fā)展情況、使用情況以及使用效果進行了分析,并指出使用中存在的問題,提出解決問題的建議,為關注者和準備實施RFID的圖書館提供參考。
在《RFID在圖書館應用的可行性研究》一文中,中山大學資訊管理系蔡孟欣從圖書館的戰(zhàn)略規(guī)劃、經(jīng)濟、技術、安全、人文等方面,對RFID在圖書館應用的可行性進行了分析,同時指出圖書館應根據(jù)自身及社會的實際情況進行綜合考慮,進而確定是否采用RFID系統(tǒng)。
深圳圖書館甘琳在《RFID技術在圖書館的應用創(chuàng)新》一文中從深圳圖書館應用RFID的經(jīng)驗、體會出發(fā)進行闡述,同時在服務、業(yè)務及管理等方面,論證了這種新技術給圖書館行業(yè)帶來的機遇與挑戰(zhàn)。
3.2 圖書館應用RFID的優(yōu)缺點研究 從目前發(fā)表的文章來看,有關RFID技術在圖書館應用的優(yōu)勢,不足及改進辦法的論述已經(jīng)比較全面。其優(yōu)勢主要包括:①實現(xiàn)自助借還,優(yōu)化圖書借閱服務;②便于書庫管理,提高館藏清點速度;③提高工作效率,節(jié)約人力成本等。不足主要包括:①成本較高;②標準不統(tǒng)一;③安全問題;④侵犯隱私權;⑤識別精度;⑥與現(xiàn)有系統(tǒng)的整合等。
西南政法大學圖書館楊雪在《RFID技術在圖書館應用中的思考》一文中指出,在圖書館應用方面,RFID技術具有非常大的優(yōu)勢,可以提高圖書館的管理和服務水平,但在實際應用中仍然遇到一些問題。除上文提出的一些普遍存在不足之外,還提出圖書館在應用RFID技術中管理觀念滯后、系統(tǒng)集成方案不成熟等問題,需要圖書館、RFID廠商及管理系統(tǒng)開發(fā)商協(xié)調(diào)工作,共同解決。
天津農(nóng)學院圖書館王穎在《對RFID在圖書館應用的思考》一文中重點討論了圖書館人在RFID應用中需要關注和思考的問題,包括RFID標準、人力資源合理安置、讀者調(diào)查以及圖書館應用RFID系統(tǒng)的示范項目等方面。
4 總結與分析
自從2006年廈門集美大學誠毅學院和深圳圖書館應用RFID系統(tǒng)以來,國內(nèi)許多學者即從RFID的概述、作用、運行模式等方面進行探討,取得有意義的理論和實踐成果。
4.1 RFID研究文獻增長迅速 筆者利用“中國學術文獻網(wǎng)絡出版總庫”,以“圖書館*RFID”為檢索策略,檢索出2004年至2013年文獻332篇,從“文獻發(fā)表年代分布統(tǒng)計”一表中可以看出,國內(nèi)對RFID的研究成直線上升狀態(tài)。
4.2 RFID理論研究熱點 ①RFID概述及其特點。在圖書館領域,隨著現(xiàn)代化技術的廣泛使用,使用多年的條形碼識別技術逐漸被新型的射頻識別技術RFID所取代。對于RFID技術來說,其優(yōu)勢主要表現(xiàn)為:使用壽命長、讀取距離大、標簽上數(shù)據(jù)可以加密、存儲數(shù)據(jù)容量更大等,該技術可以替代條形碼和磁條技術。②RFID在圖書館中的應用研究。自從RFID技術在集美大學誠毅學院和深圳圖書館的應用,RFID技術已經(jīng)受到圖書館越來越多的關注。RFID技術在圖書館的應用,使圖書館的管理更趨于科學化,將給現(xiàn)代圖書館管理系統(tǒng)帶來革命性的變化,將圖書館從數(shù)字化圖書館推向了智能化圖書館。③RFID優(yōu)缺點的研究。RFID技術在圖書館應用面具有非常大的優(yōu)勢,可以提高圖書館的管理和服務水平、提高圖書館的服務效率,但在使用過程中仍然遇到一些問題,也存在不成熟或不完善的地方。近些年許多學者通過對RFID技術在圖書館應用中存在的優(yōu)勢及問題進行分析,提出解決方法及對策。
關鍵詞:星敏感器;星圖識別算法;導航星數(shù)據(jù)庫;奇異值分解
中圖分類號:TP391.4 文獻標識號:A 文章編號:2095-2163(2014)02-
An Improved Star Recognition Algorithms based on Singular Value Method
XING Yifan, WANG Jianhua
(Institute of Computer Science and Information Engineering, Harbin Normal University, Harbin 150025, China)
Abstract: Star tracker is most precise instrument of attitude measurement, playing a vital role in attitude measurement and control system of all kinds of Aerospace Flight Vehicles. Star pattern recognition algorithm as one of core technology of star tracker is so important that the reliable, fast and accurate star pattern recognition is widely investigated. The star pattern recognition algorithms are investigated. For the problem of low coverage throughout the sky caused by lack of bore sight direction, an improved singular value method for recognition algorithm is proposed respectively. The design thoughts of programs are elaborated clearly. Finally, this thesis develops JAVA language code of the improved algorithm in the JDK 5.0 Builder environment and makes an comparison with performance of the traditional Triangle algorithm in detail.
Keywords: Star Tracker; Star Recognition Algorithms; Database of Guide Star Pattern; Singular Value Decomposition
0 引言
天文導航是通過對已知自然天體的坐標位置和運動規(guī)律開展研究,應用觀測天體的天文坐標值來確定導航體在地球上的地理位置等導航參數(shù)[ ]。與其他導航技術相比,天文導航系統(tǒng)由于不需要其他地面設備的支持,可以實現(xiàn)自主式導航,同時還具有指向精度高、體積小、自主性強、無姿態(tài)累積誤差等優(yōu)點,星敏感器的這些性能使其成為一種優(yōu)良的空間姿態(tài)敏感器技術而在空間飛行器中得到越來越廣泛的應用。
星敏感器技術的出現(xiàn)為空間飛行器的姿態(tài)測量探明了一個新的途徑。星敏感器利用恒星坐標系作為參考坐標系,以若干個恒星矢量進行航天器在軌飛行階段的高精度姿態(tài)測量。對于星敏感器而言,星圖識別的實質(zhì)就是尋找觀測星圖中觀測星在星表(天球坐標系)中對應的導航星[ ],這是星圖導航中極為關鍵的一個步驟。該步驟指出了星敏感器拍攝到的實時星圖的空間位置信息,可為導航中的姿態(tài)和位置解算提供了基礎,其效率和準確度對整個星圖導航系統(tǒng)有著極為重要的意義[ ]。
1 基于奇異值分解的星圖識別算法
基于奇異值分解的星圖識別算法是一種非直觀的星模式識別方法,是利用觀測坐標系下的觀測單位列矢量矩陣的奇異值和參考坐標系下相應的參考單位列矢量矩陣的奇異值來進行星模式識別。由數(shù)學原理解析可得,該算法進行模式識別所用的奇異值相對于坐標變換是不變的[ ]。對于一幀觀測星圖,無論有多少個向量,最后提取的特征只有3個奇異值。
首先通過對基于區(qū)域分析的指尖檢測算法的介紹和研究,并驗證了該算法的有效性。然后介紹了增強現(xiàn)實技術以及增強現(xiàn)實中的人機交互,并把指尖檢測算法應用到增強現(xiàn)實系統(tǒng)中,通過實驗能夠很好的識別指尖與虛擬對象的交互區(qū)域并實時反饋交互結果,證實了該算法在增強現(xiàn)實系統(tǒng)中的可行性。
【關鍵詞】區(qū)域分析 指尖檢測 增強現(xiàn)實 交互應用
1 基于區(qū)域分析的指尖檢測算法
1.1 改進的圖像差分算法
在傳統(tǒng)的鄰幀差法主要是通過前后兩幀的灰度值來檢測圖像中變化的區(qū)域,這種算法在目標運動并且背景靜止的情況下是很有效果的,但是當目標停止運動時鄰幀差法就會失效。而背景消減法主要是通過把當前幀和參考圖像相消減來獲取靜止的目標物體。所以能否準確分割的關鍵取決于如何選擇與更新參考圖像。
1.2 指尖的檢測識別
1.2.1 指尖模型
指尖模型包括二維模型和空間三維模型。空間三維手指模型可以通過提供詳盡的建模使得后面的手勢識別有很高的精確度。但是手指動作隨時都在變化,手指的空間三維模型還是很復雜而且實時計算代價很高,所以我們通過利用指尖二維平面位置檢測法來解決以上問題。
通過對手指在二維平面上各種動作的觀察,我們發(fā)現(xiàn)在手指運動并且變換各種動作時其指尖形變部位相對較小,所以我們可以把指尖的狀態(tài)看做是一個圓和一組平行線的組合?;谶@種情況,我們設計一個模型作為指尖模板,如圖1所示。在圖中,d表示的時手指的寬度,這個寬度由攝像頭和手指之間的距離來確定。
如果在二值化后,前景圖像中的目標是1,背景是0的話,我們可以看到在指尖區(qū)域有兩個特點:
(1)在指尖的中心被一個圓包圍,這個圓是由一圈圈像素填充所繞成的,其半徑可以定義成手指的寬度;
(2)如圖1所示,在圓外的特定搜索區(qū)域內(nèi),指尖部分是被0像素和連續(xù)的1像素所包圍。
根據(jù)形狀匹配思想,主要是通過按一個度量標準來對比匹配的物體間的相似程度來進行形狀匹配。根據(jù)這個思想,如果要想對某一模式進行識別,那么就要先準備好與之相對應的模板。因為考慮到要識別的模式其大小、方向等外部特征會發(fā)生改變的可能,所以需要對于每一種變化后的模式都要有對應的模板,這樣才能保證真確識別。因為指尖會有各自動作變化或者會有部分被遮擋,而且不同人的手指也存在大大小小的不同,所以我們采用的指尖模板要能夠伸縮、平移以及保證旋轉時不變。
1.2.2 指尖檢測
因為攝像頭和人手之間的距離一般都是相對固定了,所以我們將手指寬度設定為5和15之間,通過一些實驗,結果表明這個值的設定對于大多手指都是適用的。在搜索區(qū)域中,其邊長相比于手指直徑,一般都要大兩到三個像素。如果這個邊長的值設置的比較大,那么計算代價就會比較大,這樣就會導致檢測的精度不夠高。公式1.4中的Max和Min是對前景像素在搜索區(qū)域方向上個數(shù)的限制,一般來說Min的值等同于手指寬度d,Max為Min的兩倍。
結合上述內(nèi)容,一個像素點只有同時滿足三個條件,才可以被判斷為指尖。這三個條件如下:
(1)在這個像素點得周圍區(qū)域里的前景像素一定要達到一定數(shù)量。
(2)在以這個像素點為中心的搜索區(qū)域邊界上的前景像素和背景像素各自的比例一定要合適。
(3)在搜索區(qū)域邊界上的前景像素一定要能夠直接連通。
1.2.3 指尖檢測實驗結果與分析
在實驗中,我們通過手指在投影墻壁上移動來測試以上算法能否準備檢測出指尖位置。在開始的時候,我們將背景設置為藍色,手指進入背景后緩緩移動,我們可以檢測到指尖位置,用黑色的十字叉將其表示出來。
當我們將背景從藍色變換成白色時,這時因為起始設置的藍色背景圖沒有來得及迅速更新,這時就會導致前景分割出現(xiàn)錯誤,當白色的背景穩(wěn)定后,設置的背景圖片進行更換后,就可以檢測出之間的位置,如圖3所示。
2 增強現(xiàn)實中的人機交互判定與反饋
與虛擬對象交互的判定以及虛擬對象對用戶的反饋是交互模塊中主要實現(xiàn)的功能,也是系統(tǒng)中手指虛實交互的最后一個環(huán)節(jié)。
當過以上指尖定位算法,我們能夠比較精確地檢測出指尖的位置,可以得到指尖與虛擬對象交互的有效區(qū)域,這個交互區(qū)域也就是指尖和虛擬對象相交的區(qū)域。再通過坐標轉換,將交互區(qū)域的二維坐標轉換為空間三維坐標。我們通過設定一個處理動作觸發(fā)的時間來對指尖動作進行判定,一般這個觸發(fā)時間是在0.5秒到一秒之間。當指尖的觸發(fā)時間在設定的時間之內(nèi)并且指尖位置沒有很大變化的時候,就判定指尖對虛擬對象進行了觸發(fā)動作,通過程序處理,虛擬對象會根據(jù)指尖的動作做出相應地反饋。
3 基于區(qū)域分析的指尖檢測算法在AR系統(tǒng)中的應用
通過實驗驗證,利用基于區(qū)域分析的指尖檢測算法在大多情況下能夠準確地檢測出指尖的位置,從而有效的判斷了手指與虛擬對象的交互區(qū)域。實驗運行結果如下:圖4所示為系統(tǒng)識別標識物呈現(xiàn)出來的虛擬對象,人手指點擊虛擬對象的邊角并且拖動后,圖5為手指點擊并拖動后的交互效果。
4 結束語
手勢作為一種直觀的動作表示,在人機交互中有著無可比擬的優(yōu)勢,目前也是模式識別、計算機視覺等組多領域的研究熱點。但是目前的算法還是有諸多不足,包括本文介紹的基于區(qū)域分析的指尖檢測算法,也會出現(xiàn)一些誤檢情況。隨著人們研究的深入,一定會有更加高效的算法。通過高效的指尖檢測算法,未來的AR系統(tǒng)的交互將更加的實時、準確,也會促進AR技術的高速發(fā)展。
參考文獻
[1]周國眾.移動增強現(xiàn)實關鍵技術及應用[J].測繪與空間地理信息,2012,35(9):140-144.
[2]唐笑.增強現(xiàn)實技術在移動互聯(lián)網(wǎng)中的應用[J].華章,2013(2):330-331.
[3]羅穎.基于增強現(xiàn)實的交互界面設計研究[D].華中科技大學碩士學位論文,2012(5).
[4]周俊威.手機增強現(xiàn)實虛實注冊關鍵技術研究[D].華中科技大學碩士學位論文,2011.3.
[5]程志,金義富.智能手機增強現(xiàn)實系統(tǒng)的架構及教育應用研究[J].技術與運用,2012.8:134-138.
[6]李可歆.手持設備上基于增強現(xiàn)實的虛實交互技術的研究與應用,青島大學碩士學位論文[D],2010(6).
[7]梅萍華.基于手勢的人機交互和指尖檢測算法的研究[D].中國科技大學碩士學位論文,2010.
[8]顏浩.增強現(xiàn)實系統(tǒng)的人機交互技術研究與應用[D].青島大學碩士學位論文,2011.
作者簡介
周鋒(1987-),男,江蘇省泗洪人。碩士研究生學歷。主要研究方向為計算機監(jiān)控,模式識別。
關鍵詞 輪胎缺陷;計算機視覺識別;輪胎X射線檢測;算法
中圖分類號TN29 文獻標識碼A 文章編號 1674-6708(2013)95-0073-03
0 引言
目前對輪胎X射線檢測系統(tǒng)的圖像識別都是由人來主觀判斷的。X光機對輪胎進行掃描成像,將圖像傳輸?shù)接嬎銠C中在顯示屏上顯示,工作人員通過對輪胎X射線圖像的識別來判斷輪胎是否有缺陷并對其缺陷進行分類,由人工來進行輪胎缺陷圖像識別受到外界的干擾較大,并且具有工作量和工作強度大的特點,這些都容易給輪胎缺陷圖像的識別帶來較大不利影響。采用計算機圖形識別技術對輪胎X射線圖像進行識別,不僅能提高工作效率,有效解決人工識別過程中帶來的問題,使識別的過程客觀化,更加科學和規(guī)范。輪胎X射線缺陷檢測系統(tǒng)能對其圖像進行自動處理和歸類,通過對輪胎缺陷圖像的統(tǒng)計,還可以建立輪胎缺陷圖像的數(shù)據(jù)庫,提高企業(yè)在輪胎生產(chǎn)過程中的經(jīng)濟效益[1]。
國內(nèi)廠商大都是用國外生產(chǎn)的X射線檢測產(chǎn)品,比較常見的品牌有德國的Collmann和YXLON等[2]。YXLON是國際上輪胎內(nèi)部缺陷檢測設備的最大生產(chǎn)廠家,其產(chǎn)品具有可靠的檢測結果、快速的檢測時間、維護簡單、結構緊湊、操作簡單直觀等特點[3]。相比較國外,國內(nèi)對輪胎用X光機圖像處理技術的研究不多,對于國內(nèi)的輪胎制造廠商,如果想要運用輪胎缺陷圖像自動識別技術,只能向國外購買,但是價格昂貴。因此,現(xiàn)在國內(nèi)的大部分廠商還是采用人工肉眼對輪胎X射線圖像檢測的方法進行質(zhì)量判斷[4]。
1 輪胎X射線檢測裝置和結構分析
我們采用的輪胎X射線檢測圖像采集裝置為YXLON公司生產(chǎn)的LX-1500型輪胎X射線檢測系統(tǒng),YXLON的輪胎X射線檢測系統(tǒng)由X射線管、U型傳感器、數(shù)字圖像轉換器、圖像處理工作站和顯示器等部分組成,該系統(tǒng)具有機械結構設計良好和圖像識別系統(tǒng)分辨率高的特點。采用該系統(tǒng)對輪胎進行X射線檢測時,輪胎首先通過起重機被裝載到檢測的支架上,系統(tǒng)操作工使用控制面板輸入合適的參數(shù),按照設定好的參數(shù),徑向X射線管伸進到輪胎的中部,馬鞍型的輪胎線陣列檢測器也移動相應的位置,輪胎在支架上保持勻速的轉動,從而確保了輪胎X射線檢測過程的連續(xù)性。
2輪胎X射線檢測圖像分析
由于輪胎的規(guī)格型號極其繁雜,輪胎的內(nèi)部結構也是千差萬別,導致表述輪胎缺陷時沒有統(tǒng)一的標準,這里依據(jù)對輪胎生產(chǎn)質(zhì)量的控制要求,結合輪胎缺陷數(shù)據(jù)分析和文獻資料參考的基礎上,將輪胎內(nèi)部鋼絲簾線的缺陷特征概括為以下四類:
2.1 簾線的形狀
對于質(zhì)量正常的輪胎而言,其內(nèi)部的胎體鋼絲簾線分布應該是與圖像橫向平行排列的直線序列,如圖1(a)所示。當簾線彎曲時,其檢測圖像如圖1(b)所示。
2.3簾線的細節(jié)
輪胎內(nèi)部鋼絲簾線的細節(jié)主要表現(xiàn)為鋼絲簾線上的不連續(xù)點、交叉點或者斷點。圖3(a)是簾線交叉的X射線檢測圖像,圖3(b)是簾線斷開的X射線檢測圖像。對于胎體異物而言,由于X射線投影成像的關系,異物的影像會與鋼絲簾線的影像發(fā)生重疊,如圖3(c)所示,所以胎體異物也可以歸納為簾線上的細節(jié)問題。
4 結論
本文首先介紹了輪胎X射線檢測裝置,然后對輪胎X射線檢測的圖像進行了詳細分析,并對圖像中輪胎的缺陷種類進行了分類,最后介紹了自己設計的輪胎X射線檢測缺陷識別算法,針對形狀、尺度、細節(jié)、排列四種輪胎缺陷,分別設計了相應的輪胎缺陷識別算法。
參考文獻
[1]馮霞,郝振平.X射線在輪胎邊緣檢測中的應用[J].CT理論與應用研究,2010,19(3):61-66.
[2]徐啟蕾.輪胎X光圖像自動識別系統(tǒng)算法研究[D].青島:青島科技大學碩士學位論文,2006.
[3]張小麗.輪胎缺陷X光檢測圖像的處理與識別研究[D].天津:天津大學碩士學位論文,2007.
關鍵詞: 藏文聯(lián)機手寫識別; 筆畫識別; 方向碼; 筆畫合并
中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2017)07-10-03
Research and implementation of Tibetan online handwritten recognition
Suonan Jiancuo, Guan Bai, Li Lei, Shan Fafu
(Tibetan information technology engineering research center, Tibet, Lhasa 850000, China)
Abstract: This paper presents a method of Tibetan online handwriting recognition based on stroke and its corresponding rules, and implements it. First, each Tibetan text is decomposed into various sub patterns, and then the sub pattern is further divided into strokes. Through the identification of strokes and the corresponding rules of each Tibetan character, the user's handwriting character is recognized. In the identification of a stroke, its trajectory is taken as a set of points, and eight directional codes are used to mark it, and then the stroke is determined. Before the identification, the similar strokes are classified and merged to solve the problem of nonstandard user writing. Without considering the joined-up writing, tested on more than 600 Tibetan words commonly used, the accuracy rate can reach 92%.
Key words: Tibetan online handwriting recognition; stroke recognition; directional code; stroke merge
0 引言
S著如平板電腦、智能手機和數(shù)碼筆等基于筆和觸摸輸入設備的發(fā)展,聯(lián)機手寫字符識別再次引起了人們的興趣。近年來,研究人員開發(fā)出多種方法,來識別不同類別的字符并提高識別性能。這些方法力求在實際應用中以較低的復雜度來實現(xiàn)高性能的識別來滿足用戶的需求。
在中國,藏文作為少數(shù)民族文字,大約被600萬人使用,尤其是在自治區(qū),云南和青海等省。聯(lián)機手寫藏文字符識別也被廣泛應用到便攜設備以及桌面的應用程序[1]。然而,相較于中文、英文和日文等語言,藏文要達到高識別率仍然具有挑戰(zhàn)性。
1 藏文聯(lián)機手寫識別
1.1 研究方法
手寫識別方面主要有基于統(tǒng)計決策模式的識別方法和基于文字結構模式的識別方法兩大類別[2-5],基于統(tǒng)計決策模式的識別方法是首先將待識別的文字提取出一組統(tǒng)計特征,然后根據(jù)此組特征形成該文字的多維特征向量,最后再將該多維特征向量與語料庫中每個字的訓練的多維特征向量進行比較,得出相似度最高的那個多維特征向量,此多維特征向量對應的文字就是所識別出的文字,如圖1所示。
[待識別文字][多維特征向量][語料庫][識別結果][特征提取][判別函數(shù)][相似度]
基于文字結構模式的識別方法就是將被識別的文字(本文中指單個藏文字)看成由多個子模式(本文中指藏文字母)按照一定的規(guī)則組成,而子模式又由基元(本文中指筆畫)組成,如圖2所示?;菢嫵稍撃J降淖钚卧?。通過識別基元,進而識別出子模式,最終識別出該模式,即識別出要識別的藏文字,如圖3所示。識別藏文字時,可以把藏文字當作一種特殊的二維文字,其基本組成單元為:基字、前加字、上加字、下加字、后加字、再后加字、元音[6]。
基于文字結構模式的識別方法相比于基于統(tǒng)計決策模式的識別方法,充分利用了藏文字的構字規(guī)律,因此本文采用基于文字結構模式的識別方法。
1.2 筆畫的歸納及合并
藏文的輸入及編碼已經(jīng)有了統(tǒng)一的標準,但是在手寫識別研究方面的成果還不多,前人多是基于構件進行識別。本文采用一種基于筆畫的和規(guī)則的方法進行識別[7],首先對藏文筆畫進行歸類,然后建立每個藏文字與筆畫之間對應的規(guī)則,根據(jù)規(guī)則查找到對應的藏文字。
一個藏文字由若干個部件構成,一個部件又由若干個筆畫組成,筆畫是組成藏文字的最小單位。要想識別藏文字,首先就要識別出筆畫。但是藏文字筆畫比較復雜和繁多,為了方便識別,我們首先對藏文字筆畫根據(jù)其特征進行分類,最終確定了20個筆畫,并用a―t對其分別命名,如圖4所示。然后確定了30個輔音字母的構成規(guī)則,如
1.3 筆畫的識別問題
我們采用了筆畫識別的方法進行藏文字識別,即先識別用戶輸入的筆畫,再根據(jù)筆畫的集合查找對應的藏文字所對應的筆畫序列,最終確定所寫藏文字。這種基于筆畫的藏文字識別方法,特點是寫一筆,識別一筆,即聯(lián)機識別。筆畫識別是藏文字識別的前提和關鍵。然而筆畫識別還存在諸多問題,例如筆畫的獲取算法對識別的影響、書寫速度的快慢對識別的影響、連筆情況下的識別等。
1.3.1 書寫快慢影響的解決
通過對訓練的筆畫的數(shù)據(jù)進行預處理,用以解決使用者在書寫快慢對識別率的影響。在筆畫識別的程序設計時,筆者把用戶輸入的筆畫軌跡看成點的集合,使用者在進行訓練或者書寫的時候,不同的書寫速度會對筆畫軌跡信息造成影響。例如寫“橫”的時候,雖然二者的方向數(shù)據(jù)都是“3”,但是在數(shù)據(jù)長度方面卻有很大差別,緩慢書寫要比快速書寫的長度要長許多,所以書寫的快慢也會影響識別率。
對于此問題,本文提供兩種解決辦法。第一種是在數(shù)據(jù)訓練時,就故意快速寫和緩慢寫,此方法可以解決這種問題,但這對于訓練人員的要求較高,并且此種方法會產(chǎn)生大量的數(shù)據(jù),會降低識別速度。第二種方法是將數(shù)據(jù)進行歸一化處理,連續(xù)相同的方向以一個數(shù)字代替,不計算其長度,只關注其方向,再拐點處再標記下一個方向。本文采用第一種方法,用數(shù)據(jù)的訓練來彌補技術的不足。
1.3.2 連筆問題的解決
人們書寫藏文經(jīng)常會兩筆或多筆連寫,所以連筆是個需要解決的問題,不過已經(jīng)有了解決思路。首先統(tǒng)計經(jīng)常會連筆的筆畫,例如藏文字“”的最后兩筆,正常書寫應該像圖5的左邊是由兩筆完成,但是人們經(jīng)常會按照圖5右邊那樣一筆寫完,所以我們采用一個藏文字對應兩個筆畫序列規(guī)則或者一個藏文字對應多個筆畫序列規(guī)則進行連筆識別,即“”對應的規(guī)則有正常書寫的“accm”和連筆書寫的“acd”兩個。
1.3.3 訓練程序及識別程序的實現(xiàn)
基于筆畫識別的藏文字識別方法還需考慮用戶在輸入的時候,難免會有一些抖動或者其他干擾因素導致和標準的藏文字體差別的情況,為此,本文提出了一N具有容錯機制的訓練方法,以達到能夠具有容錯的性能。
具體的優(yōu)化方法為:
第一步,將用戶輸入的點看作原點,以正上方為Y軸的正半軸,正右方為X軸的正半軸,建立一個平面直角坐標系,如圖6所示。原來采用正向上為方向碼“1”,現(xiàn)在采取兩邊各5度的容錯范圍,即在正上方(即Y軸的正半軸)向左偏離5度的范圍內(nèi)或者向右偏離5度的范圍內(nèi)都認為用戶輸入的是方向碼“1”,同理,方向碼“2”到方向碼“8”如圖6所示。
第二步,開始對筆畫進行訓練,筆畫訓練起初是采用直接在電腦上進行訓練,用鼠標代替手寫輸入,給出所要訓練的筆畫,照著所給筆畫進行描寫,點擊保存則會保存當前筆畫軌跡信息,獲得該筆畫的訓練數(shù)據(jù)。后來,為了更加準確的獲得訓練數(shù)據(jù),我們設計了安卓版的訓練軟件,使用戶可以在屏幕上用手直接進行訓練。
在基于安卓手機的訓練程序完成后,我們找了20個藏族學生,每人訓練一小時,對筆畫進行了訓練。訓練完成后,開始對筆畫的識別,筆畫識別方面,我們采用的是基于余弦定理的文本相似判別方法,將所寫筆畫的軌跡信息與訓練的語料庫中所有筆畫訓練的信息進行對比,計算出當前所寫筆畫的軌跡信息知識經(jīng)過多少步可以變成與當前比較的語料庫中的軌跡信息,最后得出差異化步驟最小的就是相似度最高的那個筆畫軌跡,進而判斷出所寫筆畫。
1.4 聯(lián)機手寫識別
藏文聯(lián)機手寫識別則是在用戶進行手寫的同時進行處理和識別,因而可以非常方便的獲得藏文手寫筆畫。由此,藏文聯(lián)機手寫識別流程可以簡化為圖7,即先獲取用戶所寫的當前筆畫,根據(jù)語料庫對當前筆畫進行識別,獲得當前書寫的筆畫。然后再計算當前所獲得的筆畫序列和語料庫中藏文字所對應的筆畫序列相似度,計算此相似度的時候,方法為:當前筆畫序列數(shù)與藏文字對應序列中有x個筆畫對應相同,該字共有y個筆畫,相似度則為x/y,若x大于y,則相似度為y/x。然后得出相似度最高的藏文字。
[獲取當前筆畫][識別出當前筆畫][識別出藏文字][語料庫] [規(guī)則]
2 結論及展望
最終,我們采用常用的600多個常用藏文字對其進行測試,在不考慮連筆書寫的情況下,識別的準確率可以達到92%以上,證明基于筆畫的藏文字識別是可行的,可以繼續(xù)研究和探討。
此方法還有一些需要改進的地方。第一,在筆畫歸類的時候,可以先進行訓練,然后根據(jù)訓練的數(shù)據(jù)進行分析和聚類,控制一個閾值,使相似度達到這個閾值的筆畫聚為一類,然后將其作為語料庫,這種辦法可以有效解決筆畫聚類方面由于開發(fā)者主觀因素的影響。第二,記錄筆畫軌跡信息的時候,可以通過只錄拐點處的方向碼,以此減少數(shù)據(jù)量,進而提高識別速度。
參考文獻(References):
[1] 楊峰.聯(lián)機手寫藏文字樣本符采集及分析處理[D].青海師范
大學碩士學位論文,2014.
[2] 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊.深度學習在手寫
漢字識別中的應用綜述[J].自動化學報,2016.8:1125-1141
[3] 呂新橋.聯(lián)機手寫漢字識別技術研究[D].華中科技大學碩士
學位論文,2009.
[4] 柳洪軼,王曉東,王維蘭.藏文聯(lián)機手寫識別的難點及其解決
方法[J].西北民族大學學報(自然科學版),2005.1:77-80
[5] 唐松,郭椿標,鄭南寧.基于文字結構特征的快速平滑細化方
法[J].中文信息學報,1990.2:49-54
[6] 關白.信息處理用藏文分詞單位研究[J].中文信息學報,
2010.3:124-128
一是假冒國內(nèi)正規(guī)期刊的刊名、刊號和出版單位名稱,尤其是名社、名刊;有部分假冒期刊是以“增刊”、“合訂本”的名義出現(xiàn)的。
二是國內(nèi)某些正規(guī)期刊社未經(jīng)批準擅自編印所謂“論文集”,以“宣傳推廣本刊為名”,故意將本刊社名和刊號混排其中,給讀者造成錯覺。
三是署名香港“某某出版公司”出版,或與某單位聯(lián)合主辦,編造所謂的“國內(nèi)統(tǒng)一刊號”如“CNxx-yyyy(HK)或“CN(HK)xx-yyyy”等擴大“知名度”(香港根本沒有新聞出版署,只有一個康樂處書刊注冊組,從來沒有資格頒發(fā)國內(nèi)統(tǒng)一CN刊號,香港本身具有新聞出版自由),這些非法期刊常常虛張聲勢,在刊名上冠以“中華”"中國"字樣用來欺騙國內(nèi)急于想發(fā)論文評職稱的人。
四是署名“某某學會”、“某某研究會”主辦,無刊號或杜撰刊號,未署出版單位名稱或杜撰某某編輯部等。
五是僅有國際標準刊號,而無國內(nèi)任何部門批準發(fā)行的書刊編號或沒有國內(nèi)統(tǒng)一刊號。
六是偷梁換柱,將正規(guī)期刊的某些內(nèi)容替換成自己撰寫或收集的文章,仍以原刊的刊名、期號、裝幀重新制版印刷。
關鍵詞:駕駛輔助;立體視覺識別
中國分類號:TP391.41
1 駕駛輔助與立體視覺識別的背景與意義
交通部針對未來交通運輸發(fā)展提出明確的政策目標,包含“提供公眾優(yōu)質(zhì)的出行環(huán)境、提業(yè)健全的物流環(huán)境、提供社會良好的運輸環(huán)境”三大目標,再擬定后續(xù)的運輸政策發(fā)展主軸。為提升整體運輸系統(tǒng)效率與服務質(zhì)量,以解決日益嚴重的交通運輸問題,期望減少交通事故并改善運輸環(huán)境,世界各大先進國家在近年來,也紛紛投入更多資源促使運輸系統(tǒng)的改善,積極研究將通訊、信息、電子、控制、感測、機械等相關技術與產(chǎn)品,整合并應用于現(xiàn)有或規(guī)劃中的運輸系統(tǒng)。并從中創(chuàng)造新的營運、管理模式,開創(chuàng)新的運輸系統(tǒng)概念,此類結合新的科技或現(xiàn)有技術應用于交通運輸,即稱為智能交通系統(tǒng)。目標明確提出引進運輸科技的重要性,顯示公路運輸系統(tǒng)智能化的課題日趨重要,未來要能改善國內(nèi)交通系統(tǒng)的運輸環(huán)境與效率,智能交通系統(tǒng)正好扮演了重要角色。
隨著公路智慧化運輸?shù)臅r代來臨,智能車輛的概念日益普及,駕駛人針對車輛主動安全的功能訴求日益重要。然而目前行駛于公路的車輛,仍須仰賴駕駛人全程操作行進。盡管交通部不斷倡導公路交通安全的觀念,道路交通事故的肇事率仍然居高不下,顯示道路交通安全的改善成效已達到瓶頸。
根據(jù)交通部的統(tǒng)計信息指出,道路交通事故的肇事主因,以疲勞駕駛、酒醉駕駛、駕駛人分心、未注意四周路況等案例為大宗。此外,發(fā)現(xiàn)駕駛人隨時受內(nèi)在情緒與外在環(huán)境影響路況識別能力,難以每一分一秒都專注于留意四周路況,致使每一位駕駛人所留意的先后順序不一,容易遺漏關鍵路況信息,充分顯示道路交通安全仍有顯著的改善空間。
智能交通系統(tǒng),簡稱ITS(Intelligent Transportation System)是目前世界交通領域研究之前沿課題。它是在當代科學技術充分發(fā)展和進步的背景下產(chǎn)生的,旨在將先進的信息技術、數(shù)據(jù)通信技術、電子控制技術及計算機處理技術等綜合運用于地面交通管理體系,建立起一種大范圍、全方位發(fā)揮作用的,實時、準確、高效的交通管理系統(tǒng)。
將計算機視覺應用于智能交通系統(tǒng)是近幾年來的熱點之一。計算機視覺技術在ITS中的應用大致可分為兩類,即車載自動駕駛系統(tǒng)和路邊視頻監(jiān)視系統(tǒng)。在車載處理系統(tǒng)中,攝像機跟隨自主車輛運動,系統(tǒng)追蹤的目標為車道、前方車輛及障礙物、道路旁設立的各種交通標志或交通信號、司機的疲勞狀態(tài)等;在視頻監(jiān)視系統(tǒng)中,攝像機被安放在道邊或道路上方,為智能交通系統(tǒng)提供車輛位置、速度、類型等數(shù)據(jù)信息。
2 駕駛輔助與立體視覺識別的國內(nèi)外研究趨勢
視覺服務控制應用于輔助車輛駕駛的概念,近年首先起于美國,美國國防部(Defense Advanced Research Projects Agency,DARPA)先后在2004年、2005年與2007年舉辦無人駕駛競賽,報名參賽的團隊,分別由各大院校的碩博士研究生與指導教授所共同組成。參賽團隊接受的挑戰(zhàn),必須建立一套能在真實環(huán)境中,自動駕駛車輛的系統(tǒng)。且依照主辦者提供的路線行駛,使車輛能自主性地抵達指定目的地。美國DARPA國防部以尋求各大院校師生共同參與挑戰(zhàn)的方式,促使國防部在研發(fā)與科技領域能快速進展,可謂國防部尋求千里馬而展開的計劃。
根據(jù)完成全程行駛的各參賽車隊,所提供的系統(tǒng)研發(fā)報告中指出,車輛除了能自主性地朝向規(guī)劃路徑行駛,也能識別障礙、標線,在直線路段變換車道,并能在路口選定軌跡轉彎,以及后退停車等行為。歷經(jīng)三屆的無人駕駛競賽,由第三屆競賽中,前三名參賽車隊所顯示的研發(fā)成果可以發(fā)現(xiàn),除了對于美國DARPA國防部有卓越的貢獻,更成為未來實現(xiàn)無人化自動駕駛技術的標竿,亦促使車輛產(chǎn)業(yè)更進一步將旗艦車款的研發(fā)邁向視覺輔助車輛駕駛領域。
解析全球汽車產(chǎn)業(yè)的發(fā)展現(xiàn)況,發(fā)現(xiàn)國際各大主流汽車制造商,紛紛將研發(fā)焦點著眼于安全駕駛輔助系統(tǒng)的領域。顯示行車智能化控制系統(tǒng)與安全駕駛輔助系統(tǒng),已逐步成為汽車制造商開發(fā)未來車款并開創(chuàng)企業(yè)藍海市場而鎖定的目標。智能化車輛的安全駕駛輔助系統(tǒng),欲根據(jù)感測信號自行識別四周路況,根據(jù)目前發(fā)展現(xiàn)況,需要將聲納、雷達、雷射、衛(wèi)星定位與地圖、圖像處理等系統(tǒng)相互組合,以利于輔助識別路況。而本論文根據(jù)鎖定圖像處理,利用行車前方采集的圖像識別路面與車道標線,重現(xiàn)駕駛人識別行車前方路況的過程與視覺信息讀取行為,期望能節(jié)省其它類型系統(tǒng)采集路況信息的需求。
Gold System(Generic Obstacleand Lane Detection System)所采用的視覺識別方法,首先將行車前方路面視為完全平坦,并直接利用矩陣算法將圖像轉為上視圖。再憑借上視圖識別車道標線的幾何分布。此算法的基礎需建構在路面完全平坦的道路場景,一旦路面有垂直分量的微幅起伏變化,或動靜態(tài)障礙出現(xiàn)于道路場景中,將導致路面區(qū)域與車道標線的識別成效失真,并不適用于輔助立體視覺識別。
針對立體視覺識別的問題與研究現(xiàn)況深入探討,如何通過雙鏡頭圖像識別共同像素特征并獲得特征景深信息,將是立體視覺識別算法過程的主要瓶頸。探索當前的發(fā)展現(xiàn)況,立體視覺可應用的范圍已廣泛延伸至生活周遭各領域,但若要將圖像內(nèi)所有的特征進行立體視覺識別,一來將帶來繁雜卻不必要的額外算法數(shù)據(jù),二來過長的算法時間將難以達到實時化視覺識別與服務控制的系統(tǒng)要求。
清華大學顧瑜研究團隊已成功研究前方車道線與前車信息等偵測,并進一步將側邊盲點視野納入偵測范圍。此文獻針對行車前方的道路識別,鎖定車道標線的邊緣檢測,并以線性化的向量歸類其標線特征;本研究則在白天道路場景采用HSV色系識別車道標線的色澤,亦或在夜間道路場景以Sobel Filter的矩陣Sx識別車道標線邊緣特征。另外,此文獻所介紹的道路場景模式,將列為道路識別圖像處理應考慮的重要變因。
本論文識別路面與車道標線所選定的道路場景分配,根據(jù)交通部出版的《公路景觀設計規(guī)范》中,以常態(tài)的道路場景作為主要的圖像取景目標,并盡可能避免圖像取景范圍內(nèi)出現(xiàn)動態(tài)行人或車輛,以防止干擾圖像處理的成效。
3 就駕駛輔助與立體視覺識別的研究內(nèi)容
如果重現(xiàn)駕駛人識別行車前方路況的過程與視覺信息讀取行為,采取立體視覺圖像應用于識別行車前方道路場景的算法處理方法,模擬并重現(xiàn)駕駛人的視覺識別處理模式。因此,可以利用平行雙鏡頭采集行車前方的路況場景圖像,兩側圖像同步采集路面與車道標線等有效特征信息。并將采集后的有效特征進一步轉換為空間坐標信息,并分別在不同的氣候環(huán)境下,識別路面上的標記標線和前方的各類指示牌,輔助駕駛人強化前方路況的視覺識別。
所以從三個方面入手,首先介紹了系統(tǒng)的理論基礎,主要是特征識別和成像理論;其次通過對不同氣候場景模式的識別處理,分析和設計了行車途中對車輛前面的平行雙鏡頭對路面標線和指示牌的圖像識別;最后在實地行車途中采集圖像數(shù)據(jù)進行測試比較,并得出結果。通過本論文所提供的立體視覺圖像處理技術和算法推導流程,除了將提供輔助識別行車前方路況信息外,也將融入無人化自動駕駛系統(tǒng)的視覺服務控制中,不可或缺的探討領域,期望未來能進一步實現(xiàn)無人化自動駕駛的愿景。
參考文獻:
[1]吳莉婷,張宇,楊一平.深度圖像中基于輪廓曲線和局部區(qū)域特征的3維物體識別[J].中國圖象圖形學報,2012(02):486-489.
[2]張一鳴,秦世引.基于單目視覺的移動機器人測距方法[J].微計算機信息,2008(29):179-185.