前言:想要寫出一篇引人入勝的文章?我們特意為您整理了科技信息服務人工智能技術應用研究范文,希望能給你帶來靈感和參考,敬請閱讀。
互聯(lián)網(wǎng)為我們提供了取之不盡,用之不竭的公開信息資源寶庫,現(xiàn)代科技已廣泛應用于科技信息服務領域,其中人工智能技術使科技信息工作流程的計算化、智能化特征更為顯著,因此,利用人工智能技術助推科技信息事業(yè)的發(fā)展成為必然選擇。本文對大數(shù)據(jù)下科技信息領域需要解決的主要問題,人工智能技術應用于科技信息領域的研究的意義和主要研究內容進行了剖析和闡述,提出了相應的研究觀點和技術路線圖,提出基于人工智能技術的科技政策動態(tài)分析體系設計方案。并以科技信息的共享和利用為導向,開發(fā)和應用科技信息資源,實現(xiàn)數(shù)據(jù)信息價值的最大化,通過人工智能技術進行科技信息的深度領域數(shù)據(jù)分析服務,實現(xiàn)科技信息資源的前沿性研究是大數(shù)據(jù)下科技信息的人工智能技術應用的主要方向之一。大數(shù)據(jù)時代催生了海量數(shù)據(jù)的誕生,數(shù)據(jù)量的劇增一方面提供了更多信息來源,另一方面也給從更大量數(shù)據(jù)集中獲取有用信息制造了困擾。若要基于更全面客觀的數(shù)據(jù)獲得其準確的信息,大量的非結構化數(shù)據(jù)需要結構化處理,才更便于分析,需要更長的時間和更高的人力成本。此外,互聯(lián)網(wǎng)環(huán)境下的信息傳遞瞬間即達,對信息的即時性、保密性也提出了更高的要求。大數(shù)據(jù)時代的信息分析需求對傳統(tǒng)的信息分析方法提出了巨大的挑戰(zhàn)。伴隨公開和非公開的科技信息資源的日益增加,其數(shù)據(jù)已呈現(xiàn)和具備大數(shù)據(jù)的特點,傳統(tǒng)的科技信息搜集和處理方法不足以應付當前的數(shù)據(jù)現(xiàn)狀。面對大數(shù)據(jù)時代日益增長和積累的龐大數(shù)據(jù)集,以及科技信息本身具有的學術價值和技術先進性特質,使得面向科技信息領域的應用研究工作必須做出變革,即以科技信息的處理和分析為導向,旨在實現(xiàn)科技信息資源的有效組織、處理和分析,實現(xiàn)需求驅動的科技信息組織和分析方法的創(chuàng)新,為挖掘科技信息的前沿性研究服務。
大數(shù)據(jù)下科技信息領域需要解決的主要問題
(1)大數(shù)據(jù)下科技信息處理的標準化體系研究相比傳統(tǒng)的科技信息,大數(shù)據(jù)環(huán)境下的科技信息的來源、類型、內容和數(shù)據(jù)格式更為復雜,制定和完善科技信息的標準化體系和內容是及其必要的。信息資源的標準化體系是保證信息有效存儲、處理、分析和利用的基礎和前提。本文認為將依據(jù)當前科技信息現(xiàn)狀,針對具體領域研究和制定大數(shù)據(jù)下的科技信息處理規(guī)范和建議是必要的。(2)大數(shù)據(jù)下的科技信息資源的建設方法研究借助大數(shù)據(jù)技術可實現(xiàn)科技信息的大數(shù)據(jù)處理與大數(shù)據(jù)存儲,實現(xiàn)多源異構的科技信息完成數(shù)據(jù)的存儲、處理、交換等功能。大數(shù)據(jù)下的科技信息資源的建設方法研究需要從數(shù)據(jù)本身和數(shù)據(jù)的組織兩個研究視角出發(fā),分析梳理大數(shù)據(jù)環(huán)境下科技信息資源在建設中面臨的難點和關鍵性技術問題,研究和提出科技信息資源的知識組織系統(tǒng)框架和基本構建方法。(3)大數(shù)據(jù)下的科技信息資源的分析方法研究結合科技大數(shù)據(jù)特點,主要利用深度學習技術解決科技大數(shù)據(jù)的高維數(shù)據(jù)降維處理問題。研究和探索面向科技信息資源的分析方法,提出不同類型科技信息資源的關聯(lián)分析、重要性分析、主題演化路徑等深層次的信息分析方法和技術,通過系列分析方法和技術研發(fā),解決科技信息資源管理工作中存在的問題,研究方法在實踐中進行創(chuàng)新和發(fā)展。世界的發(fā)展、科技的換代、媒介的延伸以及人文的變更,匯聚成一股巨大的洪流,加速了我們所處時代的變換,人工智能技術已經(jīng)滲透到各個技術領域,以上問題涉及科技信息的組織和分析,需要人工智能技術的融合,即與人工智能技術的深度融合必將推動科技信息進入全新時代。
人工智能應用于科技信息領域的研究意義和主要研究內容
人工智能為解決科技信息的獲取和分析提供解決途徑(1)人工智能可拓展獲取科技信息的來源。從事智能分析的美國Stabilitas公司的首席運營官ChrisHurst認為:“人工智能可以擴大信息工作的范圍,不會遺漏那些有價值的細節(jié)?!笨萍夹畔⑼瑯有枰ㄟ^各種渠道獲取世界各國的同類信息,利用分布式網(wǎng)絡爬蟲等人工智能技術可獲取全世界的開源信息,包括文本和音視頻數(shù)據(jù)。(2)人工智能可加快處理科技信息數(shù)據(jù)的速度。美國中央信息局肯特學校教信息分析的校長JosephGartin認為:“梳理社交媒體來獲得信息并不是什么新鮮事,讓人耳目一新的是如今我們收集社交媒體數(shù)據(jù)的數(shù)量之大和速度之快?!焙A康目萍夹畔⑼ㄟ^人工智能技術可以快速處理億萬比特的數(shù)據(jù),從而了解世界各國同類信息或事件,將每天接收到的大量數(shù)據(jù)轉變?yōu)槟軌蛴糜谡吆蛻?zhàn)場行動的信息。(3)人工智能使科技信息的分析自動化、智能化。據(jù)俄羅斯通訊社報道,俄羅斯總統(tǒng)普京表示:“無論誰在這一領域中處于領先地位,都將成為世界的統(tǒng)治者。”普京認為:人工智能是未來權力的關鍵。利用自然語言處理技術、語音識別、圖像檢索等人工智能技術可以極大的提高信息人員檢索有用信息的速度。此外,知識圖譜作為人工智能的知識庫基礎,基于知識圖譜可實現(xiàn)分析對象的多維多步自動關聯(lián)分析,利用深度學習模型可大大提高多因素影響的系統(tǒng)分析,獲得更好的信息分析效果。主要研究內容(1)基于人工智能技術的科技信息的知識存儲和管理大數(shù)據(jù)下的科技信息具有海量、異構、跨媒體的特點,其知識存儲和管理需要對結構化或非結構化的跨模態(tài)數(shù)據(jù)進行語義智能化計算研究,以為統(tǒng)一語義范疇下的數(shù)據(jù)查詢提供便捷的元數(shù)據(jù)服務;對跨媒體知識統(tǒng)一組織進行研究,為不同關系結構,不同模態(tài)數(shù)據(jù)的統(tǒng)一存儲與管理提供結構基礎;同時,需要對跨媒體知識的更新進行研究,為動態(tài)的數(shù)據(jù)存儲與多變的業(yè)務管理提供支撐。最后,對跨媒體知識檢索與查詢進行研究,從實際的檢索和查詢業(yè)務角度出發(fā),制定規(guī)則,優(yōu)化性能,提升知識數(shù)據(jù)被獲取時的準確性與高效性。(2)基于人工智能技術的科技信息與知識的深度揭示與聚類加強科技信息資源的多源多模態(tài)數(shù)據(jù)整合關聯(lián)、信息抽取、不確定推理、機器學習、自然語言處理等人工智能技術研發(fā)與應用;利用人工智能技術實現(xiàn)科技信息資源的外在層面的資源整合,資源內在特征的深度聚合,實現(xiàn)科技信息與知識的深度揭示與聚類。通過可視化方式實現(xiàn)科技信息知識(研發(fā)技術、研發(fā)機構、研發(fā)人員等)的聚合、揭示與展示。其中重點利用語義分析技術、詞表/本體構建技術、知識圖譜技術、大數(shù)據(jù)分析等人工智能技術,通過可視化方式實現(xiàn)科技信息知識的聚合、揭示與展示;實現(xiàn)對格式各異、內容復雜的數(shù)字資源進行深層次的揭示,從資源外在層面的資源整合,深入到資源內在特征進行深度聚合,實現(xiàn)信息與知識的深度揭示與聚類,同時將科技信息知識服務嵌入知識交流之中。技術路線圖如圖1所示。(2)基于人工智能技術的科技信息前沿技術發(fā)現(xiàn)與預警研究前沿技術發(fā)現(xiàn)與預警旨在有效指導和開展科技研究,國內外已有研究在信息對象和研究方法上比較單一,信息價值和服務效果受限??萍夹畔⑶把丶夹g發(fā)現(xiàn)與預警研究應更強調面向信息源的全面收集、處理、分析的一定程度智能化生產過程,更好的感知非完備信息,輔助信息用戶把不確定性預測變成更確定性預測。研究將不同類型的信息源進行整合、融合,多維度的分析科技前沿技術特征,從不同角度實現(xiàn)有價值信息的綜合疊加和映射,從中發(fā)現(xiàn)、分析和描述科技前沿技術問題,為科技領域專家實現(xiàn)科技前沿的準確辨識提供服務,實現(xiàn)有效的技術預警。技術路線圖見圖2所示。
基于人工智能技術的科技政策動態(tài)分析平臺設計
科技政策動態(tài)分析脫離原有人工分析為主的模式,而借助技術手段進行輔助分析是時展的必然趨勢,海量數(shù)據(jù)的現(xiàn)實對情報分析方法的沖擊不可避免。技術參與的目的是提高人工分析的效率和質量,采用技術輔助手段是可以做到事半功倍的?;谌斯ぶ悄芗夹g的科技政策動態(tài)分析平臺的目的在于如何利用技術手段提供獲取情報數(shù)據(jù)、情報多維分析能力和自動生成可讀性的分析報告的能力,幫助提高人類思維的效率。1)科技政策動態(tài)信息監(jiān)測科技政策動態(tài)信息監(jiān)測主要采用網(wǎng)絡信息的監(jiān)測方式,只有在有效采集網(wǎng)絡信息的基礎上才能進而實現(xiàn)具體內容分析與信息服務。信息監(jiān)測是對互聯(lián)網(wǎng)上共享的科技政策資源進行提取、解析、收集和存儲等的過程??萍颊邉討B(tài)信息監(jiān)測的一般框架可由圖3表示??萍颊邉討B(tài)信息監(jiān)測系統(tǒng)的層次模型:表示層,業(yè)務邏輯層和數(shù)據(jù)訪問層。數(shù)據(jù)訪問層:連接數(shù)據(jù)庫,執(zhí)行插入和查詢等操作。主要是用數(shù)據(jù)集訪問。業(yè)務邏輯層:調用數(shù)據(jù)訪問層的方法然后返回結果給表示層。表示層:獲取表單的數(shù)據(jù),然后調用業(yè)務邏輯層的方法處理數(shù)據(jù),然后根據(jù)結果顯示相應的數(shù)據(jù)??萍颊邉討B(tài)信息監(jiān)測的系統(tǒng)框架:系統(tǒng)分為數(shù)據(jù)層與應用層兩個層次。其中,數(shù)據(jù)層為整個平臺提供數(shù)據(jù)支撐,包括監(jiān)測站點、情報、文章、等基礎信息數(shù)據(jù),以及用戶信息、日志信息等數(shù)據(jù)。應用層主要提供站點管理、信息服務、編輯撰文三大功能模塊,為用戶使用系統(tǒng)進行信息檢索、篩選、瀏覽、定制、撰文等提供服務,同時也為管理員進行系統(tǒng)管理、任務分配、成果組織等提供相應接口。具體系統(tǒng)框架如圖4所示。
結語
在大數(shù)據(jù)環(huán)境下,科技信息的處理和分析涉及的數(shù)據(jù)更加復雜化,人工智能給科技信息處理和分析帶來了機遇和挑戰(zhàn),有效利用最新的人工智能技術能更好的為科技信息建設服務。ChrisHurst認為:“人類的行為是數(shù)據(jù),而人工智能是數(shù)據(jù)模型。所以我們認為人工智能在處理這些數(shù)據(jù)方面能夠比人類做得更好?!北疚奶岢隽嘶谌斯ぶ悄芗夹g的科技政策動態(tài)分析平臺設計方案。并有以下幾方面未來工作的建議:(1)加強科技信息數(shù)據(jù)收集能力。充分利用爬蟲技術搜集開源情報,并研究存儲整合技術,為信息分析打下堅實的數(shù)據(jù)基礎;(2)加強多源多模態(tài)大數(shù)據(jù)整合關聯(lián)、信息抽取、不確定推理、機器學習、圖像識別、自然語言處理等人工智能技術研發(fā)與應用;(3)構建科技信息領域知識圖譜,加強信息分析、推理和挖掘的能力。
作者:于偉 王忠軍 單位:北方科技信息研究所