前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的挖掘技術(shù)論文主題范文,僅供參考,歡迎閱讀并收藏。
數(shù)據(jù)挖掘技術(shù)是一種新型的技術(shù),在現(xiàn)代數(shù)據(jù)存儲以及測量技術(shù)的迅猛發(fā)展過程中,人們可以進(jìn)行信息的大量測量并進(jìn)行存儲。但是,在大量的信息背后卻沒有一種有效的手段和技術(shù)進(jìn)行直觀的表達(dá)和分析。而數(shù)據(jù)挖掘技術(shù)的出現(xiàn),是對目前大數(shù)據(jù)時代的一種應(yīng)急手段,使得有關(guān)計算機(jī)數(shù)據(jù)處理技術(shù)得到加快發(fā)展。數(shù)據(jù)挖掘技術(shù)最早是從機(jī)器學(xué)習(xí)的概念中而產(chǎn)生的,在對機(jī)器的學(xué)習(xí)過程中,一般不采用歸納或者較少使用這種方法,這是一種非常機(jī)械的操作辦法。而沒有指導(dǎo)性學(xué)習(xí)的辦法一般不從這些環(huán)境得出反饋,而是通過沒有干預(yù)的情況下進(jìn)行歸納和學(xué)習(xí),并建立一種理論模型。數(shù)據(jù)挖掘技術(shù)是屬于例子歸納學(xué)習(xí)的一種方式,這種從例子中進(jìn)行歸納學(xué)習(xí)的方式是介于上述無指導(dǎo)性學(xué)習(xí)以及較少使用歸納學(xué)習(xí)這兩種方式之間的一種方式。因此,可以說,數(shù)據(jù)挖掘技術(shù)的特征在出自于機(jī)器學(xué)習(xí)的背景下,與其相比機(jī)器主要關(guān)心的是如何才能有效提高機(jī)器的學(xué)習(xí)能力,但數(shù)據(jù)挖掘技術(shù)主要關(guān)心如何才能找到有用、有價值的信息。其第二個特征是,與機(jī)器學(xué)習(xí)特點相比較而言,機(jī)器關(guān)心的是小數(shù)據(jù),而數(shù)據(jù)挖掘技術(shù)所面臨的對象則是現(xiàn)實中海量規(guī)模的數(shù)據(jù)庫,其作用主要是用來處理一些異?,F(xiàn)象,特別是處理殘缺的、有噪音以及維數(shù)很高的數(shù)據(jù)項,甚至是一些不同類型數(shù)據(jù)。以往的數(shù)據(jù)處理方法和現(xiàn)代的數(shù)據(jù)挖掘技術(shù)相比較而言,其不同點是以往的傳統(tǒng)數(shù)據(jù)處理方法前提是把理論作為一種指導(dǎo)數(shù)據(jù)來進(jìn)行處理,在現(xiàn)代數(shù)據(jù)挖掘技術(shù)的出發(fā)角度不同,主要運(yùn)用啟發(fā)式的歸納學(xué)習(xí)進(jìn)行理論以及假設(shè)來處理的。
2、數(shù)據(jù)挖掘技術(shù)主要步驟
數(shù)據(jù)挖掘技術(shù)首先要建立數(shù)據(jù)倉庫,要根據(jù)實際情況而定,在易出現(xiàn)問題的有關(guān)領(lǐng)域建立有效的數(shù)據(jù)庫。主要是用來把數(shù)據(jù)庫中的所有的存儲數(shù)據(jù)進(jìn)行分析,而目前的一些數(shù)據(jù)庫雖然可以進(jìn)行大量的存儲數(shù)據(jù),同時也進(jìn)行了一系列的技術(shù)發(fā)展。比如,系統(tǒng)中的在線分析處理,主要是為用戶查詢,但是卻沒有查詢結(jié)果的分析能力,而查詢的結(jié)果仍舊由人工進(jìn)行操作,依賴于對手工方式進(jìn)行數(shù)據(jù)測試并建模。其次,在數(shù)據(jù)庫中存儲的數(shù)據(jù)選一數(shù)據(jù)集,作為對數(shù)據(jù)挖掘算法原始輸入。此數(shù)據(jù)集所涉及到數(shù)據(jù)的時變性以及統(tǒng)一性等情況。然后,再進(jìn)行數(shù)據(jù)的預(yù)處理,在處理中主要對一些缺損數(shù)據(jù)進(jìn)行補(bǔ)齊,并消除噪聲,此外還應(yīng)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的處理。隨后,再對數(shù)據(jù)進(jìn)行降維和變換。如果數(shù)據(jù)的維數(shù)比較高,還應(yīng)找出維分量高的數(shù)據(jù),對高維數(shù)數(shù)據(jù)空間能夠容易轉(zhuǎn)化為檢點的低維數(shù)數(shù)據(jù)空間進(jìn)行處理。下一步驟就是確定任務(wù),要根據(jù)現(xiàn)實的需要,對數(shù)據(jù)挖掘目標(biāo)進(jìn)行確定,并建立預(yù)測性的模型、數(shù)據(jù)的摘要等。隨后再決定數(shù)據(jù)挖掘的算法,這一步驟中,主要是對當(dāng)前的數(shù)據(jù)類型選擇有效的處理方法,此過程非常重要,在所有數(shù)據(jù)挖掘技術(shù)中起到較大作用。隨后再對數(shù)據(jù)挖掘進(jìn)行具體的處理和結(jié)果檢驗,在處理過程中,要按照不同的目的,選擇不同的算法,是運(yùn)用決策樹還是分類等的算法,是運(yùn)用聚類算法還是使用回歸算法,都要認(rèn)真處理,得出科學(xué)的結(jié)論。在數(shù)據(jù)挖掘結(jié)果檢驗時,要注意幾個問題,要充分利用結(jié)論對照其他的信息進(jìn)行校核,可對圖表等一些直觀的信息和手段進(jìn)行輔助分析,使結(jié)論能夠更加科學(xué)合理。需要注意的是要根據(jù)用戶來決定結(jié)論有用的程度。最后一項步驟是把所得出的結(jié)論進(jìn)行應(yīng)用到實際,要對數(shù)據(jù)挖掘的結(jié)果進(jìn)行仔細(xì)的校驗,重點是解決好以前的觀點和看法有無差錯,使目前的結(jié)論和原先看法的矛盾有效解除。
3、數(shù)據(jù)挖掘技術(shù)的方法以及在電力營銷系統(tǒng)中的應(yīng)用和發(fā)展
數(shù)控挖掘技術(shù)得到了非常廣泛的應(yīng)用,按照技術(shù)本身的發(fā)展出現(xiàn)了較多方法。例如,建立預(yù)測性建模方法,也就是對歷史數(shù)據(jù)進(jìn)行分析并歸納總結(jié),從而建立成預(yù)測性模型。根據(jù)此模型以及當(dāng)前的其他數(shù)據(jù)進(jìn)行推斷相關(guān)聯(lián)的數(shù)據(jù)。如果推斷的對象屬于連續(xù)型的變量,那么此類的推斷問題可屬回歸問題。根據(jù)歷史數(shù)據(jù)來進(jìn)行分析和檢測,再做出科學(xué)的架設(shè)和推定。在常用的回歸算法以及非線性變換進(jìn)行有效的結(jié)合,能夠使許多問題得到解決。電力營銷系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用中關(guān)聯(lián)規(guī)則是最為關(guān)鍵的技術(shù)應(yīng)用之一。這種應(yīng)用可以有效地幫助決策人員進(jìn)行當(dāng)前有關(guān)數(shù)據(jù)以及歷史數(shù)據(jù)的規(guī)律分析,最后預(yù)測出未來情況。把關(guān)聯(lián)規(guī)則成功引入電力營銷分析,通過FP-Growth算法對電力營銷的有關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,從中得出各種電量銷售的影響因素以及外部因素、手電水平等的關(guān)聯(lián)信息,以便更好地為電力的市場營銷策略提供參謀和決策。對電力營銷系統(tǒng)的應(yīng)用中,時間序列挖掘以及序列挖掘非常經(jīng)典、系統(tǒng),是應(yīng)用最為廣泛的一種預(yù)測方法。這種方法的應(yīng)用中,對神經(jīng)網(wǎng)絡(luò)的研究非常之多。因此,在現(xiàn)實中應(yīng)用主要把時間序列挖掘以及神經(jīng)網(wǎng)絡(luò)兩者進(jìn)行有效地結(jié)合,然后再分析有關(guān)電力營銷數(shù)據(jù)。此外,有關(guān)專家還提出應(yīng)用一種時間窗的序列挖掘算法,這種方式可以進(jìn)行有效地報警處理,使電力系統(tǒng)中的故障能夠準(zhǔn)確的定位并診斷事故。此算法對電力系統(tǒng)的分析和挖掘能力的提高非常有效,還可判定電力系統(tǒng)的運(yùn)行是否穩(wěn)定,對錯誤模型的分析精度達(dá)到一定的精確度。
4、結(jié)語
關(guān)鍵字:數(shù)據(jù)挖掘金融數(shù)據(jù)
金融部門每天的業(yè)務(wù)都會產(chǎn)生大量數(shù)據(jù),利用目前的數(shù)據(jù)庫系統(tǒng)可以有效地實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段,導(dǎo)致了數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。與此同時,金融機(jī)構(gòu)的運(yùn)作必然存在金融風(fēng)險,風(fēng)險管理是每一個金融機(jī)構(gòu)的重要工作。利用數(shù)據(jù)挖掘技術(shù)不但可以從這海量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在其后的規(guī)律,而且可以很好地降低金融機(jī)構(gòu)存在的風(fēng)險。學(xué)習(xí)和應(yīng)用數(shù)扼挖掘技術(shù)對我國的金融機(jī)構(gòu)有重要意義。
一、數(shù)據(jù)挖掘概述
1.數(shù)據(jù)挖掘的定義對于數(shù)據(jù)挖掘,一種比較公認(rèn)的定義是W.J.Frawley,G.PiatetskShapiro等人提出的。數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識、這些知識是隱含的、事先未知的、潛在有用的信息,提取的知識表示為概念(Concepts),規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。這個定義把數(shù)據(jù)挖掘的對象定義為數(shù)據(jù)庫。
隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,其應(yīng)用領(lǐng)域也不斷拓廣。數(shù)據(jù)挖掘的對象已不再僅是數(shù)據(jù)庫,也可以是文件系統(tǒng),或組織在一起的數(shù)據(jù)集合,還可以是數(shù)據(jù)倉庫。與此同時,數(shù)據(jù)挖掘也有了越來越多不同的定義,但這些定義盡管表達(dá)方式不同,其本質(zhì)都是近似的,概括起來主要是從技術(shù)角度和商業(yè)角度給出數(shù)據(jù)挖掘的定義。
從技術(shù)角度看,數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的和有用的信息和知識的過程。它是一門廣義的交叉學(xué)科,涉及數(shù)據(jù)庫技術(shù)、人工智能、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計學(xué)、模式識別、知識庫系統(tǒng)、知識獲取、信息檢索、高性能計算和數(shù)據(jù)可視化等多學(xué)科領(lǐng)域且本身還在不斷發(fā)展。目前有許多富有挑戰(zhàn)的領(lǐng)域如文本數(shù)據(jù)挖掘、Web信息挖掘、空間數(shù)據(jù)挖掘等。
從商業(yè)角度看,數(shù)據(jù)挖掘是一種深層次的商業(yè)信息分析技術(shù)。它按照企業(yè)既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性并進(jìn)一步將其模型化,從而自動地提取出用以輔助商業(yè)決策的相關(guān)商業(yè)模式。
2.數(shù)據(jù)挖掘方法
數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)庫技術(shù)、統(tǒng)計技術(shù)和人工智能技術(shù)發(fā)展的產(chǎn)物。從使用的技術(shù)角度,主要的數(shù)據(jù)挖掘方法包括:
2.1決策樹方法:利用樹形結(jié)構(gòu)來表示決策集合,這些決策集合通過對數(shù)據(jù)集的分類產(chǎn)生規(guī)則。國際上最有影響和最早的決策樹方法是ID3方法,后來又發(fā)展了其它的決策樹方法。
2.2規(guī)則歸納方法:通過統(tǒng)計方法歸納,提取有價值的if-then規(guī)則。規(guī)則歸納技術(shù)在數(shù)據(jù)挖掘中被廣泛使用,其中以關(guān)聯(lián)規(guī)則挖掘的研究開展得較為積極和深入。
2.3神經(jīng)網(wǎng)絡(luò)方法:從結(jié)構(gòu)上模擬生物神經(jīng)網(wǎng)絡(luò),以模型和學(xué)習(xí)規(guī)則為基礎(chǔ),建立3種神經(jīng)網(wǎng)絡(luò)模型:前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)。這種方法通過訓(xùn)練來學(xué)習(xí)的非線性預(yù)測模型,可以完成分類、聚類和特征挖掘等多種數(shù)據(jù)挖掘任務(wù)。
2.4遺傳算法:模擬生物進(jìn)化過程的算法,由繁殖(選擇)、交叉(重組)、變異(突變)三個基本算子組成。為了應(yīng)用遺傳算法,需要將數(shù)據(jù)挖掘任務(wù)表達(dá)為一種搜索問題,從而發(fā)揮遺傳算法的優(yōu)化搜索能力。
2.5粗糙集(RoughSet)方法:Rough集理論是由波蘭數(shù)學(xué)家Pawlak在八十年代初提出的一種處理模糊和不精確性問題的新型數(shù)學(xué)工具。它特別適合于數(shù)據(jù)簡化,數(shù)據(jù)相關(guān)性的發(fā)現(xiàn),發(fā)現(xiàn)數(shù)據(jù)意義,發(fā)現(xiàn)數(shù)據(jù)的相似或差別,發(fā)現(xiàn)數(shù)據(jù)模式和數(shù)據(jù)的近似分類等,近年來已被成功地應(yīng)用在數(shù)據(jù)挖掘和知識發(fā)現(xiàn)研究領(lǐng)域中。
2.6K2最鄰近技術(shù):這種技術(shù)通過K個最相近的歷史記錄的組合來辨別新的記錄。這種技術(shù)可以作為聚類和偏差分析等挖掘任務(wù)。
2.7可視化技術(shù):將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢等以直觀的圖形方式表示,決策者可以通過可視化技術(shù)交互地分析數(shù)據(jù)關(guān)系??梢暬瘮?shù)據(jù)分析技術(shù)拓寬了傳統(tǒng)的圖表功能,使用戶對數(shù)據(jù)的剖析更清楚。
二、數(shù)據(jù)挖掘在金融行業(yè)中的應(yīng)用數(shù)據(jù)挖掘已經(jīng)被廣泛應(yīng)用于銀行和商業(yè)中,有以下的典型應(yīng)用:
1.對目標(biāo)市場(targetedmarketing)客戶的分類與聚類。例如,可以將具有相同儲蓄和貨款償還行為的客戶分為一組。有效的聚類和協(xié)同過濾(collaborativefiltering)方法有助于識別客戶組,以及推動目標(biāo)市場。
2..客戶價值分析。
在客戶價值分析之前一般先使用客戶分類,在實施分類之后根據(jù)“二八原則”,找出重點客戶,即對給銀行創(chuàng)造了80%價值的20%客戶實施最優(yōu)質(zhì)的服務(wù)。重點客戶的發(fā)現(xiàn)通常采用一系列數(shù)據(jù)處理、轉(zhuǎn)換過程、AI人工智能等數(shù)據(jù)挖掘技術(shù)來實現(xiàn)。通過分析客戶對金融產(chǎn)品的應(yīng)用頻率、持續(xù)性等指標(biāo)來判別客戶的忠誠度;通過對交易數(shù)據(jù)的詳細(xì)分析來鑒別哪些是銀行希望保持的客戶;通過挖掘找到流失的客戶的共同特征,就可以在那些具有相似特征的客戶還未流失之前進(jìn)行針對性的彌補(bǔ)。
3.客戶行為分析。
找到重點客戶之后,可對其進(jìn)行客戶行為分析,發(fā)現(xiàn)客戶的行為偏好,為客戶貼身定制特色服務(wù)??蛻粜袨榉治鲇址譃檎w行為分析和群體行為分析。整體行為分析用來發(fā)現(xiàn)企業(yè)現(xiàn)有客戶的行為規(guī)律。同時,通過對不同客戶群組之間的交叉挖掘分析,可以發(fā)現(xiàn)客戶群體間的變化規(guī)律,并可通過數(shù)據(jù)倉庫的數(shù)據(jù)清潔與集中過程,將客戶對市場的反饋自動輸人到數(shù)據(jù)倉庫中。通過對客戶的理解和客戶行為規(guī)律的發(fā)現(xiàn),企業(yè)可以制定相應(yīng)的市場策略。
4.為多維數(shù)據(jù)分析和數(shù)據(jù)挖掘設(shè)計和構(gòu)造數(shù)據(jù)倉庫。例如,人們可能希望按月、按地區(qū)、按部門、以及按其他因素查看負(fù)債和收入的變化情況,同時希望能提供諸如最大、最小、總和、平均和其他等統(tǒng)計信息。數(shù)據(jù)倉庫、數(shù)據(jù)立方體、多特征和發(fā)現(xiàn)驅(qū)動數(shù)據(jù)立方體,特征和比較分析,以及孤立點分析等,都會在金融數(shù)據(jù)分析和挖掘中發(fā)揮重要作用。
5.貨款償還預(yù)測和客戶信用政策分析。有很多因素會對貨款償還效能和客戶信用等級計算產(chǎn)生不同程度的影響。數(shù)據(jù)挖掘的方法,如特征選擇和屬性相關(guān)性計算,有助于識別重要的因素,別除非相關(guān)因素。例如,與貨款償還風(fēng)險相關(guān)的因素包括貨款率、資款期限、負(fù)債率、償還與收入(payment——to——income)比率、客戶收入水平、受教育程度、居住地區(qū)、信用歷史,等等。而其中償還與收入比率是主導(dǎo)因素,受教育水平和負(fù)債率則不是。銀行可以據(jù)此調(diào)整貨款發(fā)放政策,以便將貨款發(fā)放給那些以前曾被拒絕,但根據(jù)關(guān)鍵因素分析,其基本信息顯示是相對低風(fēng)險的申請。
6.業(yè)務(wù)關(guān)聯(lián)分析。通過關(guān)聯(lián)分析可找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng),銀行存儲了大量的客戶交易信息,可對客戶的收人水平、消費習(xí)慣、購買物種等指標(biāo)進(jìn)行挖掘分析,找出客戶的潛在需求;通過挖掘?qū)蛻粜畔?,銀行可以作為廠商和消費者之間的中介,與廠商聯(lián)手,在掌握消費者需求的基礎(chǔ)上,發(fā)展中間業(yè)務(wù),更好地為客戶服務(wù)。
7.洗黑錢和其他金融犯罪的偵破。要偵破洗黑錢和其他金融犯罪,重要的一點是要把多個數(shù)據(jù)庫的信息集成起來,然后采用多種數(shù)據(jù)分析工具找出異常模式,如在某段時間內(nèi),通過某一組人發(fā)生大量現(xiàn)金流量等,再運(yùn)用數(shù)據(jù)可視化工具、分類工具、聯(lián)接工具、孤立點分析工具、序列模式分析工具等,發(fā)現(xiàn)可疑線索,做出進(jìn)一步的處理。
數(shù)據(jù)挖掘技術(shù)可以用來發(fā)現(xiàn)數(shù)據(jù)庫中對象演變特征或?qū)ο笞兓厔?,這些信息對于決策或規(guī)劃是有用的,金融
行業(yè)數(shù)據(jù)的挖掘有助于根據(jù)顧客的流量安排工作人員??梢酝诰蚬善苯灰讛?shù)據(jù),發(fā)現(xiàn)可能幫助你制定投資策略的趨勢數(shù)據(jù)。挖掘給企業(yè)帶來的潛在的投資回報幾乎是無止境的。當(dāng)然,數(shù)據(jù)挖掘中得到的模式必須要在現(xiàn)實生活中進(jìn)行驗證。
參考文獻(xiàn):
丁秋林,力士奇.客戶關(guān)系管理.第1版.北京:清華人學(xué)出版社,2002
張玉春.數(shù)據(jù)挖掘在金融分析中的應(yīng)用.華南金融電腦.2004
關(guān)鍵詞:傳統(tǒng)裝飾藝術(shù);視覺傳達(dá)設(shè)計;民族文化
傳統(tǒng)裝飾藝術(shù)源于生活,源于傳統(tǒng),有著悠久的歷史和深厚的民族底蘊(yùn),是與人們生活息息相關(guān)的一種藝術(shù)形態(tài)。早期工藝美術(shù)作品中的圖案就已經(jīng)具備了強(qiáng)烈的裝飾意味,隨著人們精神需求和審美意識的不斷提高,傳統(tǒng)裝飾藝術(shù)更是成為了人們生活的一部分。作為一門獨立的藝術(shù)形式,傳統(tǒng)裝飾藝術(shù)以其獨特的視覺符號和深厚的文化內(nèi)涵,重新引起了設(shè)計界的關(guān)注。特別是視覺傳達(dá)設(shè)計,這門通過獨特的視覺傳播方式達(dá)到傳達(dá)信息,并且與受眾交流、溝通的目的的藝術(shù)學(xué)科,不僅要吸取和弘揚(yáng)傳統(tǒng)裝飾藝術(shù)中的民族文化,更要挖掘傳統(tǒng)裝飾藝術(shù)中對現(xiàn)代設(shè)計有借鑒價值的東西。
追溯傳統(tǒng)裝飾藝術(shù)發(fā)展的淵源,它首先是人們?yōu)榱松娑M(jìn)行的造物的主觀創(chuàng)造性活動,到后來為了審美需求而進(jìn)行裝飾創(chuàng)作,這是一個漫長的歷史過程。在人類發(fā)展史上的各個時期,傳統(tǒng)裝飾藝術(shù)作品往往成為見證該時期文化、工藝和藝術(shù)水平的代表。并且,傳統(tǒng)裝飾藝術(shù)作品不論其形式如何,都融入了原始先民為生存而激發(fā)的全部感情,都體現(xiàn)出了生命的本能、生活的理想和原始文化的底蘊(yùn)。[1]它不是純藝術(shù)現(xiàn)象,但經(jīng)過幾千年的積淀與傳承,傳統(tǒng)裝飾藝術(shù)在意識形態(tài)的轉(zhuǎn)變和新技術(shù)浪潮的沖擊下不斷更新拓展,具有了自己鮮明的藝術(shù)特征,反映了民族文化的精髓。
在設(shè)計語言日趨國際化的今天,視覺傳達(dá)設(shè)計由于本身所具有的對圖形、文字等元素的高度概括和簡約化特征而面臨著設(shè)計風(fēng)格一體化的尷尬趨勢,這就對現(xiàn)代設(shè)計家提出了更高的要求。由于不同的國家和民族有著不同的傳統(tǒng),其人文風(fēng)俗和文化底蘊(yùn)也大不相同,所以,設(shè)計家們驚訝地發(fā)現(xiàn),民族的東西是一種很好地區(qū)別于其它地域作品的設(shè)計語言。于是,一股回歸傳統(tǒng),弘揚(yáng)民族文化的設(shè)計思想席卷了整個設(shè)計界。不同國度和區(qū)域的設(shè)計家都在尋找最能反映其民族精神和文化底蘊(yùn)的設(shè)計符號。作為有幾千年文化積淀和傳承并反映民族文化精髓的傳統(tǒng)裝飾藝術(shù),它重新引起設(shè)計界的關(guān)注,并成為設(shè)計家們創(chuàng)作的靈感來源,也就不足為奇了。
首先,在對形的處理上,傳統(tǒng)裝飾藝術(shù)遵循“刪繁就簡”、“以簡代繁”的原則,也就是用簡潔的線條和規(guī)整的外形來表現(xiàn)各種自然形象。如興起于我國民間的皮影戲和剪紙,其造型多采用簡潔單純的線面,著重表現(xiàn)自然物象的基本特征,它把一些立體的東西作概括化和平面化處理,具有視覺傳達(dá)設(shè)計的意味。出土于西安半坡村仰韶文化時期的人面魚紋彩陶盆就采用了幾何圖形的構(gòu)成手法,將人面概括成圓形,頭上的發(fā)髻和人面兩側(cè)耳部的小魚都用三角形表示,眼睛瞇成一條線,這種抽象化和幾何化就是“刪繁就簡”的具體體現(xiàn)。在視覺傳達(dá)設(shè)計中,提倡用最簡潔的圖形語言傳達(dá)最豐富的思想內(nèi)涵,其實也就是強(qiáng)調(diào)對圖形的高度概括、提煉和簡化,而西方更是注重幾何和抽象的圖形表達(dá)。這些現(xiàn)代設(shè)計理念,與傳統(tǒng)裝飾藝術(shù)中對形的處理觀念是基本一致的,并且在幾千年前就已經(jīng)開始運(yùn)用了。另外,傳統(tǒng)裝飾藝術(shù)由于有漆畫、陶瓷、蠟染、刺繡、剪紙等多種藝術(shù)形式,其內(nèi)容比較豐富,處理“形”的手法也就各具特色。所以,傳統(tǒng)裝飾藝術(shù)中對“形”的處理手法,很多都是值得我們視覺傳達(dá)設(shè)計學(xué)習(xí)和借鑒的。其次,傳統(tǒng)裝飾藝術(shù)很注重形式美感,這種形式美感包括造型的獨特性、排列的秩序感,畫面空間的設(shè)計感和點、線、面等形式要素的組合關(guān)系。傳統(tǒng)裝飾藝術(shù)中,很多造型藝術(shù)本身具有很強(qiáng)的形式美,已經(jīng)很講究對稱、均衡、比例、線條、色彩等帶給人的審美情感。如陶器的造型就很講究對稱和均衡,上面的裝飾紋樣不僅很注重線條和塊面的對比,色彩的搭配也很和諧。并且,還有很多由于機(jī)械有節(jié)奏的運(yùn)動和通過重復(fù)的構(gòu)成手法而創(chuàng)造的圖案,具有強(qiáng)烈的秩序美。[2]在敦煌壁畫中,隨處可見用于裝飾的各種卷草紋樣和適合圖案,尤其是藻井的裝飾,紋樣之豐富,裝飾之繁瑣可謂嘆為觀止,然而經(jīng)過藝術(shù)家的合理安排,整個畫面顯得井井有條。二方連續(xù)在不斷重復(fù)的過程中呈現(xiàn)出強(qiáng)烈的節(jié)奏感和秩序感,適合紋樣處處彰顯藝術(shù)家對畫面空間的把控,各種視覺元素遙相呼應(yīng),虛實相生,并且畫面中點、線、面關(guān)系處理到位,整體視覺效果統(tǒng)一??梢?,傳統(tǒng)裝飾藝術(shù)中對形式美感的追求,就如同我們進(jìn)行視覺傳達(dá)設(shè)計時所考慮的畫面構(gòu)圖和版式編排,目的都是為了形成強(qiáng)烈的視覺美感,從而喚起人們審美心理的愉悅。所以,傳統(tǒng)裝飾藝術(shù)中對形式美感的追求為我們視覺傳達(dá)設(shè)計中的版式編排提供了參考的樣本,具有較高的藝術(shù)價值。
再次,傳統(tǒng)裝飾藝術(shù)中的紋樣往往具有象征意義,如盤子上的暗八仙,象征延年益壽;瓷器上的蓮花寓意高潔;民間工藝美術(shù)里的葡萄、石榴以及百子圖等象征家族繁榮,子孫眾多;還有用龍鳳表示吉祥如意,用蝙蝠直接表現(xiàn)“福在眼前”等等。[3]傳統(tǒng)裝飾藝術(shù)中的這種象征性與現(xiàn)代設(shè)計有異曲同工之處,如視覺傳達(dá)設(shè)計中的標(biāo)識設(shè)計就常采用象征圖形來傳達(dá)企業(yè)文化、發(fā)展方向或者管理理念等,海報設(shè)計中也常用具有一定象征意味的圖形傳達(dá)深刻的思想主題和文化內(nèi)涵。傳統(tǒng)裝飾藝術(shù)所具有的博大精深的寓意性,對現(xiàn)代視覺傳達(dá)設(shè)計來講,具有重大意義。一方面,它為我們的設(shè)計提供了眾多素材,豐富了我們的設(shè)計語言;另一方面,它為我們的設(shè)計提供了很多思考的切入點,對設(shè)計創(chuàng)意具有較強(qiáng)的指導(dǎo)意義;另外,它使我們在面對不同文化背景進(jìn)行有針對性的設(shè)計時,能準(zhǔn)確找到傳達(dá)設(shè)計意圖的最佳圖形符號。所以,傳統(tǒng)裝飾藝術(shù)中的象征性是很值得我們關(guān)注的。
另外,傳統(tǒng)裝飾藝術(shù)在造型上采用的夸張和變形,在構(gòu)圖上采用的重復(fù)、發(fā)射、漸變以及色彩的對比與調(diào)和等處理手法,與今天現(xiàn)代設(shè)計中的圖形語言和形式美的法則以及構(gòu)成有異曲同工之妙,可見,中國傳統(tǒng)裝飾藝術(shù)對現(xiàn)代視覺傳達(dá)設(shè)計來講,意義十分重大。
正是因為傳統(tǒng)裝飾藝術(shù)有如此多的地方與現(xiàn)代視覺傳達(dá)設(shè)計保持一致性,才在現(xiàn)代社會顯示出了其特有的生命力。所以我們在設(shè)計中運(yùn)用傳統(tǒng)裝飾藝術(shù)宣揚(yáng)民族文化,弘揚(yáng)民族精神的同時,更要不斷挖掘傳統(tǒng)裝飾藝術(shù)對現(xiàn)代視覺傳達(dá)設(shè)計有借鑒價值的東西。在設(shè)計中追求東西方文化的統(tǒng)一,追求傳統(tǒng)與現(xiàn)代的統(tǒng)一,才能夠在設(shè)計中既表現(xiàn)出民族的傳統(tǒng)精粹,又使自己的作品更具說服力。
參考資料:
[1]伍毅志.傳統(tǒng)裝飾藝術(shù)在現(xiàn)代社會的價值[OL].中國裝飾藝術(shù)網(wǎng)./Theoretical/ShowArticle.asp.ArticleID=772
文獻(xiàn)標(biāo)識碼:A 文章編號:1673-7717(2007)12-2480-02
1.形神一體觀的理論內(nèi)涵
形神一體觀是中醫(yī)學(xué)基礎(chǔ)理論之一,形神學(xué)說肇始于《內(nèi)經(jīng)》,形與神是人體生命現(xiàn)象中最基本的現(xiàn)象,二者的關(guān)系是生命現(xiàn)象中最基本的關(guān)系。
1.1形的含義形的本義有二,一為形體、形質(zhì)。如《易?系辭上》說:“在天成象,在地成形,變化見矣。”二指形狀、形貌。如《國語?越語》:“天有還形”?!盾髯?非相》:“故相形不如論心,論心不如擇術(shù)?!敝嗅t(yī)學(xué)所稱的形,即是指視之可見、觸之可及之臟腑經(jīng)絡(luò)組織、五官九竅、四肢百骸等有形軀體,以及循行于臟腑之內(nèi)的精微物質(zhì),此外還指有形物質(zhì)資生助養(yǎng)下正常的臟腑經(jīng)絡(luò)組織功能活動。
1.2神的含義神之本義,系指主宰天地自然變化的自然界本身所固有的客觀規(guī)律。中醫(yī)學(xué)在充分保留其有關(guān)自然界變化莫測規(guī)律為神明的同時,還引申出神主宰人體生命活動,反應(yīng)生命活動規(guī)律的生理外在表現(xiàn)以及精神意識思維等內(nèi)涵進(jìn)行了闡發(fā),從而進(jìn)一步豐富了形神理論。中醫(yī)學(xué)理論中,神的概念很廣泛,其含義有三:一是指自然界物質(zhì)變化功能。如荀子說:“萬物各得其和以生,各得其養(yǎng)以成,不見其事,而見其功,夫是謂之神?!?《荀子?天論》)天地的變化而生成萬物,這種現(xiàn)象是神的表現(xiàn),有天地之形,然后有神的變化。二是指人體生命的一切活動。中醫(yī)學(xué)認(rèn)為人體本身就是一個陰陽對立統(tǒng)一體,陰陽之氣的運(yùn)動變化,推動了生命的運(yùn)動和變化,而生命活動的本身也稱之神。神去則氣化停止,生命也就完結(jié)??梢?,神是人體生命的根本,因此,只有積精全神氣才能“精神內(nèi)守,病安從來”。三是指人的精神意識,精神活動的高級形式是思維。
1.3形與神的關(guān)系 形與神的關(guān)系主要體現(xiàn)形為神之質(zhì)和神為形之主這兩方面。神的物質(zhì)基礎(chǔ)是氣血,氣血又是構(gòu)成形體的基本物質(zhì),而人體臟腑組織的功能活動,以及氣血的營行,又必須受神的主宰。這種“形與神”二者相互依附而不可分割的關(guān)系,稱之謂“形與神俱”。形乃神之宅,神乃形之主。無神則形不可活,無形則神無以附,二者相輔相成,不可分離。形神統(tǒng)一是生命存在的根本保證。中醫(yī)學(xué)理論中的形神一體觀,是養(yǎng)生防病,延年益壽,以及診斷治療的重要理論基礎(chǔ)。
神是機(jī)體生命活動的體現(xiàn),神不能離開人體而獨立存在,有形才能有神,形健則神旺,形衰則神憊。故《素問?上古天真論》有“形神合一”及“形與神俱”的理論,說明形與神的關(guān)系。經(jīng)過無數(shù)實踐證明,神的盛衰的確是健康與否的重要標(biāo)志之一。反過來看,如形贏色敗,雖然兩目有神亦是假象。
2.文本挖掘的概念
文本挖掘是指利用數(shù)據(jù)挖掘技術(shù),從大量的、無結(jié)構(gòu)的文本信息中發(fā)現(xiàn)潛在的、可能的數(shù)據(jù)模式、內(nèi)在聯(lián)系、規(guī)律、發(fā)展趨勢等,抽取有效、新穎、可用、可理解的、散布在文本文件中的有價值知識,并且利用這些知識更好地組織信息的過程。文本挖掘是從數(shù)據(jù)挖掘中發(fā)展來的,是信息挖掘的一個研究分支,用于基于文本信息的知識發(fā)現(xiàn)。它是利用智能算法,如神經(jīng)網(wǎng)絡(luò)、基于案例的推理、可能性推理等,并結(jié)合文字處理技術(shù),分析大量的非結(jié)構(gòu)化文本源抽取或標(biāo)記關(guān)鍵字概念、文字間的關(guān)系,并按照內(nèi)容對文檔進(jìn)行分類,獲取有用的知識和信息。
文本挖掘是一項綜合技術(shù),涉及數(shù)據(jù)挖掘技術(shù)、自然語言處理、計算語言學(xué)、信息檢索及分類、知識管理等多個領(lǐng)域。它主要處理半結(jié)構(gòu)化、無結(jié)構(gòu)化和字符型數(shù)據(jù),將數(shù)據(jù)挖掘技術(shù)與信息檢索技術(shù)相結(jié)合,開闊了數(shù)據(jù)挖掘劫的應(yīng)用領(lǐng)域,其特點是能夠更加有效地對文本數(shù)據(jù)(例如web頁面)進(jìn)行分析,從而彌補(bǔ)信息檢索技術(shù)的缺陷與不足。
3.文本挖掘的處理過程
文本挖掘是從數(shù)據(jù)挖掘發(fā)展而來的,但并不意味著將數(shù)據(jù)挖掘技術(shù)簡單應(yīng)用到文本集合上就可以實現(xiàn)文本挖掘。文本挖掘有兩個最基本的過程:文本檢索與智能分析。為了使最終用戶對結(jié)果有很好的理解和實用,通常還要列結(jié)果進(jìn)行集成和可視化。因此,實際中的文本挖掘就包合了3個過程,其基本模型見圖1。
這一處理過程實際上就是先對文本進(jìn)行處理。抽取出代表其特征的數(shù)據(jù),這些特征可以用結(jié)構(gòu)化的形式保存,作為文檔的中間表示形式,其目的在于從文本中掃描并抽取所需要的事實。由于該文檔特征向量的維數(shù)非常大,所以還需要對特征集進(jìn)行縮減??s減完以后便可利用機(jī)器學(xué)習(xí)的各種方法來提取面向特定應(yīng)用目的的知識模式進(jìn)行分類或聚類操作。對所得的知識模型進(jìn)行質(zhì)量評價,若評價的結(jié)果滿足一定的要求則保存該知識模型,若不滿足則進(jìn)行新一輪的挖掘工作。
4.文本挖掘在形神一體觀中的應(yīng)用
形神有著很緊密的聯(lián)系,在臨床實踐過程中,有指導(dǎo)臨床實踐的作用,因此在臨床實踐中運(yùn)用好形神一體觀的理論能很好地提高臨床療效。然而,在實際的臨床運(yùn)用中,有一部分能反應(yīng)形神一體的臨床指標(biāo)如面色、眼神、睡眠等常被我們臨床醫(yī)生所忽略。如何獲得這些指標(biāo),以便更好地指導(dǎo)臨床的辨證施治,這是本課題聽要解決的問題之一。由于中醫(yī)學(xué)語言是一種次語言,基于次語言的語言處理技術(shù)能對中醫(yī)文本進(jìn)行相當(dāng)深度的理解式分析和知識抽取,本課題將文本挖掘技術(shù)引入希望能在大量的中醫(yī)文獻(xiàn)中,篩選出在臨床實踐中被我們忽略掉而能反應(yīng)形神一體觀的臨床指標(biāo)。
統(tǒng)計學(xué)論文2000字(一):影響民族院校統(tǒng)計學(xué)專業(yè)回歸分析成績因素的研究論文
摘要:學(xué)習(xí)成績是評價學(xué)生素質(zhì)的重要方面,也是教師檢驗教學(xué)能力、反思教學(xué)成果的重要標(biāo)準(zhǔn)。利用大連民族大學(xué)統(tǒng)計學(xué)專業(yè)本科生有關(guān)數(shù)據(jù)(專業(yè)基礎(chǔ)課成績、平時成績和回歸分析期末成績),建立多元線性回歸模型,對影響回歸分析期末成績的因素進(jìn)行深入研究,其結(jié)果對今后的教學(xué)方法改進(jìn)和教學(xué)質(zhì)量提高具有十分重要的指導(dǎo)意義。
關(guān)鍵詞:多元線性回歸;專業(yè)基礎(chǔ)課成績;平時成績;期末成績
為了實現(xiàn)教學(xué)目標(biāo),提高教學(xué)質(zhì)量,有效提高學(xué)生學(xué)習(xí)成績是很有必要的。我們知道專業(yè)基礎(chǔ)課成績必定影響專業(yè)課成績,而且平時成績也會影響專業(yè)課成績,這兩類成績與專業(yè)課成績基本上是呈正相關(guān)的,但它們之間的關(guān)系密切程度有多大?它們之間又存在怎樣的內(nèi)在聯(lián)系呢?就這些問題,本文主要選取了2016級統(tǒng)計專業(yè)50名學(xué)生的四門專業(yè)基礎(chǔ)課成績以及回歸分析的平時成績和期末成績,運(yùn)用SPSS統(tǒng)計軟件進(jìn)行分析研究,尋求回歸分析期末成績影響因素的變化規(guī)律,擬合出關(guān)系式,從而為強(qiáng)化學(xué)生的后續(xù)學(xué)習(xí)和提高老師的教學(xué)質(zhì)量提供了有利依據(jù)。
一、數(shù)據(jù)選取
回歸分析是統(tǒng)計專業(yè)必修課,也是統(tǒng)計學(xué)中的一個非常重要的分支,它在自然科學(xué)、管理科學(xué)和社會、經(jīng)濟(jì)等領(lǐng)域應(yīng)用十分廣泛。因此研究影響統(tǒng)計學(xué)專業(yè)回歸分析成績的相關(guān)性是十分重要的。
選取了統(tǒng)計專業(yè)50名學(xué)生的專業(yè)基礎(chǔ)課成績(包括數(shù)學(xué)分析、高等代數(shù)、解析幾何和概率論)、回歸分析的平時成績和期末成績,結(jié)合多元線性回歸的基礎(chǔ)理論知識[1-2],建立多元回歸方程,進(jìn)行深入研究,可以直觀、高效、科學(xué)地分析各種因素對回歸分析期末成績造成的影響。
二、建立多元線性回歸模型1及數(shù)據(jù)分析
運(yùn)用SPSS統(tǒng)計軟件對回歸分析期末成績的影響因素進(jìn)行研究,可以得到準(zhǔn)確、科學(xué)合理的數(shù)據(jù)結(jié)果,全面分析評價學(xué)生考試成績,對教師以后的教學(xué)工作和學(xué)生的學(xué)習(xí)會有較大幫助。自變量x1表示數(shù)學(xué)分析成績,x2表示高等代數(shù)成績,x3表示解析幾何成績,x4表示概率論成績,x5表示平時成績;因變量y1表示回歸分析期末成績,根據(jù)經(jīng)驗可知因變量y1和自變量xi,i=1,2,3,4,5之間大致成線性關(guān)系,可建立線性回歸模型:
(1)
線性回歸模型通常滿足以下幾個基本假設(shè),
1.隨機(jī)誤差項具有零均值和等方差,即
(2)
這個假定通常稱為高斯-馬爾柯夫條件。
2.正態(tài)分布假定條件
由多元正態(tài)分布的性質(zhì)和上述假定可知,隨機(jī)變量y1服從n維正態(tài)分布。
從表1描述性統(tǒng)計表中可看到各變量的平均值1=79.68,2=74.66,3=77.22,4=78.10,5=81.04,1=75.48;xi的標(biāo)準(zhǔn)差分別為10.847,11.531,8.929,9.018,9.221,y1的標(biāo)準(zhǔn)差為8.141;有效樣本量n=50。
回歸分析期末成績y1的多元回歸模型1為:
y1=-5.254+0.221x1-0.4x2+0.154x3
+0.334x4+0.347x5
從表2中可以看到各變量的|t|值,在給定顯著水平?琢=0.05的情況下,通過t分布表可以查出,自由度為44的臨界值t?琢/2(44)=2.015,由于高等代數(shù)x2的|t|值為0.651小于t?琢/2(44),因此x2對y1的影響不顯著,其他自變量對y1都是線性顯著的。下面利用后退法[3]剔除自變量x2。
三、后退法建立多元線性回歸模型2及數(shù)據(jù)分析
從模型1中剔除了x2變量,多元回歸模型2為:
y1=-5.459+0.204x1+0.149x3+0.377x4+0.293x5(5)
在表4中,F(xiàn)統(tǒng)計量為90.326,在給定顯著水平?琢=0.05的情況下,查F分布表可得,自由度為p=4和n-p-1=45的臨界值F0.05(4,45)=2.579,所以F>F0.05(4,45),在表5中,所有自變量的|t|值都大于t?琢/2(45)=2.014,因此,多元回歸模型2的線性關(guān)系是顯著的。
四、結(jié)束語
通過對上述模型進(jìn)行分析,即各個自變量對因變量的邊際影響,可以得到以下結(jié)論:在保持其他條件不變的情況下,當(dāng)數(shù)學(xué)分析成績提高一分,則回歸分析成績可提高0.242分[4-5];同理,當(dāng)解析幾何成績、概率論成績和平時成績每提高一分,則回歸分析成績分別提高0.149分、0.377分和0.293分。
通過對學(xué)生專業(yè)基礎(chǔ)課成績、平時成績與回歸分析期末成績之間相關(guān)關(guān)系的研究,一方面有利于教師把控回歸分析教學(xué)課堂,提高教師意識,注重專業(yè)基礎(chǔ)課教學(xué)的重要性,同時,當(dāng)學(xué)生平時成績不好時,隨時調(diào)整教學(xué)進(jìn)度提高學(xué)生平時學(xué)習(xí)能力;另一方面使學(xué)生認(rèn)識到,為了更好地掌握回歸分析知識,應(yīng)加強(qiáng)專業(yè)基礎(chǔ)課的學(xué)習(xí),提高平時學(xué)習(xí)的積極性。因此,通過對回歸分析期末成績影響因素的研究能有效的解決教師教學(xué)和學(xué)生學(xué)習(xí)中的許多問題。
統(tǒng)計學(xué)畢業(yè)論文范文模板(二):大數(shù)據(jù)背景下統(tǒng)計學(xué)專業(yè)“數(shù)據(jù)挖掘”課程的教學(xué)探討論文
摘要:互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計算技術(shù)的蓬勃發(fā)展,造就了一個嶄新的大數(shù)據(jù)時代,這些變化對統(tǒng)計學(xué)專業(yè)人才培養(yǎng)模式的變革起到了助推器的作用,而數(shù)據(jù)挖掘作為拓展和提升大數(shù)據(jù)分析方法與思路的應(yīng)用型課程,被廣泛納入統(tǒng)計學(xué)本科專業(yè)人才培養(yǎng)方案。本文基于數(shù)據(jù)挖掘課程的特點,結(jié)合實際教學(xué)經(jīng)驗,對統(tǒng)計學(xué)本科專業(yè)開設(shè)數(shù)據(jù)挖掘課程進(jìn)行教學(xué)探討,以期達(dá)到更好的教學(xué)效果。
關(guān)鍵詞:統(tǒng)計學(xué)專業(yè);數(shù)據(jù)挖掘;大數(shù)據(jù);教學(xué)
一、引言
通常人們總結(jié)大數(shù)據(jù)有“4V”的特點:Volume(體量大),Variety(多樣性),Velocity(速度快)和Value(價值密度低)。從這樣大量、多樣化的數(shù)據(jù)中挖掘和發(fā)現(xiàn)內(nèi)在的價值,是這個時代帶給我們的機(jī)遇與挑戰(zhàn),同時對數(shù)據(jù)分析技術(shù)的要求也相應(yīng)提高。傳統(tǒng)教學(xué)模式并不能適應(yīng)和滿足學(xué)生了解數(shù)據(jù)處理和分析最新技術(shù)與方法的迫切需要。對于常常和數(shù)據(jù)打交道的統(tǒng)計學(xué)專業(yè)的學(xué)生來說,更是如此。
二、課程教學(xué)探討
針對統(tǒng)計學(xué)本科專業(yè)的學(xué)生而言,“數(shù)據(jù)挖掘”課程一般在他們?nèi)昙壔蛘咚哪昙壦_設(shè),他們在前期已經(jīng)學(xué)習(xí)完統(tǒng)計學(xué)、應(yīng)用回歸分析、多元統(tǒng)計分析、時間序列分析等課程,所以在“數(shù)據(jù)挖掘”課程的教學(xué)內(nèi)容選擇上要有所取舍,同時把握好難度。不能把“數(shù)據(jù)挖掘”課程涵蓋了的所有內(nèi)容不加選擇地要求學(xué)生全部掌握,對學(xué)生來說是不太現(xiàn)實的,需要為統(tǒng)計學(xué)專業(yè)本科生“個性化定制”教學(xué)內(nèi)容。
(1)“數(shù)據(jù)挖掘”課程的教學(xué)應(yīng)該偏重于應(yīng)用,更注重培養(yǎng)學(xué)生解決問題的能力。因此,教學(xué)目標(biāo)應(yīng)該是:使學(xué)生樹立數(shù)據(jù)挖掘的思維體系,掌握數(shù)據(jù)挖掘的基本方法,提高學(xué)生的實際動手能力,為在大數(shù)據(jù)時代,進(jìn)一步學(xué)習(xí)各種數(shù)據(jù)處理和定量分析工具打下必要的基礎(chǔ)。按照這個目標(biāo),教學(xué)內(nèi)容應(yīng)以數(shù)據(jù)挖掘技術(shù)的基本原理講解為主,讓學(xué)生了解和掌握各種技術(shù)和方法的來龍去脈、功能及優(yōu)缺點;以算法講解為輔,由于有R語言、python等軟件,學(xué)生了解典型的算法,能用軟件把算法實現(xiàn),對軟件的計算結(jié)果熟練解讀,對各種算法的改進(jìn)和深入研究則不作要求,有興趣的同學(xué)可以自行課下探討。
(2)對于已經(jīng)學(xué)過的內(nèi)容不再詳細(xì)講解,而是側(cè)重介紹它們在數(shù)據(jù)挖掘中的功能及綜合應(yīng)用。在新知識的講解過程中,注意和已學(xué)過知識的融匯貫通,既復(fù)習(xí)鞏固了原來學(xué)過的知識,同時也無形中降低了新知識的難度。比如,在數(shù)據(jù)挖掘模型評估中,把混淆矩陣、ROC曲線、誤差平方和等知識點就能和之前學(xué)過的內(nèi)容有機(jī)聯(lián)系起來。
(3)結(jié)合現(xiàn)實數(shù)據(jù),讓學(xué)生由“被動接收”式的學(xué)習(xí)變?yōu)椤爸鲃犹骄俊毙偷膶W(xué)習(xí)。在講解每種方法和技術(shù)之后,增加一個或幾個案例,以加強(qiáng)學(xué)生對知識的理解。除了充分利用已有的國內(nèi)外數(shù)據(jù)資源,還可以鼓勵學(xué)生去搜集自己感興趣的或者國家及社會大眾關(guān)注的問題進(jìn)行研究,提升學(xué)生學(xué)習(xí)的成就感。
(4)充分考慮前述提到的三點,課程內(nèi)容計劃安排見表1。
(5)課程的考核方式既要一定的理論性,又不能失掉實踐應(yīng)用性,所以需要結(jié)合平時課堂表現(xiàn)、平時實驗項目完成情況和期末考試來綜合評定成績。采取期末閉卷理論考試占50%,平時實驗項目完成占40%,課堂表現(xiàn)占10%,這樣可以全方位的評價學(xué)生的表現(xiàn)。
三、教學(xué)效果評估
經(jīng)過幾輪的教學(xué)實踐后,取得了如下的教學(xué)效果:
(1)學(xué)生對課程的興趣度在提升,課下也會不停地去思考數(shù)據(jù)挖掘有關(guān)的方法和技巧,發(fā)現(xiàn)問題后會一起交流與討論。
(2)在大學(xué)生創(chuàng)新創(chuàng)業(yè)項目或者數(shù)據(jù)分析的有關(guān)競賽中,選用數(shù)據(jù)挖掘方法的人數(shù)也越來越多,部分同學(xué)的成果還能在期刊上正式發(fā)表,有的同學(xué)還能在競賽中取得優(yōu)秀的成績。
(3)統(tǒng)計學(xué)專業(yè)本科生畢業(yè)論文的選題中利用數(shù)據(jù)挖掘有關(guān)方法來完成的論文越來越多,論文的完成質(zhì)量也在不斷提高。
(4)本科畢業(yè)生的就業(yè)崗位中從事數(shù)據(jù)挖掘工作的人數(shù)有所提高,說明滿足企業(yè)需求技能的人數(shù)在增加。繼續(xù)深造的畢業(yè)生選擇數(shù)據(jù)挖掘研究方向的人數(shù)也在逐漸增多,表明學(xué)生的學(xué)習(xí)興趣得以激發(fā)。
教學(xué)實踐結(jié)果表明,通過數(shù)據(jù)挖掘課程的學(xué)習(xí),可以讓學(xué)生在掌握理論知識的基礎(chǔ)上,進(jìn)一步提升分析問題和解決實際問題的能力。
1醫(yī)學(xué)論文的基本要求
1.1創(chuàng)新性醫(yī)學(xué)論文的創(chuàng)新性是指文章要有新意,要發(fā)展醫(yī)學(xué)成就,破解醫(yī)學(xué)問題。醫(yī)學(xué)論文有無創(chuàng)新,選題是關(guān)鍵。選題創(chuàng)新是醫(yī)學(xué)論文寫作的靈魂,是衡量醫(yī)學(xué)論文價值的重要標(biāo)準(zhǔn)??审w現(xiàn)在:①理論方面的選題應(yīng)有創(chuàng)新見解,既要反映作者在某些理論方面的獨創(chuàng)見解,又要提出這些見解的依據(jù);②應(yīng)用方面的選題應(yīng)有創(chuàng)新技術(shù)等,也就是要寫出新發(fā)明、新技術(shù)、新產(chǎn)品、新設(shè)備的關(guān)鍵,或揭示原有技術(shù)移植到新的醫(yī)學(xué)領(lǐng)域中的效果;③創(chuàng)新性還包括研究方法方面的改進(jìn)或突破。
1.2可行性所謂選題的可行性,是指能夠充分發(fā)揮作者的綜合條件和可以勝任及如期完成醫(yī)學(xué)論文寫作的把握程度。選題切忌好高鶩遠(yuǎn),脫離實際,但也不應(yīng)過低,影響主客觀的正常發(fā)揮,降低了醫(yī)學(xué)論文的水平。影響選題的可行性因素有:①主觀條件,包括作者知識素質(zhì)結(jié)構(gòu)、研究能力、技術(shù)水平及特長和興趣等;②客觀條件,包括經(jīng)費、資料、時間、設(shè)備等。
1.3實用性撰寫醫(yī)學(xué)論文的目的是為了交流及應(yīng)用。要從實際出發(fā),選擇夠指導(dǎo)科研、指導(dǎo)臨床、造福人類的主題,因此,選題的實用性尤為重要。
1.4科學(xué)性醫(yī)學(xué)論文是臨床和醫(yī)學(xué)科學(xué)研究工作的客觀反映,其寫作的具體內(nèi)容應(yīng)該是取材客觀真實、主題揭示本質(zhì)、科研設(shè)計合理、論證科學(xué)嚴(yán)謹(jǐn)、表達(dá)邏輯性強(qiáng)、經(jīng)過實踐檢驗。所以,嚴(yán)格遵守選題的科學(xué)性原則,是醫(yī)學(xué)論文寫作的生命。
1.5前瞻性要選擇有研究價值及發(fā)展前途的主題,應(yīng)積極開發(fā)研究新領(lǐng)域、新學(xué)科和新理論。
2選題的基本方法
2.1根據(jù)課題研究的結(jié)論來確定主題這是常用的方法,可分為:①以科研的結(jié)論或部分結(jié)論作為醫(yī)學(xué)論文的主題;②科研結(jié)果與開題時預(yù)測不一致,待查出原因后,再尋找主題;③科研達(dá)不到預(yù)期結(jié)果,可總結(jié)經(jīng)驗,從反面挖掘主題。
2.2在科研過程中選題醫(yī)學(xué)科研的過程中,有時會出現(xiàn)意外的現(xiàn)象或問題,作者如果能夠細(xì)心觀察、及時發(fā)現(xiàn),可以在這些偶然中獲得新的選題。
2.3在臨床實踐中選題臨床工作是醫(yī)學(xué)論文寫作取之不盡的源泉,作者在臨床中會經(jīng)常遇到許多需要解決的實際應(yīng)用問題或理論問題,對此,只要從本學(xué)科實際出發(fā),用心思考,會從中產(chǎn)生很多好的主題。其包括:①探討發(fā)病機(jī)制與預(yù)后情況;②分析臨床癥狀與表現(xiàn);③研究診斷方法和治療方法;④疾病的多因素分析等。
2.4從文獻(xiàn)資料中選題醫(yī)學(xué)文獻(xiàn)是人們長期積累的寶貴財富,是醫(yī)學(xué)論文選題的重要來源。閱讀最新文獻(xiàn)資料,可以了解當(dāng)前醫(yī)學(xué)科學(xué)研究的進(jìn)展情況,開拓思路、激發(fā)靈感,從而挖掘提煉出好的醫(yī)學(xué)論文主題。
3醫(yī)學(xué)論文的一般體裁
3.1實驗研究一般為病因、病理、生理、生化、藥理、生物、寄生蟲和流行病學(xué)等實驗研究。主要包括:①對各種動物進(jìn)行藥理、毒理實驗,外科手術(shù)實驗;②對某種疾病的病原或病因的體外實驗;③某些藥物的抗癌、抗菌、抗寄生蟲實驗;④消毒、殺蟲和滅菌的實驗。
3.2臨床分析對臨床上某種疾病病例(百例以上為佳)的病因、臨床表現(xiàn)、分型、治療方法和療效觀察等進(jìn)行分析、討論,總結(jié)經(jīng)驗教訓(xùn),并提出新建議、新見解,以提高臨床療效。
3.3療效觀察指使用某種新藥、新療法治療某種疾病,對治療的方法、效果、劑量、療程及不良反應(yīng)等進(jìn)行觀察、研究,或設(shè)立對照組對新舊藥物或療法的療效進(jìn)行比較,對比療效的高低、療法的優(yōu)劣、不良反應(yīng)的種類及程度,并對是否適于推廣應(yīng)用提出評價意見。
3.4病例報告主要報告罕見病及疑難重癥;雖然曾有少數(shù)類似報道但尚有重復(fù)驗證或加深認(rèn)識的必要。
3.5病例(理)討論臨床病例討論主要是對某些疑難、復(fù)雜、易于誤診誤治的病例,在診斷和治療方面進(jìn)行集體討論,以求得正確的診斷和有效的治療。臨床病理討論則以對少見或疑難疾病的病理檢查、診斷及相關(guān)討論為主。
3.6調(diào)查報告在一定范圍的人群里,不施加人工處理因素,對某一疾?。▊魅静 ⒘餍胁?、職業(yè)病、地方病等)的發(fā)病情況、發(fā)病因素、病理、防治方法及其效果進(jìn)行流行病學(xué)調(diào)查研究,給予評價,并對防治方案等提出建議。
開發(fā)科技創(chuàng)新決策分析服務(wù)系統(tǒng),其基礎(chǔ)性的工作是構(gòu)建元數(shù)據(jù)倉儲知識庫。從科技文獻(xiàn)數(shù)據(jù)庫種類來看,包括:科技期刊、學(xué)位論文、會議論文、標(biāo)準(zhǔn)、專利文獻(xiàn)數(shù)據(jù)庫及科技成果、企業(yè)產(chǎn)品、科研機(jī)構(gòu)、科技名人等事實型數(shù)據(jù)庫,從這些科技文獻(xiàn)中,挖掘其相互邏輯關(guān)系、交叉融合間的溝通脈絡(luò)是知識獲取、知識組織的關(guān)鍵。結(jié)合科技文獻(xiàn)資源的特性和文獻(xiàn)檢索導(dǎo)航需求分析,萬方軟件公司提出了基于“知識獲取五要素”的知識組織方法【4】,將學(xué)科、主題、人物、機(jī)構(gòu)、基金五要素作為知識獲取的分析主題,構(gòu)成二維空間,組成各個要素之間的相互關(guān)聯(lián)關(guān)系。五要素之間的相互關(guān)聯(lián)包含了多種科研信息,從各個角度,各個側(cè)面都有無窮的知識可以去挖掘分析。比如:機(jī)構(gòu)和學(xué)科關(guān)聯(lián),可以獲得各個機(jī)構(gòu)的研究學(xué)科,以及有哪些機(jī)構(gòu)在研究該學(xué)科的分析結(jié)果;機(jī)構(gòu)、學(xué)科和作者關(guān)聯(lián),可以獲得某個學(xué)科在某個機(jī)構(gòu)中有哪些人在做相關(guān)研究的分析結(jié)果等等。因此從知識的組織角度,在構(gòu)建元數(shù)據(jù)倉儲知識庫時,以五要素知識元為基礎(chǔ),通過對海量科技文獻(xiàn)的處理(采集、轉(zhuǎn)換、清洗、質(zhì)量檢測)和對五要素的深度標(biāo)引,最終構(gòu)建基于五要素的元數(shù)據(jù)知識倉儲,作為開發(fā)科技創(chuàng)新決策分析服務(wù)系統(tǒng)的基礎(chǔ)。
2科技創(chuàng)新決策分析服務(wù)體系架構(gòu)和功能設(shè)計
元數(shù)據(jù)倉儲知識庫的構(gòu)建為科技創(chuàng)新決策分析服務(wù)提供了基礎(chǔ)保障,在此基礎(chǔ)上,運(yùn)用數(shù)據(jù)挖掘技術(shù)、自動分類∕聚類技術(shù)、信息可視化等技術(shù),開發(fā)基于WEB的科技創(chuàng)新決策分析服務(wù)系統(tǒng)。基于元數(shù)據(jù)倉儲知識庫的科技創(chuàng)新決策分析服務(wù)主要體現(xiàn)在對科技創(chuàng)新能力的定量評價。主要功能設(shè)計如下:⑴主題知識脈絡(luò)分析。主要對主題關(guān)鍵詞所代表的知識點或概念在各年度的研究發(fā)展趨勢和研究熱點進(jìn)行分析。包括:該主題各年度發(fā)文總量趨勢;該主題的相關(guān)關(guān)鍵詞;關(guān)注該主題的相關(guān)人物、機(jī)構(gòu)以及涉及該主題的重要發(fā)文期刊。系統(tǒng)可通過用戶輸入的主題關(guān)鍵詞,在主題知識庫中挖掘揭示主題相關(guān)的各類科研產(chǎn)出情況,并通過主題相關(guān)的創(chuàng)新實體分析,為用戶推薦權(quán)威的研究機(jī)構(gòu)和行業(yè)領(lǐng)域?qū)<?。?/p>
科研人員科研能力評估分析。主要對科研人員(作者)科研產(chǎn)出情況進(jìn)行統(tǒng)計分析。包括:科研人員的簡介;與作者合作過的相關(guān)科技人員信息;作者的研究主題、研究方向、主要發(fā)文期刊及參與基金項目情況。系統(tǒng)可通過用戶輸入的科研人員姓名,在人物庫中進(jìn)行機(jī)構(gòu)匯總,并經(jīng)過用戶篩選科研人員現(xiàn)在或歷史所在機(jī)構(gòu),對作者的科研產(chǎn)出能力和科研績效水平得出最全面和客觀的評估和總結(jié)。⑶
論文引用情況分析。主要對被引用情況進(jìn)行統(tǒng)計分析。包括:該論文被引論文具體信息(期刊、學(xué)位、會議、技術(shù)報告等)和比例、被引數(shù)量、被引用頻次等。系統(tǒng)按用戶輸入的論文標(biāo)題、作者、關(guān)鍵詞進(jìn)行檢索,按發(fā)文時間、相關(guān)度、題名進(jìn)行排序,從而可以對該論文進(jìn)行學(xué)術(shù)質(zhì)量的綜合、定量的評價。該功能即可獨立使用,也可嵌入在科研人員科研能力評估分析系統(tǒng)中使用。⑷機(jī)構(gòu)創(chuàng)新能力評估。主要對機(jī)構(gòu)的期刊論文、學(xué)位論文、會議論文、專利、成果及機(jī)構(gòu)承擔(dān)的國家基金項目進(jìn)行統(tǒng)計分析,從而反映出機(jī)構(gòu)的總體科學(xué)實力和科研績效水平。系統(tǒng)可通過用戶輸入的機(jī)構(gòu)名稱,通過簡稱俗稱的規(guī)范對應(yīng),按論文類別、基金類別等方式進(jìn)行機(jī)構(gòu)科研產(chǎn)出的揭示,得出機(jī)構(gòu)的科研能力和學(xué)術(shù)定位。
3科技創(chuàng)新決策分析服務(wù)系統(tǒng)的應(yīng)用
科技創(chuàng)新決策分析服務(wù)系統(tǒng)目前在科技文獻(xiàn)共享服務(wù)平臺中已開始應(yīng)用,平臺主要為用戶提供了作者科研協(xié)作關(guān)系、主題知識脈絡(luò)分析、機(jī)構(gòu)科研能力評估三種服務(wù)。⑴作者科研協(xié)作關(guān)系。在作者科研協(xié)作關(guān)系服務(wù)中,可以分析出用戶所關(guān)心作者的如下信息:①作者合作關(guān)系:通過可視化的與合作者的關(guān)系呈現(xiàn),可以分析出作者在科研工作中與合作者的合作關(guān)系,節(jié)點間的距離越近,表明與合作者合作發(fā)表的論文次數(shù)越多,合作關(guān)系越緊密。②作者科研產(chǎn)出統(tǒng)計:可以統(tǒng)計出作者總體的數(shù)量。③作者研究主題和研究方向:可以分析出作者的研究主題和按學(xué)科分析的研究方向。④主要發(fā)文期刊:可以統(tǒng)計出作者在不同期刊的數(shù)量,獲得作者關(guān)注的期刊情況。⑤作者簡介:獲得作者單位、職稱、職務(wù)等基本信息。在知識脈絡(luò)分析服務(wù)中,以用戶輸入的主題詞為分析依據(jù),通過可視化信息展示,分析出主題詞所代表的知識點或概念在各年度的研究發(fā)展趨勢和研究熱點。并提供主題詞所關(guān)聯(lián)的相關(guān)詞、相關(guān)人物、相關(guān)期刊和機(jī)構(gòu)的知識脈絡(luò)。
4結(jié)語
>> 基于本體的網(wǎng)絡(luò)輿情觀點挖掘方法研究 基于熱點文件下載的網(wǎng)絡(luò)輿情信息挖掘方法研究 基于網(wǎng)頁文本獲取的高校網(wǎng)絡(luò)輿情監(jiān)控 基于OAG循環(huán)的網(wǎng)絡(luò)輿情管理模型研究 基于大規(guī)模文本數(shù)據(jù)情感挖掘的企業(yè)輿情研究 基于文本挖掘的網(wǎng)絡(luò)媒體報道研究 基于模糊神經(jīng)網(wǎng)絡(luò)的Web文本挖掘系統(tǒng) 基于PDCA循環(huán)的預(yù)算管理 基于PDCA循環(huán)的績效考評 基于 PDCA 循環(huán)方法的瀝青路面質(zhì)量動態(tài)管理的研究 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng) 基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)輿情智能監(jiān)測與引導(dǎo)平臺設(shè)計研究 基于Web挖掘的突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警研究 基于Web數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情分析技術(shù)研究 基于Web挖掘的突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警策略探討 基于數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情預(yù)測中的應(yīng)用 基于數(shù)據(jù)挖掘的高校網(wǎng)絡(luò)輿情分析系統(tǒng)設(shè)計與實現(xiàn) 基于數(shù)據(jù)挖掘的輿情觀點挖掘研究 基于蛙鳴博弈的網(wǎng)絡(luò)輿情與政府監(jiān)管的模型淺析 基于PDCA循環(huán)的績效管理體系的構(gòu)建 常見問題解答 當(dāng)前所在位置:.
[2]張玉亮.突發(fā)事件網(wǎng)絡(luò)輿情的生成原因與導(dǎo)控策略――基于網(wǎng)絡(luò)輿情主體心理的分析視閾[J].情報雜志,2012,31(4):54-57.
[3]許鑫,章成志,李雯靜.國內(nèi)網(wǎng)絡(luò)輿情研究的回顧與展望[J].情報理論與實踐,2009,32(3):115-120.
[4]Hua Zhao,Qingtian Zeng.Micro-blog Hot Event Detection Based on Dynamic Event Model.Lecture Notes in Artificial Intelligence 8041,2013:161-172.
[5]鄭軍.網(wǎng)絡(luò)輿情監(jiān)控的熱點發(fā)現(xiàn)算法研究[D].哈爾濱哈爾濱工程大學(xué),2007.
[6]陳耘可,李博,鄭天翔.PDCA循環(huán)在煤炭企業(yè)質(zhì)量標(biāo)準(zhǔn)化建設(shè)中的研究與應(yīng)用[J].煤炭經(jīng)濟(jì)研究,2013,33(2):77-79.
[7]辛敏.PDCA理論在護(hù)理質(zhì)量管理中的應(yīng)用研究[D].碩士學(xué)位論文:山西醫(yī)科大學(xué),2010.
【關(guān)鍵詞】 科技文獻(xiàn) 評價體系 評價指標(biāo)
二十世紀(jì)八九十年代是科研評價發(fā)展的高峰時期,科研管理專家和經(jīng)濟(jì)學(xué)家提出了許多系統(tǒng)的評價方法[1]??蒲性u價是科研管理工作的重要環(huán)節(jié)和核心內(nèi)容之一,是推動科技事業(yè)持續(xù)健康發(fā)展,促進(jìn)科技資源優(yōu)化配置,提高科技管理水平的重要手段和保障[2]。而在科研評價中,科研產(chǎn)出始終作為科研評價的主要內(nèi)容。本文通過對科技文獻(xiàn)的特點進(jìn)行分析,找出各個要素以及要素間的語義關(guān)系。通過對這些要素進(jìn)行深入分析,在原有的理論和實踐的基礎(chǔ)上,對科技文獻(xiàn)產(chǎn)出評價體系重新設(shè)計,分別從科研機(jī)構(gòu)綜合科研實力、核心作者學(xué)術(shù)力、學(xué)科發(fā)展、最新科研動向(領(lǐng)先研究領(lǐng)域),需求信息特點等五個方面,建立了一個相對系統(tǒng)全面的針對科研機(jī)構(gòu)的科研評價指標(biāo)體系。
1 科技文獻(xiàn)產(chǎn)出評價體系的作用
科技文獻(xiàn)是基礎(chǔ)性研究成果的主要表現(xiàn)形式,也是表征一個國家、地區(qū)基礎(chǔ)性研究實力的主要指標(biāo)[3]。近二十年,一直被高等院校、科研院所以及政府部門作為評價科研能力水平和科研成果的重要指標(biāo)??萍嘉墨I(xiàn)產(chǎn)出評價體系的作用主要體現(xiàn)在三個層次上:宏觀上評價國家的科研創(chuàng)新水平,反映一個國家基礎(chǔ)研究、應(yīng)用研究等方面的情況,在一定程度上反映了一個國家的科技技術(shù)水平和國際競爭力水平;中觀上評價科研機(jī)構(gòu)的科研業(yè)績,反映了科研機(jī)構(gòu)的學(xué)術(shù)、科研水平及科研機(jī)構(gòu)間的競爭力;微觀上評價科研人員的科研能力,反映某個機(jī)構(gòu)的團(tuán)隊或個人的學(xué)術(shù)地位和影響。
2 科技文獻(xiàn)產(chǎn)出的要素
本文通過對科技文獻(xiàn)的特點進(jìn)行分析,找到各種要素以及要素間的語義關(guān)系。通過對這些要素的統(tǒng)計分析,可以展開計量分析、主題揭示、關(guān)聯(lián)挖掘和綜合評價,從而獲取對科技文獻(xiàn)產(chǎn)出相關(guān)要素更深入全面的認(rèn)識。
2.1 科技論文產(chǎn)出的相關(guān)要素
從科技文獻(xiàn)中可以獲得題名、摘要、作者、作者機(jī)構(gòu)(單位)、關(guān)鍵詞、參考文獻(xiàn)、分類號以及基金項目等相關(guān)要素??萍颊撐牡南嚓P(guān)要素如下:
(1)科技論文是學(xué)術(shù)刊物上發(fā)表的科學(xué)研究成果??萍颊撐模}名、作者、機(jī)構(gòu)(單位)、摘要、關(guān)鍵詞、參考文獻(xiàn)、發(fā)表期刊或會議)。
(2)作者,科技文獻(xiàn)的主要創(chuàng)作者,是科技文獻(xiàn)產(chǎn)出的源頭。作者(姓名、性別、出生年月、職稱、單位、郵箱、研究興趣)。
(3)期刊,科技文獻(xiàn)產(chǎn)出的媒介和主要載體。期刊(名稱、ISSN、主辦單位、地址、郵箱、出版周期、是否核心、影響因子)。
(4)機(jī)構(gòu)(單位),是科研人員聯(lián)系形成科研團(tuán)體的主要方式。機(jī)構(gòu)(名稱、地址、郵編)。
(5)基金,是資助基礎(chǔ)科研工作的主要方式。基金(名稱、編號、類別、起止時間、額度、主持人、依托單位)。
(6)關(guān)鍵詞,作為科研人員對科研成果內(nèi)容提綱挈領(lǐng)的體現(xiàn),是科技文獻(xiàn)產(chǎn)出的主要內(nèi)容特征。
2.2 科技文獻(xiàn)產(chǎn)出要素間的語義關(guān)系
要素與要素之間關(guān)系有三種:父子關(guān)系(等級)、相等關(guān)系(等同)和相關(guān)關(guān)系。相關(guān)關(guān)系根據(jù)緊密程度,又分為直接相關(guān)和間接相關(guān)。直接相關(guān)是指直接定義了概念間的關(guān)系,沒有經(jīng)過任何其他的概念;間接相關(guān)是指某兩個概念雖然沒有直接定義關(guān)系,卻通過其他概念產(chǎn)生了關(guān)聯(lián)。
科技文獻(xiàn)產(chǎn)出要素的間關(guān)系如下圖1,其中的父子關(guān)系如文獻(xiàn)與參考文獻(xiàn);相等關(guān)系如作者與項目參與人員;直接相關(guān)如作者與文獻(xiàn)之間是撰寫與被撰寫的關(guān)系;間接關(guān)系如基金項目與文獻(xiàn)之間通過作者產(chǎn)生關(guān)聯(lián)。
3 科技文獻(xiàn)產(chǎn)出評價指標(biāo)體系
根據(jù)科技文獻(xiàn)產(chǎn)出要素以及要素之間的關(guān)系,圍繞科技文獻(xiàn)產(chǎn)出分別從科研機(jī)構(gòu)綜合科研實力、核心作者學(xué)術(shù)力、學(xué)科發(fā)展、最新科研動向(領(lǐng)先研究領(lǐng)域),科研人員需求信息特點等五個方面設(shè)計評價體系。
3.1 科研機(jī)構(gòu)綜合科研實力評估指標(biāo)
科研機(jī)構(gòu)是一個國家科技創(chuàng)新能力的重要體現(xiàn),在提升國家綜合實力、創(chuàng)新能力、科技競爭力等方面發(fā)揮著主導(dǎo)作用。基于文獻(xiàn)計量的角度,通過文獻(xiàn)發(fā)表數(shù)量、被引篇數(shù)及頻次、專利數(shù)量以及合作論文數(shù)量等指標(biāo),對科研機(jī)構(gòu)的成果(科技文獻(xiàn))進(jìn)行分析得出科研機(jī)構(gòu)的綜合科研實力總體情況。
科研機(jī)構(gòu)綜合實力評估分別從產(chǎn)出力、影響力、創(chuàng)新力和合作力四個方面進(jìn)行評估,指標(biāo)包括:
(1)科研機(jī)構(gòu)生產(chǎn)力:反映科研機(jī)構(gòu)科研產(chǎn)出能力。論文產(chǎn)出數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)發(fā)表的論文數(shù)量;(2)科研機(jī)構(gòu)影響力:反映科研機(jī)構(gòu)的學(xué)術(shù)水平和影響力。引文量(篇/次):科研機(jī)構(gòu)在一定時間范圍內(nèi)發(fā)表的論文被引用的數(shù)量(篇/次);篇均引用次數(shù):科研機(jī)構(gòu)在一定時間范圍內(nèi)所篇均被引用次數(shù);SCI/EI收錄的論文數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)被SCI/EI收錄的論文數(shù)量;核心期刊刊載的論文數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)被核心期刊刊載的論文數(shù)量;(3)科研機(jī)構(gòu)創(chuàng)新力:反映科研機(jī)構(gòu)的自主創(chuàng)新能力和創(chuàng)新水平。專利數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)公開的專利數(shù)量;基金立項數(shù):科研機(jī)構(gòu)在一定時間范圍內(nèi)基金立項數(shù)量;科技成果數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)科技成果數(shù)量;(4)科研機(jī)構(gòu)合作力:反映科研機(jī)構(gòu)與國際、國內(nèi)交流的活躍程度;會議論文數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)發(fā)表會議論文數(shù)量;合作論文數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)與其他機(jī)構(gòu)合作的論文數(shù)量的比例。C=No/(No+Ns),式中C:合作率;No:合作論文總數(shù);Ns:獨立論文數(shù)。
3.2 核心作者群學(xué)術(shù)力評估指標(biāo)
科技文獻(xiàn)的作者是推動學(xué)科發(fā)展的主體,對機(jī)構(gòu)或?qū)W科的核心作者研究無疑具有重要意義。核心作者群是具有較高的學(xué)術(shù)產(chǎn)出和學(xué)術(shù)影響力的作者集合,是學(xué)科發(fā)展和創(chuàng)新的主體。通過對作者的發(fā)文量、被引次數(shù)等多方面指標(biāo),采用文獻(xiàn)計量、引文分析、數(shù)理統(tǒng)計等方法,綜合以上指標(biāo)用定量的方法對核心作者學(xué)術(shù)力進(jìn)行綜合評估。核心作者群學(xué)術(shù)力評估指標(biāo)包括:
(1)發(fā)文方面。
作者論文產(chǎn)出數(shù)量:作者在一定時間范圍內(nèi)發(fā)表的論文數(shù)量;
作者合作論文數(shù)量:作者在一定時間范圍內(nèi)與他人合作創(chuàng)作的論文數(shù)量。
(2)引文方面。
總被引次數(shù):作者在一定時間范圍內(nèi)發(fā)表的論文被引用的數(shù)量
自引次數(shù):作者在一定時間范圍內(nèi)發(fā)表的論文自己引用自己文獻(xiàn)的數(shù)量
3.3 學(xué)科發(fā)展評價指標(biāo)
學(xué)科發(fā)展評價則在于客觀科學(xué)地分析被評學(xué)科目前的發(fā)展基礎(chǔ)、發(fā)展?fàn)顩r和態(tài)勢,預(yù)測將來發(fā)展可能達(dá)到的程度,發(fā)現(xiàn)學(xué)科發(fā)展過程中存在的問題,分析問題產(chǎn)生的原因,探討解決問題、促進(jìn)學(xué)科發(fā)展的對策。開展學(xué)科發(fā)展評價,從而為制定學(xué)科發(fā)展戰(zhàn)略以及進(jìn)行學(xué)科建設(shè)和管理提供直接、有力的支撐。學(xué)科發(fā)展評價指標(biāo)包括:(1)學(xué)科文獻(xiàn)數(shù)量分布:科研機(jī)構(gòu)在一定時間范圍內(nèi)發(fā)表的論文在各個學(xué)科分布數(shù)量;(2)學(xué)科文獻(xiàn)數(shù)量增長趨勢:科研機(jī)構(gòu)在一定時間范圍內(nèi)各個學(xué)科論文數(shù)量的增長趨勢;(3)學(xué)科關(guān)鍵詞及頻次:該學(xué)科在一定時間范圍內(nèi)論文的主要關(guān)鍵詞以及關(guān)鍵詞的出現(xiàn)次數(shù);(4)學(xué)科題名及頻次:該學(xué)科在一定時間范圍內(nèi)論文題名以及題名的出現(xiàn)次數(shù);(5)學(xué)科文獻(xiàn)引文量:科研機(jī)構(gòu)在一定時間范圍內(nèi)該文獻(xiàn)被引用的數(shù)量。
3.4 最新科研動向(領(lǐng)先研究領(lǐng)域)分析指標(biāo)
基金論文的生產(chǎn)能力是衡量這個學(xué)科科研實力和水平、科研組織能力及學(xué)科社會地位的重要標(biāo)志,而權(quán)威期刊刊載基金資助論文往往代表著該研究領(lǐng)域的新動向、新趨勢、制高點。研究科學(xué)基金資助研究論文生產(chǎn)能力,對了解科研機(jī)構(gòu)科學(xué)學(xué)發(fā)展動向具有重要的現(xiàn)實意義。
基金論文總數(shù)量:科研機(jī)構(gòu)在一定時間范圍內(nèi)發(fā)表基金論文數(shù)量;
基金論文增長趨勢:科研機(jī)構(gòu)在一定時間范圍內(nèi)基金論文的增長趨勢;
基金論文主題分布:科研機(jī)構(gòu)在一定時間范圍內(nèi)基金論文的主題分布;
基金論文高頻關(guān)鍵詞:科研機(jī)構(gòu)在一定時間范圍內(nèi)基金論文的出現(xiàn)頻次高的關(guān)鍵詞;
基金論文被引用量:科研機(jī)構(gòu)在一定時間范圍內(nèi)基金論文被引用次數(shù)。
3.5 科研人員需求信息的特點分析指標(biāo)
分析引文是研究科研人員使用信息的一種重要途徑。根據(jù)科學(xué)文獻(xiàn)的引文可以研究人員的信息需求特點。一般來說,附在論文末尾的被引用文獻(xiàn)是科研人員所需要和利用的最有代表性的文獻(xiàn)。因此,引文的特點可基本反映出用戶利用正式渠道獲得信息的主要特點。通過對科研人員所發(fā)表的論文的大量引文統(tǒng)計,可以獲得與信息需求有關(guān)的許多指標(biāo),如引文數(shù)量、引文的文獻(xiàn)類型、引文的語種分布、引文的時間分布、引文出處等。這樣就可以從中挖掘出科研人員需求信息的特點。
引文數(shù)量:反應(yīng)科研人員對已有研究成果和最新信息的利用能力;
引文國別:弄清與國際文獻(xiàn)交流的數(shù)量和流向;
引文語種:分布反映科研人員對外文文獻(xiàn)利用能力;
引文文獻(xiàn)類型:有利于確定文獻(xiàn)情報搜集的重點;
引文時間分布:吸收新信息和新成果的能力。
4 結(jié)語
通過查閱大量文獻(xiàn)可以發(fā)現(xiàn),國內(nèi)外在基于科技論文產(chǎn)出評價體系研究已經(jīng)非常豐富,采用的研究方法和研究技術(shù)也已經(jīng)比較成熟,研究視角多種多樣,取得了許多重要的研究成果。但是可以發(fā)現(xiàn),我國對高校科研評價相對較多,對科研機(jī)構(gòu)的評價比較匱乏,在科研評價的建設(shè)上還缺乏一個系統(tǒng)全面的指標(biāo)體系。本課題在理論研究方面進(jìn)一步完善了科技文獻(xiàn)產(chǎn)出評價指標(biāo)體系研究,從科研機(jī)構(gòu)綜合科研實力、核心作者學(xué)術(shù)力、學(xué)科發(fā)展、最新科研動向(領(lǐng)先研究領(lǐng)域),需求信息特點等五個方面,對科技文獻(xiàn)產(chǎn)出數(shù)據(jù)進(jìn)行分析和挖掘,建立一個相對系統(tǒng)全面的科研機(jī)構(gòu)的科技文獻(xiàn)產(chǎn)出評價指標(biāo)體系。
參考文獻(xiàn):
[1]劉作義,陳曉田.科學(xué)研究評價的性質(zhì)、作用、方法及程序[J].科研管理,2002,23(2):33-40.
[2]中國社會科學(xué)院外事局輯.美國社會科學(xué)現(xiàn)狀與發(fā)展[M].社會科學(xué)文獻(xiàn)出版社,2001:370-393.
[3]HENK E.Moed,Research Assessment in Social Science and Humanities[EB/OL].http://lingue.unibo.it/evaluationin-thehumanities/Research Assessment in Social Science and Humanities.pdf.2010-10-15.