前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)挖掘課程主題范文,僅供參考,歡迎閱讀并收藏。
在傳統(tǒng)教育中,教師通過與學(xué)生面對(duì)面的交流,獲得學(xué)生學(xué)習(xí)行為的表現(xiàn)信息,較為容易掌握學(xué)生的學(xué)習(xí)情況和課程教學(xué)效果,但隨著現(xiàn)代教育技術(shù)的發(fā)展,網(wǎng)絡(luò)學(xué)習(xí)方式的普及,以及學(xué)生學(xué)習(xí)行為的變化,研究網(wǎng)絡(luò)課程的教學(xué)方法受到了越來越多的關(guān)注。本文以Moodle網(wǎng)絡(luò)課程管理系統(tǒng)為研究基礎(chǔ),分析并提出有針對(duì)性的數(shù)據(jù)挖掘方法構(gòu)架,以達(dá)到對(duì)課程建設(shè)情況和學(xué)生學(xué)習(xí)情況的跟蹤分析,為教師改進(jìn)教學(xué)策略、提高網(wǎng)絡(luò)課程教學(xué)質(zhì)量提供有力支持及方法借鑒。
【關(guān)鍵詞】 網(wǎng)絡(luò)課程;數(shù)據(jù)挖掘;挖掘模式
【中圖分類號(hào)】 G40-034 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1009―458x(2014)09―0068―04
一、引言
隨著互聯(lián)網(wǎng)以及移動(dòng)設(shè)備的迅速普及,人們使用網(wǎng)絡(luò)的時(shí)長在不斷增加,通過網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)的需求及能力也在迅速提高。據(jù)美國Ambient Insight研究報(bào)告指出,2009年美國中學(xué)以后的教育機(jī)構(gòu)中,有44%的學(xué)生通過網(wǎng)絡(luò)進(jìn)行課程學(xué)習(xí),預(yù)計(jì)到2018年,美國通過網(wǎng)絡(luò)學(xué)習(xí)的學(xué)生人數(shù)將超過面授學(xué)生的總?cè)藬?shù)。在韓國,78%的高校都提供網(wǎng)絡(luò)教學(xué)(Allen et al. 2008)。在中國,教育部于2011年10月啟動(dòng)了國家開放課程建設(shè)工作,教育部《教育信息化十年發(fā)展規(guī)劃》(2011-2020年)中也明確提出了“推動(dòng)信息技術(shù)與高等教育融合,創(chuàng)新人才培養(yǎng)模式”的要求,融合的關(guān)鍵就是要選擇有效的網(wǎng)絡(luò)教學(xué)模式,因此,對(duì)網(wǎng)絡(luò)教學(xué)的質(zhì)量和有效性研究正被人們所關(guān)注。
本文以Moodle網(wǎng)絡(luò)課程平臺(tái)為基礎(chǔ),分析并提出有針對(duì)性的數(shù)據(jù)挖掘方法構(gòu)架,以達(dá)到對(duì)課程建設(shè)情況和學(xué)生學(xué)習(xí)應(yīng)用情況的跟蹤分析,為教師改進(jìn)教學(xué)策略、提高網(wǎng)絡(luò)課程教學(xué)質(zhì)量提供有力支持。
二、選擇Moodle網(wǎng)絡(luò)課程平臺(tái)的理由
之所以選擇Moodle課程管理系統(tǒng)建設(shè)網(wǎng)絡(luò)課程平臺(tái),是由于Moodle課程管理系統(tǒng)是一個(gè)開源免費(fèi)軟件,更主要的是其模塊化的設(shè)計(jì)非常易于課程的創(chuàng)建,能使課程教師擺脫課程網(wǎng)站建設(shè)的技術(shù)屏障,還可以使教師從課程內(nèi)容的設(shè)計(jì)者轉(zhuǎn)變?yōu)榻虒W(xué)資源與活動(dòng)的組織者。[1]
在國外Moodle系統(tǒng)的應(yīng)用得到了迅速推廣。有數(shù)據(jù)顯示,使用Moodle的國家和地區(qū)有200多個(gè),注冊(cè)使用機(jī)構(gòu)有67,000多所,注冊(cè)用戶數(shù)量達(dá)5,800萬,運(yùn)行課程有600多萬門。注冊(cè)用戶最多的前五位國家分別是美國、西班牙、巴西、英國和德國。[2]
三、教師所關(guān)注問題調(diào)查
根據(jù)教育部頒布的《CELTS-31教育資源建設(shè)技術(shù)規(guī)范》,將教育資源建設(shè)分為素材、課程、評(píng)價(jià)和資源管理系統(tǒng)開發(fā)四個(gè)層次。其中素材與課程是網(wǎng)絡(luò)教育資源建設(shè)的基礎(chǔ),評(píng)價(jià)和資源管理系統(tǒng)則分別是確保質(zhì)量與實(shí)現(xiàn)資源建設(shè)的工具與手段。[3]對(duì)于建設(shè)網(wǎng)絡(luò)課程的教師需要了解它的使用情況,從而分析課程結(jié)構(gòu)是否合理,調(diào)整課程內(nèi)容的分布情況,優(yōu)化網(wǎng)絡(luò)課程的設(shè)計(jì),提高教學(xué)效果。
為了解教師使用網(wǎng)絡(luò)課程的期待值和目的性,我們采取目的抽樣和隨機(jī)抽樣相結(jié)合的方式,樣本來自筆者所在的三個(gè)教師專用QQ群人員。調(diào)查問卷設(shè)計(jì)從了解教師對(duì)網(wǎng)絡(luò)課程的需求、認(rèn)識(shí)、應(yīng)用三個(gè)主要層面展開,具體的問卷內(nèi)容為四個(gè)部份:了解參與問卷教師的基本情況;了解教師對(duì)網(wǎng)絡(luò)技術(shù)應(yīng)用的需求情況;了解教師對(duì)網(wǎng)絡(luò)課程的認(rèn)識(shí)及使用困難所在;了解教師希望網(wǎng)絡(luò)課程能幫助解決教學(xué)中的哪些問題。問卷在公共專業(yè)問卷調(diào)查網(wǎng)站(問卷星)上,一周后回收有效問卷159份。數(shù)據(jù)分析基本報(bào)告可見鏈接:http:///report/3234099.aspx。
筆者所在院校為云南普通高校,與問卷的地圖分布情況相吻合,應(yīng)該更能代表云南普通高校的普遍情況(見圖1)。
圖1 問卷來源地理分布比率圖
問卷中有96.61%的教師認(rèn)為應(yīng)該在教學(xué)中整合網(wǎng)絡(luò)技術(shù),有38.98%的教師因?yàn)榧夹g(shù)應(yīng)用能力的不足,不夠明確如何使用網(wǎng)絡(luò)技術(shù)(見圖2),這說明我們建設(shè)網(wǎng)絡(luò)課程應(yīng)該選擇如同Moodle這樣簡單易用的課程管理系統(tǒng)。
對(duì)于建設(shè)網(wǎng)絡(luò)課程,教師關(guān)注度較高的前4個(gè)方面是:學(xué)生學(xué)習(xí)過程參與的情況、網(wǎng)絡(luò)資源的使用情況、學(xué)生在線學(xué)習(xí)時(shí)間以及學(xué)生參與討論的頻度情況(見圖3)。
圖2 教師對(duì)網(wǎng)絡(luò)技術(shù)與教學(xué)融合的意見
圖3 教師關(guān)注信息統(tǒng)計(jì)
四、網(wǎng)絡(luò)課程數(shù)據(jù)挖掘模式構(gòu)架
數(shù)據(jù)挖掘技術(shù)是獲取相關(guān)信息的有效技術(shù)手段。對(duì)于教師所關(guān)心的幾個(gè)方面內(nèi)容,這里提供幾種可借鑒的方法:
1. 學(xué)生學(xué)習(xí)過程分析
美國教育評(píng)價(jià)專家斯克里文(G F. Scriven)在1967年所著的《評(píng)價(jià)方法論》中,提出形成性評(píng)價(jià)是為正在進(jìn)行的教育活動(dòng)提供反饋信息,以提高正在進(jìn)行的教育活動(dòng)質(zhì)量的評(píng)價(jià),是一種對(duì)學(xué)習(xí)進(jìn)程的動(dòng)態(tài)評(píng)價(jià)。教師和學(xué)生可以依據(jù)獲取的反饋信息了解學(xué)習(xí)狀態(tài),及時(shí)調(diào)整教學(xué)或?qū)W習(xí)。[4]
在Moodle平臺(tái)中具備學(xué)生學(xué)習(xí)進(jìn)展跟蹤功能。
方法一:通過設(shè)置“課程進(jìn)度跟蹤”,了解學(xué)生各項(xiàng)學(xué)習(xí)活動(dòng)的完成情況。
如圖4所示,進(jìn)入課程,在“課程管理”/“課程進(jìn)度跟蹤”進(jìn)行跟蹤條件設(shè)置,然后再選擇“課程管理”/“報(bào)表”/“課程進(jìn)度”,就會(huì)顯示選修該門課程的所有學(xué)生的各項(xiàng)學(xué)習(xí)活動(dòng)的完成情況。
圖4 課程進(jìn)度跟蹤設(shè)置
方法二:分析學(xué)生各項(xiàng)學(xué)習(xí)活動(dòng)的參與度。
通過選擇“課程管理”/“報(bào)表”/“課程成員”,可以詳細(xì)地顯示各項(xiàng)課程活動(dòng)學(xué)生的參與情況,以及參與的次數(shù),更清楚地分析學(xué)生的學(xué)習(xí)努力程度。如圖5所示,列出了數(shù)據(jù)庫原理及應(yīng)用這門課程的“第一部分測(cè)驗(yàn)”活動(dòng)、每個(gè)學(xué)生參與的次數(shù)。
方法三:采用數(shù)據(jù)挖掘手段,了解學(xué)生的學(xué)習(xí)風(fēng)格。
此方法要求具備一定的數(shù)據(jù)挖掘知識(shí)及應(yīng)用能力。通過Mysql系統(tǒng)提取Moodle后臺(tái)數(shù)據(jù)庫(\server\mysql\data\mysql)進(jìn)行關(guān)聯(lián)規(guī)則分析。
關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)行為之間的關(guān)系,通過對(duì)學(xué)生的某兩類網(wǎng)絡(luò)學(xué)習(xí)行為之間取值關(guān)系進(jìn)行分析就可以得出它們之間的關(guān)聯(lián)性,進(jìn)而預(yù)測(cè)學(xué)生將要進(jìn)行的下一個(gè)行為,從而挖掘網(wǎng)絡(luò)學(xué)生學(xué)習(xí)行為之間的關(guān)系,使得學(xué)生學(xué)習(xí)風(fēng)格顯性化。[5]
2. 課程資源利用情況分析
課程資源建設(shè)是影響網(wǎng)絡(luò)教學(xué)應(yīng)用質(zhì)量的重要因素。甘振韜等通過SQL Server的Analysis Services 工具,對(duì)網(wǎng)絡(luò)課程的資源配置情況,包括資源配置指數(shù)和訪問量進(jìn)行分析。[6]
Moodle平臺(tái)能很直觀地呈現(xiàn)課程各項(xiàng)資源的訪問情況。
方法:選擇“課程管理”/“報(bào)表”/“課程活動(dòng)”,課程設(shè)計(jì)的各項(xiàng)活動(dòng)被訪問量被詳細(xì)統(tǒng)計(jì)出,如圖6所示,教師可以清楚了解課程資源的利用率情況,分析學(xué)生的學(xué)習(xí)喜好,適當(dāng)調(diào)整各活動(dòng)資源的配比。
圖6 課程資源訪問情況
3. 學(xué)生在線學(xué)習(xí)時(shí)間分析
對(duì)于某門課程,通過分析學(xué)生的日志,可以掌握學(xué)生的在線學(xué)習(xí)時(shí)間,以及學(xué)習(xí)時(shí)段的分布情況。
方法:點(diǎn)擊“課程管理”/“報(bào)表”/“日志”,其中可以設(shè)定查看所有成員或是某一個(gè)成員、所有活動(dòng)或是某一項(xiàng)活動(dòng),以及所有日期或是某一天,學(xué)生的在線學(xué)習(xí)情況。如圖7所示。
圖7 學(xué)生日志
4. 學(xué)生參與討論的頻度分析
學(xué)生參與課程討論的頻度,可以反映學(xué)生的學(xué)習(xí)主動(dòng)性,教師通過觀察可以即時(shí)進(jìn)行有針對(duì)性的教學(xué)干預(yù)。
方法:選擇“課程管理”/“報(bào)表”/“課程成員”,如圖8所示,學(xué)生參與“課程聊吧”活動(dòng)的情況。
圖8 學(xué)生參與討論活動(dòng)的頻度
5. 學(xué)習(xí)成績分析
學(xué)生的最終學(xué)習(xí)情況需要一個(gè)成績?cè)u(píng)定,Moodle平臺(tái)的設(shè)計(jì)理念中非常強(qiáng)調(diào)過程性評(píng)價(jià),它能夠記錄學(xué)生學(xué)習(xí)過程中的各項(xiàng)活動(dòng)成績,包括師生、生生相互評(píng)價(jià)的成績,匯總成學(xué)生的最終成績。
方法一:查看教學(xué)活動(dòng)的單項(xiàng)成績情況。
直接使用Moodle平臺(tái)所提供的課程管理功能,點(diǎn)擊“課程管理”/“成績”選項(xiàng),打開成績管理菜單,再選擇“類別和項(xiàng)”下的“簡略視圖”(如圖9),可以查看教學(xué)活動(dòng)過程各項(xiàng)匯總成績。并可以設(shè)置學(xué)習(xí)過程中各部分占總成績的比率。
方法二:對(duì)測(cè)驗(yàn)試題結(jié)構(gòu)分析。
在Moodle中若選擇測(cè)驗(yàn),則出現(xiàn)“測(cè)驗(yàn)管理”,再選擇“測(cè)驗(yàn)管理”/“統(tǒng)計(jì)”,可以得到本次測(cè)驗(yàn)的統(tǒng)計(jì)分析報(bào)告。包括此測(cè)驗(yàn)的標(biāo)準(zhǔn)偏差、測(cè)驗(yàn)的分?jǐn)?shù)分布偏度、分?jǐn)?shù)的分布峰度等。還有此測(cè)驗(yàn)試題的結(jié)構(gòu)分析結(jié)果,包括容易度指數(shù)、試題的標(biāo)準(zhǔn)偏差等(如圖10),能讓教師科學(xué)地調(diào)整測(cè)驗(yàn)的結(jié)構(gòu)組成,試題的難易程度和分?jǐn)?shù)的布局等。
圖10 測(cè)驗(yàn)試題結(jié)構(gòu)
方法三:在成績管理菜單下選擇“導(dǎo)出”為Excel、OpenDocument電子表格或其它文檔,再進(jìn)行統(tǒng)計(jì)分析。
6. 群組分析(分組)
學(xué)生分組開展學(xué)習(xí),可以促進(jìn)學(xué)生的集體意識(shí)及合作能力的培養(yǎng),但如何分組?各分組成員真的能很好地協(xié)作嗎?這需要教師特別注意,需要考慮如何分組才能更好地激發(fā)學(xué)生的學(xué)習(xí)積極性。
方法一:選擇“課程管理”/“用戶”/“小組”,可以自主創(chuàng)建小組,也可以用“自動(dòng)創(chuàng)建小組”方式創(chuàng)建,如圖11所示,就是以自動(dòng)方式創(chuàng)建的小組,其中還可以指定小組數(shù)量或是每個(gè)小組成員數(shù)。這種方式設(shè)置的小組較為隨機(jī),如果希望分組能考慮成員的凝聚性可以選擇方法二進(jìn)行。
方法二:應(yīng)用社會(huì)網(wǎng)絡(luò)分析軟件,如UCINET等,可以開展學(xué)習(xí)社群的關(guān)系距離及中心性分析,以及小團(tuán)體分析等分析。通過收集學(xué)生在討論區(qū)或是聊天室中的問答的關(guān)系情況獲得分析數(shù)據(jù)。對(duì)于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)的特征分析可以輔助判斷師生交互網(wǎng)絡(luò)發(fā)展的成熟程度。
五、小結(jié)
本文基于Moodle網(wǎng)絡(luò)課程管理系統(tǒng),介紹了教師關(guān)心的幾個(gè)方面的數(shù)據(jù)分析方法,為想要分析自己網(wǎng)絡(luò)課程使用情況的教師提供方法借鑒,從而教師能夠更好地調(diào)整網(wǎng)絡(luò)課程的內(nèi)容組成、結(jié)構(gòu)布局,以及教學(xué)方法策略的調(diào)整。同時(shí),本研究也適當(dāng)突破Moodle網(wǎng)絡(luò)課程平臺(tái),提供了在其它網(wǎng)絡(luò)課程平臺(tái)中進(jìn)行數(shù)據(jù)挖掘分析的方法和思路。通過幾個(gè)方面數(shù)據(jù)分析方法的整合,目的是提供一種進(jìn)行網(wǎng)絡(luò)課程數(shù)據(jù)挖掘模式架構(gòu)的研究。今后,研究還應(yīng)深入底層數(shù)據(jù)的分析,提供更具通用性的網(wǎng)絡(luò)課程數(shù)據(jù)挖掘模式方法。
[參考文獻(xiàn)]
[1] 黎加厚. 信息化課程設(shè)計(jì)――Moodle 信息化學(xué)習(xí)環(huán)境創(chuàng)設(shè)[M]. 上海:華東師范大學(xué)出版社,2007.
[2] 張偉遠(yuǎn),段承貴. 網(wǎng)絡(luò)教學(xué)平臺(tái)發(fā)展的全球合作和共建共享[J]. 中國遠(yuǎn)程教育,2012,(10):32-36.
[3] 鄧康橋. workflow技術(shù)在網(wǎng)絡(luò)課程開發(fā)管理系統(tǒng)中的應(yīng)用研究[J].中國遠(yuǎn)程教育,2013,(4):63-68.
[4] 劉納. 基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)學(xué)習(xí)形成性評(píng)價(jià)研究[D]. 上海:華東師范大學(xué),2012.
[5] 李素珍. 基于網(wǎng)絡(luò)學(xué)習(xí)行為分析的網(wǎng)絡(luò)學(xué)習(xí)風(fēng)格與學(xué)習(xí)偏好挖掘模型研究[D]. 武漢:華中師范大學(xué),2009.
[6] 甘振韜,梅文,郭玉軍. 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)課程資源配置中的研究[J]. 中國醫(yī)學(xué)教育技術(shù),2012,26(6):635-638.
關(guān)鍵詞: 數(shù)據(jù)挖掘; 課程內(nèi)容體系; IT專業(yè); 教學(xué)效果
中圖分類號(hào):G642 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2014)11-65-02
Course construction of data mining course for IT specialty in application-oriented university
Li Zhong, Li Shanshan
(Institute of Disaster Prevention, Sanhe, Hebei 065201, China)
Abstract: Aiming at the content differences of data mining course in the application-oriented university, the training objectives and requirement for different specialty are analyzed. The content system and hours arrangements of data mining courses for IT specialty starting are given from the three major functions of data mining. Based on the last two years' student teaching effectiveness of data mining courses, it is concluded that combining theoretical and experimental training content settings with appropriate teaching methods can improve learning interest, stimulate learning enthusiasm, improve operating ability and achieve training objectives.
Key words: data mining; course content system; IT specialty; teaching effectiveness
0 引言
毋庸置疑,我們正處在信息時(shí)代。根據(jù)國際互聯(lián)網(wǎng)管理機(jī)構(gòu)2012年的數(shù)據(jù),每天全球互聯(lián)網(wǎng)流量累計(jì)達(dá)1EB(即10億GB),這意味著每天產(chǎn)生的信息量可以刻滿1.88億張DVD光盤[1]。要想在如此浩瀚的數(shù)字海洋里尋找有用的信息,簡直是大海撈針!因此數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。大概十幾年前,微軟創(chuàng)始人比爾?蓋茨就預(yù)言,數(shù)據(jù)挖掘技術(shù)將是未來計(jì)算機(jī)發(fā)展的重要方向之一,事實(shí)也的確如此。
數(shù)據(jù)挖掘技術(shù)誕生于20世紀(jì)80年代末,是統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科,涉及數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模式識(shí)別、知識(shí)發(fā)現(xiàn)、專家系統(tǒng)、信息檢索、高性能計(jì)算、可視化以及面向?qū)ο蟪绦蛟O(shè)計(jì)等若干學(xué)科知識(shí),在商業(yè)、金融、保險(xiǎn)、體育、勘探、生物技術(shù)等領(lǐng)域獲得廣泛應(yīng)用。也正因?yàn)樵撜n程涉及的內(nèi)容寬泛,要求知識(shí)面寬廣、數(shù)學(xué)基礎(chǔ)扎實(shí)等,前幾年主要在研究生階段開設(shè)。但是隨著信息技術(shù)的快速發(fā)展,本科生能力要求提高,知識(shí)傳授的重心下移,很多高校已在本科階段開設(shè)數(shù)據(jù)挖掘課程,以提高大學(xué)生解決實(shí)際問題的能力,進(jìn)而為課程設(shè)計(jì)和畢業(yè)設(shè)計(jì)打下必要的基礎(chǔ)[2]。
1 國內(nèi)高校本科數(shù)據(jù)挖掘課程開設(shè)現(xiàn)狀
通過院校實(shí)地交流,結(jié)合網(wǎng)絡(luò)搜索,我們已經(jīng)收集了十幾所高校的數(shù)據(jù)挖掘課程教學(xué)大綱,開設(shè)專業(yè)包含有計(jì)算機(jī)類專業(yè)、經(jīng)濟(jì)統(tǒng)計(jì)類專業(yè)、電氣自動(dòng)化類專業(yè)、生物技術(shù)專業(yè)等,各專業(yè)根據(jù)自己的人才培養(yǎng)目標(biāo)制訂教學(xué)大綱、教學(xué)計(jì)劃、考試大綱等,其內(nèi)容存在很大差異。其中985、211高校主要以英語授課,采用國外原版教材,課程內(nèi)容涉及算法、編程較多;而一般院校多采用中文教材,根據(jù)專業(yè)不同,內(nèi)容也有很大差異。
經(jīng)濟(jì)統(tǒng)計(jì)類專業(yè)開設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解什么是數(shù)據(jù)挖掘,以及如何用數(shù)據(jù)挖掘來解決實(shí)際問題,了解如何通過幾種數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型,了解主流數(shù)據(jù)挖掘系統(tǒng)的特點(diǎn),能夠安裝、使用,要求能夠熟練使用典型的挖掘工具對(duì)實(shí)際數(shù)據(jù)進(jìn)行分析,具備從數(shù)據(jù)資源提取信息與知識(shí)并進(jìn)行輔助決策的基本能力。
自動(dòng)化專業(yè)開設(shè)數(shù)據(jù)挖掘課程,要求學(xué)生了解數(shù)據(jù)挖掘概念、原理、過程,學(xué)會(huì)利用數(shù)據(jù)挖掘技術(shù)處理問題,了解有關(guān)數(shù)據(jù)挖掘算法原理,熟練運(yùn)用數(shù)據(jù)挖掘技術(shù)建立數(shù)學(xué)模型,要求能夠熟練使用數(shù)據(jù)挖掘軟件解決問題。
Abstract: The characteristic of data mining technology course and the problems in the course teaching were analyzed. Based on them, some countermeasures were proposed to improve the effect of course teaching of data mining technology.
關(guān)鍵詞: 數(shù)據(jù)挖掘技術(shù);課程;教學(xué)
Key words: data mining technology;course;teaching
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2011)25-0155-01
0 引言
數(shù)據(jù)挖掘技術(shù)是電子商務(wù)專業(yè)的一門重要專業(yè)課程,它是信息化時(shí)代對(duì)信息與數(shù)據(jù)管理的必然要求。一方面,在生產(chǎn)、生活和商業(yè)活動(dòng)中,我們產(chǎn)生了海量的數(shù)據(jù),這些數(shù)據(jù)有著不同的表現(xiàn)形式,如最常見的超市記錄單、各種各樣的公司或商業(yè)數(shù)據(jù)庫,還包括音頻、視頻等;另一方面,我們需要從這些數(shù)據(jù)中尋求規(guī)律,對(duì)數(shù)據(jù)進(jìn)行“挖掘”,使數(shù)據(jù)發(fā)揮更大的作用[1]。數(shù)據(jù)挖掘正是從大量的數(shù)據(jù)中提取出隱含的、以前不為人所知的、可信而有效的知識(shí)[2]。數(shù)據(jù)挖掘技術(shù)教學(xué)的目的就是要使學(xué)生掌握典型的數(shù)據(jù)挖掘技術(shù),并能夠運(yùn)用數(shù)據(jù)挖掘技術(shù)解決實(shí)際問題,為今后運(yùn)用數(shù)據(jù)挖掘技術(shù)解決實(shí)際問題打下扎實(shí)的基礎(chǔ)。
1 數(shù)據(jù)挖掘技術(shù)課程特點(diǎn)
數(shù)據(jù)挖掘技術(shù)具有自己獨(dú)特的課程特點(diǎn):
1.1 新穎性 1995年,在加拿大召開了第一屆知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘國際學(xué)術(shù)會(huì)議(International Conference on Knowledge Discovery and Data Mining),由于把數(shù)據(jù)庫中的數(shù)據(jù)形象地比喻為“礦床”,“數(shù)據(jù)挖掘”一詞很快流傳開來[3]。數(shù)據(jù)挖掘的發(fā)展僅有10余年的時(shí)間,數(shù)據(jù)挖掘技術(shù)課程是一門新興學(xué)科。
1.2 內(nèi)容廣 數(shù)據(jù)挖掘包括關(guān)聯(lián)規(guī)則挖掘、分類規(guī)則挖掘、特征規(guī)則挖掘、時(shí)序規(guī)則挖掘、偏差規(guī)則挖掘、聚類規(guī)則挖掘和預(yù)測(cè)這七大任務(wù),相應(yīng)的,每種任務(wù)都有自己專門的挖掘技術(shù)[4],如關(guān)聯(lián)規(guī)則挖掘的典型技術(shù)為Apriori算法及其衍生技術(shù),分類規(guī)則挖掘的典型技術(shù)為ID3或C4.5決策樹算法及其改進(jìn)算法等。
1.3 有深度 數(shù)據(jù)挖掘技術(shù)作為一門計(jì)算機(jī)與數(shù)據(jù)處理相結(jié)合的新興學(xué)科,具有一定的難度。其中的任何一個(gè)技術(shù)都可以獨(dú)立成篇,如粗糙集分類算法自原理至實(shí)例推廣就是一門單獨(dú)的課程;作為數(shù)據(jù)處理的重要內(nèi)容,聚類算法同樣可以獨(dú)立成籍。
1.4 交叉性 誠如前面所述,數(shù)據(jù)挖掘技術(shù)有著廣泛的支撐背景,既包括信息論方法和集合論方法等歸納學(xué)習(xí)類技術(shù),又包括神經(jīng)網(wǎng)絡(luò)方法、遺傳算法方法、蟻群算法等仿生物技術(shù),還包括成熟的統(tǒng)計(jì)分析技術(shù)和模糊數(shù)學(xué)技術(shù),此外還有公式發(fā)現(xiàn)類技術(shù)和可視化技術(shù)等。可以這樣說,數(shù)據(jù)挖掘總是在廣泛吸取其他各門學(xué)科的先進(jìn)技術(shù),并加以轉(zhuǎn)化、發(fā)展的。
2 數(shù)據(jù)挖掘技術(shù)教學(xué)過程存在的問題剖析
數(shù)據(jù)挖掘技術(shù)作為一門新學(xué)科、新課程,發(fā)展迅速,但是其缺點(diǎn)也是不言而喻的,主要包括:
2.1 課程教材不統(tǒng)一 目前,數(shù)據(jù)挖掘技術(shù)的教材層出不窮,這些教材盡管總體涵蓋內(nèi)容相近,均自成體系,但是有的細(xì)節(jié)卻并不一致,如多數(shù)教材主張采用E-R圖進(jìn)行數(shù)據(jù)倉庫(數(shù)據(jù)挖掘通??偸桥c數(shù)據(jù)倉庫連接在一起的)設(shè)計(jì),但也有教材持反駁態(tài)度[3];對(duì)數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)說法也不盡一致,不同的教材給出不同的體系結(jié)構(gòu),有的甚至將數(shù)據(jù)結(jié)構(gòu)等同于體系結(jié)構(gòu)[5]。這主要是由于學(xué)科和課程的新穎性導(dǎo)致的,使得教材的編寫多帶有研究探索的性質(zhì),未能達(dá)成統(tǒng)一。
2.2 教學(xué)重點(diǎn)不統(tǒng)一 教材的不統(tǒng)一和學(xué)時(shí)的不統(tǒng)一(如有的院校是36課時(shí),有的是48課時(shí))導(dǎo)致教學(xué)重點(diǎn)也不統(tǒng)一,有的考慮到學(xué)生掌握知識(shí)的淺顯性,將重點(diǎn)放在統(tǒng)計(jì)分析技術(shù),而對(duì)神經(jīng)網(wǎng)絡(luò)技術(shù)和遺傳算法技術(shù)等相對(duì)較難的技術(shù)一筆帶過;有的則考慮到體系的完整性,對(duì)所有數(shù)據(jù)挖掘技術(shù)等同對(duì)待,均勻筆墨。
2.3 教學(xué)方式不統(tǒng)一 數(shù)據(jù)挖掘技術(shù)是一門實(shí)驗(yàn)技術(shù)較強(qiáng)的課程,但是有的教師在安排授課時(shí),僅設(shè)置理論課時(shí),沒有實(shí)驗(yàn)課時(shí);有的教師則將課程直接放在實(shí)驗(yàn)室來上,偏重于對(duì)學(xué)生實(shí)驗(yàn)技巧的掌握。當(dāng)然,更多的是將實(shí)驗(yàn)課時(shí)與理論課時(shí)交錯(cuò)進(jìn)行的。對(duì)實(shí)驗(yàn)安排的處理也不盡相同,有的分組進(jìn)行,有的則由學(xué)生獨(dú)立完成。
3 提高數(shù)據(jù)挖掘技術(shù)課程效果的對(duì)策建議
3.1 精心編排課程講義 課程教材是授課的首要基礎(chǔ),一本好的教材不僅便于教師的備課、授課,更有利于學(xué)生的理解。當(dāng)然,教材與課時(shí)、教學(xué)大綱有著密切關(guān)系,教師在選擇教材時(shí)應(yīng)充分考慮學(xué)生的學(xué)科基礎(chǔ)、授課課時(shí)數(shù)、教學(xué)大綱規(guī)定的培養(yǎng)目標(biāo)等各種因素,從大量層出不窮的教材中選擇最理想的教材,適當(dāng)?shù)臅r(shí)候也可根據(jù)相關(guān)教材,整理一份恰當(dāng)?shù)闹v義教材,組織學(xué)生使用。
3.2 合理安排教學(xué)內(nèi)容 數(shù)據(jù)挖掘技術(shù)的教學(xué)內(nèi)容應(yīng)考到學(xué)科體系的完整性,既要為學(xué)生打牢理論基礎(chǔ),又要突出學(xué)生實(shí)踐能力的培養(yǎng)。因此要以“掌握理論、強(qiáng)化應(yīng)用、突出能力”作為數(shù)據(jù)挖掘技術(shù)課程的培養(yǎng)目標(biāo),通過精選具有充分代表性、源于實(shí)際問題的典型例題與案例,使它們能基本覆蓋在實(shí)際中最常見的數(shù)據(jù)挖掘問題,在講解這些從實(shí)踐中抽取并經(jīng)過精心改造和設(shè)計(jì)的例題和案例的過程中,逐步地建立起學(xué)生應(yīng)該掌握的數(shù)據(jù)挖掘技術(shù)理論框架。
4 結(jié)束語
數(shù)據(jù)挖掘技術(shù)教學(xué)具有十分重要的現(xiàn)實(shí)意義,通過科學(xué)講述數(shù)據(jù)挖掘技術(shù),有助于培養(yǎng)學(xué)生對(duì)理論知識(shí)的現(xiàn)實(shí)應(yīng)用轉(zhuǎn)化能力,培養(yǎng)學(xué)生從現(xiàn)實(shí)世界出發(fā)提出問題、分析問題和解決問題的能力。數(shù)據(jù)挖掘技術(shù)的教學(xué)應(yīng)以培養(yǎng)學(xué)生能力為主線,精心組織教學(xué)內(nèi)容,有效采用多種方式,增進(jìn)學(xué)生對(duì)知識(shí)的理解與掌握,顯著提高教學(xué)效果與質(zhì)量。
參考文獻(xiàn):
[1]陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2006.
[2]Jiawei Han,Micheline Kamber著.范明,孟小峰譯.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.
[3]周根貴.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].杭州:浙江大學(xué)出版社,2004.
【關(guān)鍵詞】客戶關(guān)系管理;數(shù)據(jù)挖掘;流程;模型
隨著市場經(jīng)濟(jì)的發(fā)展,企業(yè)將面臨強(qiáng)大的競爭壓力,企業(yè)的產(chǎn)品越來越趨向于同質(zhì)化,僅僅依靠產(chǎn)品本身很難在日趨激烈的競爭中取勝,所以愈來愈多的先進(jìn)企業(yè)將重點(diǎn)從以產(chǎn)品為中心向以客戶為中心的新型商業(yè)模式轉(zhuǎn)移,客戶關(guān)系管理(CRM)也就應(yīng)運(yùn)而生??蛻絷P(guān)系管理(Customer Relationship Management)簡稱CRM,是由美國的Gartner Group me公司于1999年首先提出的。CRM是一種以客戶為中心的經(jīng)營策略,它以信息技術(shù)為手段,并對(duì)工作流程進(jìn)行重組,以賦予企業(yè)更完善的客戶交流能力,最大化客戶的收益率。CRM就是企業(yè)為了保持競爭力,采取的面向客戶、客戶驅(qū)動(dòng)和以客戶為中心的發(fā)展策略。而企業(yè)在與客戶交互過程中積累下來的各種客戶數(shù)據(jù)恰恰是反映客戶特征和需求的最佳載體。當(dāng)今許多企業(yè)的數(shù)據(jù)庫或數(shù)據(jù)倉庫中都搜集和存儲(chǔ)了大量關(guān)于客戶的寶貴數(shù)據(jù),這些數(shù)據(jù)涵蓋了從客戶基本數(shù)據(jù)、購買記錄及客戶反饋的個(gè)個(gè)環(huán)節(jié)。充分利用這些數(shù)據(jù),深入分析、挖掘隱含在這些數(shù)據(jù)中的有用信息,將有助于企業(yè)更好地管理客戶關(guān)系,實(shí)現(xiàn)CRM的功能和目標(biāo)。然而,由于缺乏在大量數(shù)據(jù)中發(fā)現(xiàn)深層次信息的能力,許多企業(yè)對(duì)于這些數(shù)據(jù)的利用還只是停留在基礎(chǔ)層的瀏覽、檢索、查詢和應(yīng)用層的繼承、組合、整理等方面,而無法將這些數(shù)據(jù)轉(zhuǎn)化為更加有用的知識(shí)。因此,如何更加有效地管理企業(yè)數(shù)據(jù)庫中快速增長的海量數(shù)據(jù),將數(shù)據(jù)資源的利用提高到知識(shí)創(chuàng)新的高級(jí)階段,已經(jīng)成為企業(yè)當(dāng)前需要迫切解決的問題,數(shù)據(jù)挖掘(Data Mining簡稱DM)技術(shù)的運(yùn)用就可以幫助企業(yè)很好地解決這個(gè)問題。
一、數(shù)據(jù)挖掘的流程
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的和有用的信息和知識(shí)的過程,它可以按照企業(yè)既定的業(yè)務(wù)目標(biāo)自動(dòng)地從數(shù)據(jù)庫中提取出用以輔助企業(yè)決策的相關(guān)模式。數(shù)據(jù)挖掘的流程圖如下:
圖1中各步驟(1)確定業(yè)務(wù)對(duì)象。清晰地定義出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測(cè)的,但要探索的問題應(yīng)是有預(yù)見的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有一盲目性,是不會(huì)成功的。(2)數(shù)據(jù)準(zhǔn)備。一是數(shù)據(jù)的選擇。搜索所有與業(yè)務(wù)對(duì)象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。二是數(shù)據(jù)的預(yù)處理。研究數(shù)據(jù)的質(zhì)量,為進(jìn)一步的分析做準(zhǔn)備。并確定將要進(jìn)行的挖掘操作的類型。三是數(shù)據(jù)的轉(zhuǎn)換。將數(shù)據(jù)轉(zhuǎn)換成一個(gè)分析模型,這個(gè)分析模型是針對(duì)挖掘算法建立的。建立一個(gè)真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵。(3)數(shù)據(jù)挖掘。對(duì)所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動(dòng)地完成。(4)結(jié)果分析。解釋并評(píng)估結(jié)果,其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù)。(5)知識(shí)的同化。將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
二、數(shù)據(jù)挖掘流程的模型
數(shù)據(jù)挖掘業(yè)內(nèi),公認(rèn)的兩大模型是SAS的SEMMA和包括SPSS在內(nèi)的行業(yè)協(xié)會(huì)提出的CRISP-DM。SEMMA強(qiáng)調(diào)的是應(yīng)用的方法;CRISP-DM則從方法學(xué)的角度強(qiáng)調(diào)實(shí)施數(shù)據(jù)挖掘項(xiàng)目的方法和步驟。CRISP-DM是站在高處,在講一個(gè)總體大方向;而SEMMA在說具體應(yīng)該如何著手。
1.SEMMA。(1)Sample──數(shù)據(jù)取樣。當(dāng)進(jìn)行數(shù)據(jù)挖掘時(shí),首先要從企業(yè)大量數(shù)據(jù)中取出一個(gè)與企業(yè)要探索問題相關(guān)的樣板數(shù)據(jù)子集。通過數(shù)據(jù)取樣,要把好數(shù)據(jù)的質(zhì)量關(guān),一定要保證取樣數(shù)據(jù)的代表性、真實(shí)性、完整性和有效性,這樣才能通過此后的分析研究得出反映本質(zhì)規(guī)律性的結(jié)果。根據(jù)具體的需求,可以創(chuàng)建訓(xùn)練集、測(cè)試集和效驗(yàn)集。(2)Explore──數(shù)據(jù)特征探索、分析和預(yù)處理。當(dāng)用戶拿到了一個(gè)樣本數(shù)據(jù)集后,它是否達(dá)到用戶原來設(shè)想的要求,有沒有什么明顯的規(guī)律和趨勢(shì),有沒有出現(xiàn)用戶所從未設(shè)想過的數(shù)據(jù)狀態(tài),各因素之間有什么相關(guān)性,可區(qū)分成怎樣一些類別,這些都是首先要探索的內(nèi)容。(3)Modify──數(shù)據(jù)調(diào)整和技術(shù)選擇。在問題進(jìn)一步明確化的基礎(chǔ)上,用戶可以按照問題的具體要求來審視數(shù)據(jù)集,看它是否適應(yīng)企業(yè)問題的需要。針對(duì)問題的需要,可能要對(duì)數(shù)據(jù)進(jìn)行增刪,也可能按照用戶對(duì)整個(gè)數(shù)據(jù)挖掘過程的新認(rèn)識(shí),組合或者生成一些新的變量,以體現(xiàn)對(duì)狀態(tài)的有效描述。(4)Model──模型的研發(fā)和知識(shí)的發(fā)現(xiàn)。數(shù)理統(tǒng)計(jì)方法是數(shù)據(jù)挖掘工作中最常用的主流技術(shù)手段。應(yīng)用SAS提供的多種分析工具不僅能揭示企業(yè)已有數(shù)據(jù)間的新關(guān)系、隱藏著的規(guī)律性,而且能預(yù)測(cè)事件的發(fā)展趨勢(shì)。用戶采用哪一種模型,主要取決于數(shù)據(jù)集的特征和用戶要實(shí)現(xiàn)的目標(biāo)。另一方面,數(shù)據(jù)挖掘是一個(gè)反復(fù)的不斷深化的實(shí)踐過程,用戶可在實(shí)踐中選出最適合的模型。(5)Assess──模型和知識(shí)的綜合解釋和評(píng)價(jià)。經(jīng)過以上五個(gè)步驟,用戶將會(huì)得出一系列的分析結(jié)果、模式或模型,常常是對(duì)目標(biāo)問題多側(cè)面的描述。這時(shí),就要能很好地綜合這些規(guī)律性,為企業(yè)提供合理的決策支持信息。
2.CRISP-DM。(1)業(yè)務(wù)理解(Business Understanding)。最初的階段集中在理解項(xiàng)目目標(biāo)和從業(yè)務(wù)的角度理解需求,同時(shí)將這個(gè)知識(shí)轉(zhuǎn)化為數(shù)據(jù)挖掘問題的定義和完成目標(biāo)的初步計(jì)劃。(2)數(shù)據(jù)理解(Data Understanding)。數(shù)據(jù)理解階段從初始的數(shù)據(jù)收集開始,通過一些活動(dòng)的處理,目的是熟悉數(shù)據(jù),識(shí)別數(shù)據(jù)的質(zhì)量問題,首次發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部屬性,或是探測(cè)引起興趣的子集去形成隱含信息的假設(shè)。(3)數(shù)據(jù)準(zhǔn)備(Data
Preparation)。數(shù)據(jù)準(zhǔn)備階段包括從未處理數(shù)據(jù)中構(gòu)造最終數(shù)據(jù)集的所有活動(dòng)。這些數(shù)據(jù)將是模型工具的輸入值。這個(gè)階段的任務(wù)有個(gè)能執(zhí)行多次,沒有任何規(guī)定的順序。任務(wù)包括表、記錄和屬性的選擇,以及為模型工具轉(zhuǎn)換和清洗數(shù)據(jù)。(4)建模(Modeling)。在這個(gè)階段,可以選擇和應(yīng)用不同的模型技術(shù),模型參數(shù)被調(diào)整到最佳的數(shù)值。一般,有些技術(shù)可以解決一類相同的數(shù)據(jù)挖掘問題。有些技術(shù)在數(shù)據(jù)形成上有特殊要求,因此需要經(jīng)常跳回到數(shù)據(jù)準(zhǔn)備階段。(5)評(píng)估(Evaluation)。在開始最后部署模型之前,重要的事情是徹底地評(píng)估模型,檢查構(gòu)造模型的步驟,確保模型可以完成業(yè)務(wù)目標(biāo)。此階段的關(guān)鍵目的是確定是否有重要業(yè)務(wù)問題沒有被充分的考慮。在這個(gè)階段結(jié)束后,一個(gè)數(shù)據(jù)挖掘結(jié)果使用的決定必須達(dá)成。(6)部署(Deployment)。通常,模型的創(chuàng)建不是項(xiàng)目的結(jié)束。模型的作用是從數(shù)據(jù)中找到知識(shí),獲得的知識(shí)需要便于用戶使用的方式重新組織和展現(xiàn)。根據(jù)需求,這個(gè)階段可以產(chǎn)生簡單的報(bào)告,或?qū)崿F(xiàn)一個(gè)比較復(fù)雜的、可重復(fù)的數(shù)據(jù)挖掘過程。
參考文獻(xiàn)
[1]Margaret H.Dunham.數(shù)據(jù)挖掘教程[M].清華大學(xué)出版社,2005
[2]魏兵.?dāng)?shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用研究[D].南京理工大學(xué)碩士.2005
[3]章兢,張小剛.?dāng)?shù)據(jù)挖掘算法及其工程應(yīng)用[M].機(jī)械工業(yè)出版社,2006(6):56~73
[4]趙閃.?dāng)?shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究[D].廣東工業(yè)大學(xué)碩士學(xué)位論文.2007
[5]邵兵家,于同奎.客戶關(guān)系管理一理論與實(shí)踐[M].清華大學(xué)出版社,2004
[6]賈月娥.客戶關(guān)系管理趨勢(shì)談[J].管理信息化.2003
關(guān)鍵詞:數(shù)據(jù)挖掘;教務(wù)管理;決策支持
中圖分類號(hào):G647 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)13-0010-03
近年來,隨著高等學(xué)校擴(kuò)招以及計(jì)算機(jī)在管理中的普及應(yīng)用,學(xué)校教學(xué)管理系統(tǒng)積累了大量的數(shù)據(jù)。目前,這些數(shù)據(jù)只是用于簡單的成績分析,并未能充分用于規(guī)律分析和處理,未在學(xué)校管理和決策起到應(yīng)有的作用。因此,利用數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生成績數(shù)據(jù)進(jìn)行深層次分析,找出其中各種潛在模式及影響因素,將對(duì)學(xué)生選修課個(gè)性化管理、課程設(shè)置、教學(xué)計(jì)劃制訂和教學(xué)實(shí)踐有重要的指導(dǎo)作用[1-3]。本文針對(duì)高等院校教學(xué)管理系統(tǒng)普遍存在的問題,提出了將數(shù)據(jù)挖掘技術(shù)應(yīng)用到本科生成績管理、分析和實(shí)踐,通過從學(xué)生成績數(shù)據(jù)中挖掘潛在的、有用的信息,目標(biāo)是為教學(xué)管理者提供決策,為學(xué)生選課提供支持。
一、數(shù)據(jù)挖掘的概念
1989年,在第11界國際人工智能的專題研討會(huì)上,學(xué)者們提出了基于挖掘的知識(shí)發(fā)現(xiàn)(KDD)概念。1995年在美國計(jì)算機(jī)年會(huì)上,一些學(xué)者開始把數(shù)據(jù)挖掘視為數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)的一個(gè)基本步驟或把兩者視為進(jìn)義詞討論[4,5]。所謂數(shù)據(jù)挖掘(Data Mining),就是從大量、不完全、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含的、未知的、具有潛在應(yīng)用價(jià)值的信息和知識(shí)的過程。其主要特征表現(xiàn)為:數(shù)據(jù)源必須是真實(shí)的、大量的;挖掘加工出用戶感興趣的知識(shí);形成的知識(shí)要可接受、可理解、可運(yùn)用。通過數(shù)據(jù)挖掘,可以幫助決策者尋找規(guī)律,發(fā)現(xiàn)被忽略的要素,預(yù)測(cè)趨勢(shì),并用于決策。數(shù)據(jù)挖掘是對(duì)數(shù)據(jù)內(nèi)在和本質(zhì)的高度抽象與概括,是對(duì)數(shù)據(jù)從感性認(rèn)識(shí)到理性認(rèn)識(shí)的升華。數(shù)據(jù)挖掘又被稱為知識(shí)發(fā)現(xiàn)(Knowledge Discovery,KD),因此許多知識(shí)發(fā)現(xiàn)中的算法,如人工智能,也常常被使用于數(shù)據(jù)挖掘過程中。數(shù)據(jù)挖掘一般以下7個(gè)步驟:(1)數(shù)據(jù)清理:消除噪聲和不一致數(shù)據(jù)。(2)數(shù)據(jù)集成:可以把多種數(shù)據(jù)源組合在一起,將數(shù)據(jù)結(jié)果放在數(shù)據(jù)倉庫中。(3)數(shù)據(jù)選擇:從數(shù)據(jù)庫中提取與分析任務(wù)相關(guān)的數(shù)據(jù)。(4)數(shù)據(jù)變換:通過匯總或聚集操作把數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式。(5)數(shù)據(jù)挖掘:使用智能方法提取數(shù)據(jù)模式。(6)模式評(píng)估:根據(jù)用戶某興趣度度量,識(shí)別表示知識(shí)的真正有趣的模式。(7)知識(shí)表示:實(shí)用可視化和知識(shí)表示及技術(shù)向用戶提供挖掘的有用知識(shí)。
二、數(shù)據(jù)挖掘技術(shù)在本科教學(xué)管理中的應(yīng)用
大學(xué)本科教學(xué)管理,一般涉及了學(xué)生成績管理、選課管理、學(xué)生評(píng)教等幾部分內(nèi)容,其實(shí)質(zhì)上也是一個(gè)數(shù)據(jù)分析、加工利用和決策管理的過程。因此,利用上述數(shù)據(jù)挖掘的方法,對(duì)大學(xué)本科教學(xué)管理數(shù)據(jù)進(jìn)行深層次的分析,可以將人們對(duì)數(shù)據(jù)的應(yīng)用從低層的數(shù)據(jù)查詢提升到?jīng)Q策支持、信息預(yù)測(cè),在教學(xué)管理的諸多方面發(fā)揮著重要作用。
1.本科生成績的挖掘加工。學(xué)生成績是評(píng)價(jià)教學(xué)質(zhì)量的重要依據(jù),也是評(píng)價(jià)學(xué)生對(duì)所學(xué)知識(shí)掌握程度的重要標(biāo)志,在高等教育質(zhì)量評(píng)價(jià)中居于重要位置。所以通過對(duì)學(xué)生的成績進(jìn)行分析和挖掘,可以為教學(xué)管理者提供改善教學(xué)條件,加強(qiáng)教學(xué)管理,深化教學(xué)改革,提高教學(xué)質(zhì)量等方面的重要依據(jù)。利用數(shù)據(jù)挖掘技術(shù),通過不同范圍、不同角度分析學(xué)生的成績和分布規(guī)律,挖掘影響學(xué)生成績的因素。主要包括:①統(tǒng)計(jì)分析各門課程成績分布,包括最高分、最低分、及格率等;分析各門成績之間的關(guān)系。②按班級(jí)分析學(xué)生成績分布,以及影響班級(jí)成績的因素。生成各年級(jí)成績分布情況排名,年級(jí)成績分布曲線。③不同任課教師給予的學(xué)生平均成績;學(xué)生成績與教師學(xué)歷、職稱,教學(xué)經(jīng)驗(yàn)之間的關(guān)系。④各生源地成績分布,生源地與學(xué)生成績間的關(guān)系。利用關(guān)聯(lián)分析或分類分析,可以發(fā)現(xiàn)一些普遍性的現(xiàn)象。如通過分析學(xué)生的成績,可能發(fā)現(xiàn)“高等數(shù)學(xué)”成績好的學(xué)生,其在計(jì)算機(jī)語言類課程的成績也好。但這種分析,也可能導(dǎo)致對(duì)暫時(shí)不具有普遍性課程的忽略。
2.學(xué)生選課信息的挖掘分析。選課就是學(xué)生利用計(jì)算機(jī)軟件選擇自己所上的課程。選課數(shù)據(jù)中可能隱藏著對(duì)教學(xué)管理具有重要的參考價(jià)值,數(shù)據(jù)挖掘技術(shù)可以用來找出這些隱藏在數(shù)據(jù)背后的信息和知識(shí)。主要可從以下幾個(gè)方面進(jìn)行分析挖掘:分析各門課的課程歸屬和所占學(xué)分,確定學(xué)生選課時(shí)對(duì)不同課程歸屬課的學(xué)分多少的考慮;分析各門課的選課人數(shù),確定課程的歡迎程度;分析各門課選課率,了解學(xué)生對(duì)目前課程安排中的滿意程度;分析某門課程的選課學(xué)生情況,了解選擇當(dāng)前課程的學(xué)生的專業(yè)情況;分析各門課程的任課教師情況,了解任課教師的實(shí)際情況和綜合能力。具體的挖掘步驟可按如下進(jìn)行:①首先要對(duì)選課的原始數(shù)據(jù)進(jìn)行預(yù)處理,把其原始數(shù)據(jù)采樣后轉(zhuǎn)換成適合數(shù)據(jù)挖掘的數(shù)據(jù)。由數(shù)據(jù)收集階段得到的數(shù)據(jù)可能有一定的“污染”,表現(xiàn)在數(shù)據(jù)可能存在自身的不一致性,或者有缺失數(shù)據(jù)的存在等,因此要進(jìn)行抽樣與清理。在處理的過程中,要明晰數(shù)據(jù)的上下結(jié)構(gòu)和面向?qū)ο?,為?shù)據(jù)挖掘作好準(zhǔn)備。②完成數(shù)據(jù)的預(yù)處理之后,確定參與挖掘的數(shù)據(jù)表,在教務(wù)選課系統(tǒng)中學(xué)生選課表是基本事實(shí)表,課程信息表、學(xué)生信息表和教師信息表可作為維表。③最后將預(yù)處理之后的數(shù)據(jù)進(jìn)行狀態(tài)運(yùn)行,在此基礎(chǔ)上選擇合適的數(shù)據(jù)挖掘算法進(jìn)行數(shù)據(jù)挖掘。數(shù)據(jù)挖掘通過匯總或聚集操作將數(shù)據(jù)變換或統(tǒng)一成適合挖掘的形式,可單獨(dú)利用也可綜合利用各種數(shù)據(jù)挖掘方法對(duì)數(shù)據(jù)進(jìn)行分析,挖掘用戶所需要的各種規(guī)則、趨勢(shì)、類別、模型等。挖掘的最終結(jié)果可以用可視化的圖形方式表現(xiàn)出來。根據(jù)挖掘的結(jié)果,得出選課背后隱藏的各種數(shù)據(jù)信息,如某些專業(yè)的學(xué)生喜歡選某位老師所開設(shè)的相關(guān)課程,部分學(xué)生總是選擇學(xué)分較多的有更多上機(jī)機(jī)會(huì)的課程等等。
3.學(xué)生評(píng)教信息挖掘分析。合理評(píng)價(jià)教學(xué)的技術(shù)水平是衡量一個(gè)學(xué)校教育質(zhì)量的重要標(biāo)準(zhǔn)。教學(xué)評(píng)價(jià)就是根據(jù)教學(xué)目標(biāo)和教學(xué)計(jì)劃的要求,系統(tǒng)全面地收集數(shù)據(jù),對(duì)教學(xué)過程中的教學(xué)活動(dòng)以及教學(xué)成果給予判斷的過程。評(píng)教內(nèi)容一般包括對(duì)學(xué)生“學(xué)”的評(píng)價(jià)和對(duì)教師“教”的評(píng)價(jià)。下面以學(xué)生綜合測(cè)評(píng)指標(biāo)和學(xué)生評(píng)教指標(biāo)為例,將關(guān)聯(lián)規(guī)則和粗糙集理論應(yīng)用于評(píng)價(jià)系統(tǒng),通過對(duì)各指標(biāo)的排序、約簡等,在一定程度上對(duì)評(píng)價(jià)指標(biāo)優(yōu)化,討論把數(shù)據(jù)挖掘技術(shù)引入學(xué)生評(píng)教指標(biāo)優(yōu)化和信息分析。另一方面,評(píng)定學(xué)生的學(xué)習(xí)行為,既可對(duì)學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動(dòng)機(jī)的作用,又是檢查課程計(jì)劃、教學(xué)程序以至教學(xué)目的的手段。同時(shí),考查學(xué)生個(gè)別差異,便于因材施教的途徑。評(píng)價(jià)要遵循“評(píng)價(jià)內(nèi)容要全面、評(píng)價(jià)方式要多元化、多次化、注重自評(píng)與互評(píng)的有機(jī)結(jié)合”的原則。利用數(shù)據(jù)挖掘工具對(duì)學(xué)生的學(xué)習(xí)成績數(shù)據(jù)庫、行為記錄數(shù)據(jù)庫、獎(jiǎng)勵(lì)處罰數(shù)據(jù)庫等進(jìn)行分析處理,可以及時(shí)得到學(xué)生的評(píng)價(jià)結(jié)果,對(duì)學(xué)生出現(xiàn)的不良學(xué)習(xí)行為進(jìn)行及時(shí)指正。同時(shí),還能夠克服教師主觀評(píng)價(jià)的不公正、不客觀的弱點(diǎn),減輕教師的工作量。另外,將關(guān)聯(lián)規(guī)則運(yùn)用于教學(xué)評(píng)價(jià)數(shù)據(jù)中,可以探討教學(xué)效果的好壞與教師年齡、職稱之間的關(guān)系、學(xué)生各項(xiàng)素質(zhì)指標(biāo)之間的關(guān)系等,用來及時(shí)地對(duì)教師的教學(xué)和專業(yè)發(fā)展以及學(xué)生的學(xué)習(xí)和個(gè)性發(fā)展提供指導(dǎo),這是非常有意義的。
4.教師信息的挖掘分析。教師信息是本科教學(xué)管理中的重要方面,如使教學(xué)評(píng)價(jià)過程科學(xué)化,增強(qiáng)教學(xué)工作的預(yù)測(cè)功能和評(píng)價(jià)功能,為教學(xué)的客觀決策和客觀評(píng)價(jià)教師、了解教師的教學(xué)質(zhì)量提供了一種比較合理的管理依據(jù)。主要包括:①教師個(gè)人信息:包括教師學(xué)歷情況、職稱情況、科研情況、研究方向、級(jí)別、工作經(jīng)歷等各種信息,可運(yùn)用關(guān)聯(lián)規(guī)則方法對(duì)教學(xué)評(píng)價(jià)結(jié)果和教師個(gè)人信息一起進(jìn)行挖掘,從而得出影響教學(xué)結(jié)果的潛在的教師個(gè)人信息的部分情況。②教師素質(zhì):包括教師的思想政治素質(zhì)、道德素質(zhì)、文化素質(zhì)、智能素質(zhì)、心理素質(zhì)、身體素質(zhì)、外在素質(zhì)等七個(gè)方面,通過數(shù)據(jù)挖掘技術(shù)在學(xué)生成績或者相應(yīng)的調(diào)查信息的挖掘,看出哪些因素對(duì)教學(xué)方面有較大影響,切實(shí)加強(qiáng)教師在哪些素質(zhì)方面的培養(yǎng)和提高,從而有利于教學(xué)管理方法的制定和實(shí)施。③教師績效:包括教師的工作業(yè)績、工作態(tài)度、工作技能等方面的綜合考核。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從教學(xué)評(píng)價(jià)數(shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘,查詢教學(xué)效果與教師的工作態(tài)度、工作技能等的各種關(guān)聯(lián),找到教師的教學(xué)效果與教師績效的關(guān)系問題,合理調(diào)配一門課程的上課老師,使學(xué)生能夠較好地保持良好的學(xué)習(xí)狀態(tài),從而為教學(xué)部門提供了決策支持信息。
我國高校的教學(xué)管理長期沿用經(jīng)驗(yàn)管理模式,往往難以避免管理滯后的弊端,尤其是近年來隨著教學(xué)管理中產(chǎn)生的數(shù)據(jù)急劇增加以及對(duì)信息量的更高要求,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教學(xué)管理系統(tǒng)中,必將為各教學(xué)管理部門的決策提供切實(shí)可行的依據(jù),可以促進(jìn)教育管理的進(jìn)一步改革、完善和發(fā)展。對(duì)數(shù)據(jù)挖掘工具的有效利用,能夠客觀地反映教學(xué)系統(tǒng)中存在的問題,為實(shí)現(xiàn)高校的教學(xué)改革,將來在激烈的競爭中掌握主動(dòng),從而提高管理的科學(xué)性、針對(duì)性和高效率。
參考文獻(xiàn):
[1]梁循.數(shù)據(jù)挖掘算法與應(yīng)用[M].北京:北京大學(xué)出版社,2006.
[2]劉曉霞.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī),2008,(285):115-116.
[3]張玉林.數(shù)據(jù)挖掘技術(shù)在教學(xué)過程中的指導(dǎo)作用[J].西安通信學(xué)院學(xué)報(bào),2006,(02):38-40.
[4]陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2006.
關(guān)鍵詞:數(shù)據(jù)挖掘;信息處理;教學(xué)管理
中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
Application Analysis of Data Mining Technology in Teaching Management
DONG Jun-kai
(Yanshan University, Hebei Qinhuangdao 066004)
Key words:data mining;information processing;teaching management
隨著信息技術(shù)在高校管理中的普及,在教學(xué)管理中積累了海量的各種數(shù)據(jù)。這些與教學(xué)相關(guān)的數(shù)據(jù)已經(jīng)形成一個(gè)完整的信息數(shù)據(jù)庫。在當(dāng)今信息化條件下,對(duì)這些數(shù)據(jù)進(jìn)行處理、分析和挖掘,目的是想發(fā)現(xiàn)對(duì)學(xué)校教學(xué)管理、學(xué)生管理等各個(gè)方面有作用的指導(dǎo)信息。這些知識(shí)可以輔助學(xué)校管理者決策,提高學(xué)校的綜合實(shí)力,同時(shí)也可以為學(xué)校提高教學(xué)質(zhì)量,優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)[1]。
數(shù)據(jù)挖掘(Data Mining ,DM) 是一個(gè)多學(xué)科交叉融合而形成的新興學(xué)科,已經(jīng)被廣泛應(yīng)用于社會(huì)階層各個(gè)行業(yè)的多個(gè)方面。DM已經(jīng)在許多領(lǐng)域取得令人滿意的應(yīng)用效果。在教育方面,隨著數(shù)據(jù)信息的不斷增長,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校管理當(dāng)中,可以促進(jìn)教育體制的完善、發(fā)展以及必要的改革。DM技術(shù)能客觀地反映高校管理中存在的一些問題,為制定學(xué)校的方針政策提供重要依據(jù)。隨著教育信息化進(jìn)程的推進(jìn),將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育中,從大量的教育數(shù)據(jù)中發(fā)現(xiàn)隱藏的、有用的知識(shí)來指導(dǎo)教育、發(fā)展教育,成為當(dāng)今勢(shì)在必行的重要的研究課題[2]。
1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(DM, Data Mining) 就是從大量的、不完全、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的,但又是潛在有用的信息和知識(shí)(模型或規(guī)則)的過程,是一類深層次的數(shù)據(jù)分析方法。它是一門交叉學(xué)科,包括機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫、模式識(shí)別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)評(píng)價(jià)無疑是非常有益的,它可以全面地分析教學(xué)評(píng)價(jià)結(jié)果與各種因素之間隱藏的內(nèi)在聯(lián)系。
隨著數(shù)據(jù)挖掘技術(shù)的成熟及應(yīng)用領(lǐng)域的不斷擴(kuò)展,許多高校研究人員已開始研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校教學(xué)管理中,這對(duì)提高學(xué)校的管理水平起到了很好的作用。利用數(shù)據(jù)挖掘技術(shù)可以從教學(xué)管理的各個(gè)層面,精確地展現(xiàn)目前存在的許多潛在的有用的各種信息。通過把數(shù)據(jù)挖掘技術(shù)引入到教學(xué)管理中,可以找出教學(xué)管理中存在的潛在因素,從而制定對(duì)應(yīng)的措施,進(jìn)一步引導(dǎo)學(xué)生學(xué)習(xí)積極性,最終提高教學(xué)質(zhì)量,增強(qiáng)教學(xué)效果。
2 數(shù)據(jù)挖掘技術(shù)在教學(xué)中的應(yīng)用
數(shù)據(jù)挖掘可以看成是一種決策支持過程,是深層次的數(shù)據(jù)信息分析方法,把數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校信息管理
是非常有幫助的,可以全面地分析各種因素之間隱藏的內(nèi)在聯(lián)系。數(shù)據(jù)挖掘技術(shù)在教學(xué)管理的各個(gè)方面都有典型的應(yīng)用,如學(xué)生信息、教師信息方面等,其中最常見的是在教學(xué)質(zhì)量評(píng)價(jià)結(jié)果和成績分析中的應(yīng)用??紤]到數(shù)據(jù)挖掘在教學(xué)質(zhì)量評(píng)價(jià)結(jié)果和成績分析這方面的論文已經(jīng)非常廣泛,因此這里只給出其他方面的應(yīng)用。
2.1對(duì)教師方面信息的挖掘
數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)管理中,對(duì)教學(xué)水平的提高有著積極作用。如使教學(xué)評(píng)價(jià)過程科學(xué)化,增強(qiáng)教學(xué)工作的預(yù)測(cè)功能和評(píng)價(jià)功能,為教學(xué)的客觀決策和客觀評(píng)價(jià)教師、了解教師的教學(xué)質(zhì)量提供了一種比較合理的管理依據(jù),為教師教學(xué)質(zhì)量的提高提出了一種新的分析思路和研究方法[3]。
(1)課堂教學(xué)信息:課堂教學(xué)是評(píng)價(jià)教師教學(xué)水平的重要依據(jù)。通過對(duì)教師的教學(xué)風(fēng)格、教學(xué)方法、教學(xué)內(nèi)容、講授思路、教學(xué)態(tài)度、教學(xué)過程、教學(xué)互動(dòng)、教學(xué)效果等情況進(jìn)行全面的監(jiān)督調(diào)查,收集各種數(shù)據(jù)信息,從而得出教師在課堂上的各種教學(xué)能力方面的具體情況。在此信息基礎(chǔ)上,進(jìn)行數(shù)據(jù)挖掘,找出各個(gè)方面影響學(xué)生學(xué)習(xí)成績高低的潛在規(guī)則,進(jìn)行總結(jié)提高,找出其中存在的問題,切實(shí)提高教師的教學(xué)能力。在教學(xué)過程中,教師采用多種教學(xué)方法來完成自己的教學(xué)任務(wù):比如傳統(tǒng)法、討論法、實(shí)驗(yàn)法、多媒體輔助法、參觀法、調(diào)查法、實(shí)習(xí)法、提問法等。據(jù)此可以用數(shù)據(jù)挖掘的方法來挖掘數(shù)據(jù)庫中的數(shù)據(jù),判定下一步我們應(yīng)采取什么樣的教學(xué)方法,以滿足實(shí)際教學(xué)的需要。在網(wǎng)上進(jìn)行問卷調(diào)查,從每個(gè)學(xué)生對(duì)教學(xué)方法的評(píng)價(jià)以及不同的教學(xué)方法得出的教學(xué)成績來進(jìn)行分析,來判斷這些教學(xué)方法適合哪一類學(xué)生或哪門課程。
(2)教師個(gè)人信息:包括教師學(xué)歷情況、職稱情況、科研情況、研究方向、級(jí)別、工作經(jīng)歷等各種信息,可運(yùn)用關(guān)聯(lián)規(guī)則方法對(duì)教學(xué)評(píng)價(jià)結(jié)果和教師個(gè)人信息一起進(jìn)行挖掘,從而得出影響教學(xué)結(jié)果的潛在的教師個(gè)人信息的部分情況。
(3)教師的素質(zhì)方面:教師所具備的基本素質(zhì)是實(shí)施教育教學(xué)的基礎(chǔ)。包括教師的思想政治素質(zhì)、道德素質(zhì)、文化素質(zhì)、智能素質(zhì)、心理素質(zhì)、身體素質(zhì)、外在素質(zhì)等七個(gè)方面,其實(shí)這些方面可以通過數(shù)據(jù)挖掘技術(shù)在學(xué)生成績或者相應(yīng)的調(diào)查信息的挖掘,看出哪些因素對(duì)教學(xué)方面有較大影響,切實(shí)加強(qiáng)教師在哪些素質(zhì)方面的培養(yǎng)和提高,從而有利于教學(xué)管理方法的制定和實(shí)施。
(4)教師績效方面:包括教師的工作業(yè)績、工作態(tài)度、工作技能等方面的綜合考核。可以說教師的績效直接影響到教學(xué)管理的各個(gè)方面,如教師工作量的計(jì)算、教師的評(píng)價(jià)結(jié)果等等。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從教學(xué)評(píng)價(jià)數(shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘,查詢教學(xué)效果與教師的工作態(tài)度、工作技能等的各種關(guān)聯(lián),找到教師的教學(xué)效果與教師績效的關(guān)系問題,合理調(diào)配一門課程的上課老師,使學(xué)生能夠較好地保持良好的學(xué)習(xí)狀態(tài),從而為教學(xué)部門提供了決策支持信息,促使更好地開展教學(xué)工作,提高教學(xué)質(zhì)量[4]。
2.2對(duì)學(xué)生方面信息的挖掘
對(duì)學(xué)生的素質(zhì)培養(yǎng)一直是高校發(fā)展的重點(diǎn),學(xué)生學(xué)習(xí)質(zhì)量的好壞、綜合素質(zhì)的高低決定了學(xué)校的辦學(xué)定位和發(fā)展目標(biāo),也為學(xué)生的人生選擇、自我發(fā)展起到了決定性作用。所以高校在擴(kuò)招的同時(shí)要努力提高教學(xué)質(zhì)量和管理水平,為學(xué)生的學(xué)習(xí)質(zhì)量改善、綜合素質(zhì)的提高提供保證[5]。
(1)學(xué)生的課堂行為表現(xiàn):認(rèn)知能力,是否能夠保證理解和掌握教師的所教授的內(nèi)容;人際交往,課堂上教師、學(xué)生之間交流、提問氣氛是否活躍;學(xué)習(xí)態(tài)度,學(xué)生對(duì)教學(xué)中的各種問題是否積極參與、是否認(rèn)真完成課題作業(yè);情緒表現(xiàn),學(xué)生能否進(jìn)行順利地學(xué)習(xí)。通過對(duì)學(xué)生課堂行為表現(xiàn)與對(duì)應(yīng)的學(xué)生成績之間的數(shù)據(jù)挖掘并結(jié)合實(shí)踐證明,學(xué)生在課堂上的表現(xiàn)狀態(tài)對(duì)學(xué)習(xí)效果有至關(guān)重要的影響。
(2)學(xué)生的作業(yè)情況:學(xué)生完成作業(yè)情況和成績,從而可以考查平時(shí)學(xué)習(xí)情況。通過對(duì)平時(shí)學(xué)習(xí)信息的數(shù)據(jù)挖掘,通??梢缘贸鲎罱K的學(xué)習(xí)情況。其實(shí),各個(gè)學(xué)校的教學(xué)管理應(yīng)該加大對(duì)學(xué)生的作業(yè)要求。
(3)學(xué)生的考試情況:考試是對(duì)教和學(xué)效果的檢驗(yàn),是教學(xué)中必不可少的環(huán)節(jié)之一。試題難度、考試信度、考試狀態(tài)等。如果將數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則應(yīng)用于試卷分析數(shù)據(jù)庫中,然后根據(jù)學(xué)生得分情況分析出每道題的難易度、區(qū)分度、相關(guān)度等指標(biāo),教師就能夠?qū)υ囶}的質(zhì)量作出比較準(zhǔn)確的評(píng)價(jià),進(jìn)而可以用來檢查自己的教學(xué)情況及學(xué)生的掌握情況,并為今后的教學(xué)提供指導(dǎo)。
(4)學(xué)生的行為和獎(jiǎng)懲情況:可以觀察學(xué)生在學(xué)習(xí)和生活中的和方面信息。這個(gè)側(cè)面也能從一定程度上反映學(xué)生的學(xué)習(xí)情況,但是這個(gè)方面往往集中反映學(xué)校的整體教學(xué)效果。如利用學(xué)生信息中的數(shù)據(jù),采用樸素貝葉斯分類的方法,對(duì)學(xué)生信息數(shù)據(jù),如不同課程性質(zhì)課程的平均成績、社會(huì)實(shí)踐能力、獲獎(jiǎng)情況、社會(huì)工作情況等進(jìn)行分類與預(yù)測(cè)。從結(jié)果看來,樸素貝葉斯在學(xué)生信息分類預(yù)測(cè)中取得了很好的效果,這樣也就促進(jìn)了高校的教學(xué)管理、人才培養(yǎng)等各方面的發(fā)展。
(5)學(xué)生個(gè)人信息:利用數(shù)據(jù)挖掘技術(shù),比如可以對(duì)學(xué)生訪問情況進(jìn)行分析,跟蹤、了解學(xué)生出勤情況。還可對(duì)學(xué)生年齡、性別等個(gè)人情況進(jìn)行分析,了解學(xué)生的組成、結(jié)構(gòu),為合理地安排課程設(shè)置提供依據(jù)。通過對(duì)學(xué)生考試情況的分析,并結(jié)合出勤情況,可作為考查學(xué)生學(xué)習(xí)的情況,為合理地評(píng)估學(xué)生綜合素質(zhì)提供依據(jù)。對(duì)于挖掘出來的規(guī)則信息可以利用可視化技術(shù),以圖表或曲線等形式提供給教師,以使教師能充分利用學(xué)生的問題資源,從而提高教學(xué)質(zhì)量。
(6)學(xué)生學(xué)習(xí)特征:學(xué)生特征包括兩個(gè)方面:一是學(xué)習(xí)準(zhǔn)備,一是學(xué)習(xí)風(fēng)格。學(xué)習(xí)準(zhǔn)備包括初始能力和一般特征兩個(gè)方面。學(xué)生的初始能力是指學(xué)生在學(xué)習(xí)某一特定的課程內(nèi)容時(shí),已經(jīng)具備的有關(guān)知識(shí)與技能的基礎(chǔ),以及他們對(duì)這些學(xué)習(xí)內(nèi)容的認(rèn)識(shí)和態(tài)度。學(xué)習(xí)風(fēng)格包括學(xué)習(xí)者的生理特征、心理特征和社會(huì)特征三個(gè)方面。學(xué)生的學(xué)習(xí)風(fēng)格與學(xué)習(xí)活動(dòng)有著密切的關(guān)系。對(duì)學(xué)生感知不同事物、并對(duì)不同事物做出反應(yīng)這兩方面產(chǎn)生影響的所有心理特征構(gòu)成了學(xué)習(xí)風(fēng)格[6]。利用數(shù)據(jù)挖掘功能分析學(xué)生特征,并在此基礎(chǔ)上組織學(xué)習(xí)內(nèi)容、明確學(xué)習(xí)目標(biāo)、確定教學(xué)策略、選擇教學(xué)輔助媒體,為學(xué)生創(chuàng)造出一個(gè)適合其內(nèi)部條件的外部學(xué)習(xí)環(huán)境,使有效學(xué)習(xí)發(fā)生在每個(gè)學(xué)生的身上。通過數(shù)據(jù)挖掘技術(shù),把不同學(xué)習(xí)者的學(xué)習(xí)特征存入數(shù)據(jù)庫,教師可以通過它及時(shí)地了解學(xué)習(xí)者的需求、興趣愛好、個(gè)性差異等信息,并以此為依據(jù)為不同學(xué)習(xí)者提供動(dòng)態(tài)的學(xué)習(xí)內(nèi)容、相應(yīng)的導(dǎo)航機(jī)制、推薦個(gè)性化的學(xué)習(xí)材料等服務(wù),真正的實(shí)現(xiàn)因材施教。
(7)學(xué)生學(xué)習(xí)情況:學(xué)習(xí)評(píng)價(jià)是教育工作者的重要職責(zé)之一。評(píng)定學(xué)生的學(xué)習(xí)行為,既對(duì)學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動(dòng)機(jī)的作用,又是檢查課程計(jì)劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個(gè)別差異,便于因材施教的途徑。對(duì)學(xué)生學(xué)習(xí)行為和綜合素質(zhì)進(jìn)行評(píng)價(jià),一般采用模糊論中的模糊綜合評(píng)判及模糊聚類的方法,對(duì)評(píng)價(jià)結(jié)果采用了對(duì)定性和定量指標(biāo)加權(quán)平均算出綜合素質(zhì)評(píng)價(jià)得分并排名的方法,而且由于學(xué)生綜合素質(zhì)的評(píng)價(jià)指標(biāo)是動(dòng)態(tài)變化的,可以考慮選用動(dòng)態(tài)聚類法對(duì)評(píng)判結(jié)果進(jìn)行動(dòng)態(tài)聚類分析。
2.3對(duì)選課數(shù)據(jù)的信息挖掘
學(xué)生通過網(wǎng)絡(luò)選擇自己所上的課程,選課數(shù)據(jù)背后可能隱藏著許多尚不被我們所知的重要信息,這些信息對(duì)教學(xué)管理具有重要的參考價(jià)值,而數(shù)據(jù)挖掘技術(shù)可以用來找出這些隱藏在數(shù)據(jù)背后的信息和知識(shí)的技術(shù)[7]。
在選課數(shù)據(jù)分析上,主要考慮以下幾個(gè)方面:分析各門課的選課數(shù)目,確定課程的歡迎程度;分析各門課的課程歸屬和選課學(xué)分,確定學(xué)生選課時(shí)對(duì)不同課程歸屬課的學(xué)分多少的考慮;分析各門課選課率,了解學(xué)生對(duì)目前課程安排中的滿意程度;分析選課學(xué)生的情況,了解選擇當(dāng)前課程的學(xué)生的專業(yè)情況;分析任課教師情況,了解任課教師的實(shí)際情況和綜合能力。
首先要對(duì)選課的原始數(shù)據(jù)進(jìn)行預(yù)處理,把其原始數(shù)據(jù)采樣后轉(zhuǎn)換成適合數(shù)據(jù)挖掘的數(shù)據(jù)。在處理的過程中,要明晰數(shù)據(jù)的上下結(jié)構(gòu)和面向?qū)ο?為數(shù)據(jù)挖掘作好準(zhǔn)備。完成數(shù)據(jù)的預(yù)處理之后,確定參與挖掘的數(shù)據(jù)表,在選課系統(tǒng)中學(xué)生選課表是基本事實(shí)表,學(xué)生信息表、教師信息表和課程信息表可作為周圍的維表。最后將預(yù)處理之后的數(shù)據(jù)進(jìn)行狀態(tài)運(yùn)行,在此基礎(chǔ)上選擇數(shù)據(jù)挖掘算法FP-growth進(jìn)行數(shù)據(jù)挖掘。挖掘的最終結(jié)果可以用可視化的圖形方式表現(xiàn)出來。根據(jù)挖掘的結(jié)果,得出選課背后隱藏的各種數(shù)據(jù)信息,如某些專業(yè)的學(xué)生喜歡選某位老師所開設(shè)的相關(guān)課程,部分學(xué)生總是選擇學(xué)分較多的有更多上機(jī)機(jī)會(huì)的課程等等。
根據(jù)數(shù)據(jù)挖掘的分析結(jié)果,了解實(shí)際的情況,在此基礎(chǔ)上就進(jìn)一步加強(qiáng)教學(xué)管理,合理設(shè)置各種課程和提高教
學(xué)質(zhì)量,最終讓學(xué)生學(xué)習(xí)到更有用的知識(shí)和技能。
3 結(jié)束語
隨著信息量的急劇增長和對(duì)信息提取的更高要求,現(xiàn)在我們很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找決策的依據(jù),這就必須借助數(shù)據(jù)挖掘法發(fā)掘數(shù)據(jù)中隱藏的規(guī)律或模式,為決策提供更有效的支持。數(shù)據(jù)挖掘能夠?yàn)榻虒W(xué)改革提供有效的理論與實(shí)踐決策依據(jù),在分析影響高校教學(xué)管理的各個(gè)層面中具有較好的作用。
在教學(xué)管理中,把常用的數(shù)據(jù)挖掘技術(shù)應(yīng)用在教師信息、學(xué)生信息、選課信息等各個(gè)方面,每一種應(yīng)用都和具體的挖掘情況相結(jié)合,根據(jù)實(shí)際情況,采用適當(dāng)?shù)耐诰蚍椒?確實(shí)發(fā)掘數(shù)據(jù)中隱藏的內(nèi)在聯(lián)系。結(jié)合學(xué)校的實(shí)際情況,采用合理的挖掘步驟,將挖掘后的結(jié)果分析應(yīng)用到實(shí)際中,找出影響教學(xué)的關(guān)鍵因素,提高教學(xué)管理水平,使教師和學(xué)校教育決策者洞悉教學(xué)中存在的問題。
參考文獻(xiàn):
[1]劉曉霞.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī),2008,(285):115-116.
[2]楊永斌.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用研究[J].計(jì)算機(jī)科學(xué),2006,33(12):284-286.
[3]邱燕玲.數(shù)據(jù)挖掘在教學(xué)測(cè)評(píng)中的應(yīng)用分析[J].科技資訊,2007,(07):131-132.
[4]楊金凡.數(shù)據(jù)挖掘在教學(xué)評(píng)價(jià)中的應(yīng)用[J].電腦開發(fā)與應(yīng)用,2007,20(4):77-79.
[5]駱毓燕,張霞,白云.基于樸素貝葉斯的學(xué)生信息分類預(yù)測(cè)研究[J].高等教育與學(xué)術(shù)研究,2008,(3):65-70.
關(guān)鍵詞:高職教育;個(gè)性化學(xué)習(xí);數(shù)據(jù)挖掘;商業(yè)智能
中圖分類號(hào):TP311.13
作為我國高等教育一支重要生力軍――高等職業(yè)教育近幾年來的發(fā)展可謂迅猛,無論是學(xué)校數(shù)還是學(xué)生人數(shù),高職??频囊?guī)模已是我國高等教育的半壁江山。高職教育對(duì)人才的培養(yǎng)目標(biāo)是為國家和地方經(jīng)濟(jì)的發(fā)展輸送適應(yīng)生產(chǎn)、建設(shè)服務(wù)等一線急需的應(yīng)用型高素質(zhì)人才,《國務(wù)院關(guān)于大力發(fā)展職業(yè)教育的決定》中就提出了“堅(jiān)持以就業(yè)為導(dǎo)向,深化職業(yè)教育教學(xué)改革”,要求加強(qiáng)職業(yè)院校對(duì)學(xué)生實(shí)踐能力和職業(yè)技能的培養(yǎng)。
1 現(xiàn)狀
目前,高職學(xué)生在學(xué)校完成系統(tǒng)的課程學(xué)習(xí)依然是高職教育教學(xué)的主要方式,在此過程中,由于學(xué)生個(gè)體特性、就業(yè)意向、專業(yè)方向等各種因素的影響,獲取的知識(shí)無論從方式方法、內(nèi)容結(jié)構(gòu),還是真正掌握的程度來說都因人而異,而這其中有相當(dāng)大的部分是學(xué)生主動(dòng)性選擇的結(jié)果;此外,在高職教育教學(xué)改革的嘗試中,大類招生、拓展專業(yè)等多項(xiàng)措施在很多職業(yè)院校中已然試行,這就給予學(xué)生更多的自和選擇的機(jī)會(huì)。
然而,在自主選擇的過程中,由于沒有一個(gè)可參照的、適合自己的挑選標(biāo)準(zhǔn),高職學(xué)生進(jìn)行各項(xiàng)選擇時(shí)在很大程度上有著“扎堆隨大流”、“哪個(gè)課能混好過”的心理,這就導(dǎo)致主動(dòng)選擇的課程,其學(xué)習(xí)過程并不順暢、學(xué)習(xí)效果也不理想,沒有提升自身知識(shí)結(jié)構(gòu)的質(zhì)量。這種高職教育中教與學(xué)環(huán)節(jié)的脫節(jié)會(huì)對(duì)高職學(xué)生的能力培養(yǎng)產(chǎn)生有著不可忽視的影響。
2 研究思路
隨著教育信息化的深入發(fā)展,先進(jìn)的信息技術(shù)手段在教育教學(xué)的方方面面都得以有效利用,這也為學(xué)生綜合能力培養(yǎng)的探索與嘗試提供了新的途徑,數(shù)據(jù)挖掘技術(shù)就是其中很重要的一種。數(shù)據(jù)挖掘指的是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。在此過程中,數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的,而從中發(fā)現(xiàn)的是用戶所感興趣的知識(shí)內(nèi)容,這些知識(shí)應(yīng)該是可以接受和理解、并且能加以進(jìn)一步運(yùn)用的。
數(shù)據(jù)挖掘技術(shù)之所以在教育行業(yè)有更為廣泛、實(shí)際的應(yīng)用,這是由于各個(gè)學(xué)校都會(huì)有自己的一整套數(shù)據(jù)庫系統(tǒng),用于記錄學(xué)生的學(xué)籍信息、課程教學(xué)過程等歷史數(shù)據(jù),這樣,就可以嘗試運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)和智能分析工具,通過對(duì)高職教育研究和教學(xué)過程中積累的海量數(shù)據(jù)進(jìn)行采集分類、挖掘和分析,從多角度、多層次出發(fā),構(gòu)建識(shí)別個(gè)體特點(diǎn)、知識(shí)構(gòu)成和獲取方式等要素之間關(guān)聯(lián)模式的數(shù)據(jù)模型。數(shù)據(jù)挖掘是一門交叉學(xué)科,其理論和方法有很多,包括K-最近鄰分類器、判別分析、人工神經(jīng)網(wǎng)絡(luò)和分類樹等,它把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識(shí),提供決策支持。在這里就是要將數(shù)據(jù)挖掘方法與高職教育教學(xué)研究相結(jié)合,設(shè)計(jì)實(shí)際的分析應(yīng)用系統(tǒng),具體來說:
(1)數(shù)據(jù)挖掘技術(shù)面向高職教育這一特定領(lǐng)域中的主體――高職學(xué)生,針對(duì)專門的指標(biāo),包括個(gè)體特性、專業(yè)要求、就業(yè)意向等,著眼于課程這個(gè)知識(shí)載體,對(duì)它們之間的關(guān)系進(jìn)行深層次、智能化的挖掘、分析;
(2)數(shù)據(jù)挖掘的應(yīng)用會(huì)具體到建模、變量篩選和導(dǎo)入等方面,而不只是一些抽象的挖掘算法的研究;
(3)數(shù)據(jù)分析采用先進(jìn)的商業(yè)智能工具,同樣,數(shù)據(jù)的展現(xiàn)手段基于平臺(tái),具有開放化、模塊化、網(wǎng)絡(luò)化特點(diǎn)。
3 系統(tǒng)框架
系統(tǒng)定位于個(gè)性化學(xué)習(xí)分析,其框架結(jié)構(gòu)參見圖1,主要由數(shù)據(jù)集成、數(shù)據(jù)建模、數(shù)據(jù)分析及展現(xiàn)等部分構(gòu)成。具體來說,數(shù)據(jù)集成模塊完成定義數(shù)據(jù)結(jié)構(gòu)、裝載、清洗、合并數(shù)據(jù)的功能;數(shù)據(jù)建模是指建立數(shù)據(jù)分析OLAP及數(shù)據(jù)挖掘模型;數(shù)據(jù)分析旨在分析和比較各種不同算法得出的結(jié)果,尋找最為匹配的算法,而數(shù)據(jù)展現(xiàn)的作用是根據(jù)分析結(jié)構(gòu)靈活創(chuàng)建數(shù)據(jù)報(bào)告。
圖1 系統(tǒng)框架結(jié)構(gòu)
在此架構(gòu)下,各個(gè)子系統(tǒng)的功能如下所述:
(1)數(shù)據(jù)集成。分析和歸納課程教學(xué)過程中產(chǎn)生的系列數(shù)據(jù),根據(jù)其特征和行為設(shè)計(jì)及定義便于分析和挖掘的數(shù)據(jù)結(jié)構(gòu),然后并進(jìn)行數(shù)據(jù)集成。數(shù)據(jù)集成的工作包括從異構(gòu)數(shù)據(jù)源獲取數(shù)據(jù),將其進(jìn)行清洗、轉(zhuǎn)換、合并,然后加載到數(shù)據(jù)倉儲(chǔ)中。數(shù)據(jù)集成執(zhí)行的時(shí)間、相互的順序、成敗對(duì)將來的分析結(jié)果的有效性則至關(guān)重要。
(2)數(shù)據(jù)建模。典型的數(shù)據(jù)挖掘工具將在構(gòu)建了數(shù)據(jù)倉庫后進(jìn)行分析并生成結(jié)果,一些工具也可以使用關(guān)系型數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分析的結(jié)果獨(dú)立于數(shù)據(jù)倉庫中使用的數(shù)據(jù)。數(shù)據(jù)挖掘核心的部分就是選擇挖掘算法并建立數(shù)據(jù)模型,這樣就可以根據(jù)學(xué)生個(gè)體信息、學(xué)生成績等數(shù)據(jù)之間的關(guān)系將這些學(xué)生劃分成分析有意義的組群并預(yù)測(cè)他們的行為;當(dāng)把這些組發(fā)送回分析過程時(shí),數(shù)據(jù)挖掘引擎允許分析人員和用戶根據(jù)這些簇進(jìn)行劃分和細(xì)化。
(3)數(shù)據(jù)分析與展示。以學(xué)生個(gè)體信息和課程數(shù)據(jù)為輸入,利用所篩選出的最佳建模方法,逐步提出一個(gè)可實(shí)現(xiàn)個(gè)性化學(xué)習(xí)分析的數(shù)據(jù)模型,以衡量及提高模型預(yù)測(cè)的準(zhǔn)確度。將分析結(jié)果以特定的客戶端或Web方式進(jìn)行展現(xiàn),以建立的分析結(jié)果展示平臺(tái),具有高度的開放性、通用性和可擴(kuò)展性。通過建模創(chuàng)建了正確的模型,數(shù)據(jù)挖掘的重點(diǎn)就從分析轉(zhuǎn)到結(jié)果上,數(shù)據(jù)報(bào)告的展現(xiàn)方式有多種,可通過專業(yè)的報(bào)告工具,也可自行編寫Web網(wǎng)站進(jìn)行。
4 結(jié)束語
在高職教育教學(xué)研究中運(yùn)用先進(jìn)的數(shù)據(jù)挖掘技術(shù)手段,針對(duì)各項(xiàng)課程教學(xué)、學(xué)生管理數(shù)據(jù)進(jìn)行深度挖掘、分析,研究個(gè)性化學(xué)習(xí)模式,為學(xué)生的自我學(xué)習(xí)規(guī)劃提供具體化、智能化分析結(jié)果以供參照,在此情況下,先進(jìn)技術(shù)手段的支持,對(duì)教與學(xué)都有著不可忽視的影響。同時(shí),也為人才培養(yǎng)的探索與嘗試提供新途徑。
參考文獻(xiàn):
[1]趙云鵬,石麗,劉瑩.基于數(shù)據(jù)挖掘的高校規(guī)模分析及應(yīng)用研究.第九屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集[C].2011.
[2].數(shù)據(jù)挖掘在高職院校教學(xué)管理中的應(yīng)用[J].清遠(yuǎn)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2010(12).
[3]干娟.基于決策樹算法的學(xué)生綜合測(cè)評(píng)系統(tǒng)的設(shè)計(jì)[J].安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報(bào),2011(04).
摘要:基于現(xiàn)代計(jì)算機(jī)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)技術(shù)和高等院校教育教學(xué)系統(tǒng)實(shí)現(xiàn)了有機(jī)整合,并且促進(jìn)了教育教學(xué)與組織管理等多種活動(dòng)的信息化發(fā)展,一定程度上提高了教育教學(xué)質(zhì)量以及效率,構(gòu)建了全新的教育教學(xué)管理模式。在此背景下,教育教學(xué)數(shù)字化發(fā)展速度也不斷加快,信息量增長速度加快,對(duì)于信息提取的要求也隨之提高。所以,在大量數(shù)據(jù)當(dāng)中獲取重要的信息也逐漸成為高等院校教育教學(xué)決策的重要依據(jù)?;诖耍恼聦⒏咝=逃虒W(xué)作為研究重點(diǎn),闡述了數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用,以供參考。
關(guān)鍵詞:高校教育教學(xué);數(shù)據(jù)挖掘技術(shù);運(yùn)用
一、數(shù)據(jù)挖掘概述
所謂的數(shù)據(jù)挖掘,具體指的就是在海量且模糊隨機(jī)數(shù)據(jù)當(dāng)中提取出隱含其中,同時(shí)具有潛在價(jià)值的信息與知識(shí)過程。將數(shù)據(jù)挖掘技術(shù)應(yīng)用在教育教學(xué)當(dāng)中,可以對(duì)海量數(shù)據(jù)予以深入挖掘與分析,進(jìn)而獲得數(shù)據(jù)當(dāng)中所隱含的潛在信息內(nèi)容,更好地為高校教育教學(xué)管理人員決策提供有力支持[1]。
二、高校教育教學(xué)管理中的數(shù)據(jù)挖掘技術(shù)應(yīng)用
2.1在教學(xué)質(zhì)量提升方面的應(yīng)用
高等院校為了更好地提高教學(xué)管理的質(zhì)量,教務(wù)管理部門會(huì)在學(xué)期期末測(cè)評(píng)學(xué)員領(lǐng)導(dǎo)與任課教師的教學(xué)思想、態(tài)度以及教學(xué)方法等,并且根據(jù)最終的評(píng)分結(jié)果來明確教師的教學(xué)質(zhì)量。然而,受評(píng)價(jià)人員對(duì)標(biāo)準(zhǔn)理解以及把握程度的影響,學(xué)生評(píng)價(jià)仍存在隨意性特征。
在這種情況下,導(dǎo)致評(píng)分結(jié)果很難對(duì)教學(xué)效果進(jìn)行真實(shí)地反映,因而也影響了教學(xué)質(zhì)量的評(píng)估。
但是,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在教學(xué)質(zhì)量評(píng)估方面,通過對(duì)關(guān)聯(lián)規(guī)則算法的合理運(yùn)用,可以將教學(xué)質(zhì)量評(píng)價(jià)當(dāng)中的不同指標(biāo)權(quán)重系數(shù)進(jìn)行設(shè)定,并通過Apriori的算法來掃描數(shù)據(jù)集,在數(shù)據(jù)挖掘的作用下,獲取學(xué)歷、年齡以及職稱三者之間存在的聯(lián)系,同樣也可以獲得教學(xué)質(zhì)量和方法的關(guān)系[2]。
為此,高校教務(wù)管理部門就可以將獲得的規(guī)律應(yīng)用在教學(xué)管理實(shí)踐當(dāng)中,合理地設(shè)置督學(xué)小組并制定出聽課制度,將教學(xué)課堂教學(xué)的質(zhì)量真實(shí)且客觀地反映出來,實(shí)現(xiàn)高校教學(xué)水平的全面提升。
2.2課程體系結(jié)構(gòu)的有效完善
高等院校教育體系當(dāng)中的專業(yè)建設(shè)作用十分重要,所以,必須要具備高質(zhì)量的課程體系結(jié)構(gòu)設(shè)置。在對(duì)學(xué)生成績數(shù)據(jù)庫以及畢業(yè)生去向數(shù)據(jù)庫等多種數(shù)據(jù)信息進(jìn)行數(shù)據(jù)挖掘以后,可以通過對(duì)關(guān)聯(lián)分析與序列模式的分析和探究,獲得數(shù)據(jù)與數(shù)據(jù)間存在的相關(guān)性。
其中,課程間的關(guān)系和先后順序亦或是課程和課程體系結(jié)構(gòu)之間的關(guān)系等等。在此基礎(chǔ)上,保證學(xué)習(xí)高級(jí)課程前事先學(xué)習(xí)先行課程。以計(jì)算機(jī)專業(yè)《數(shù)據(jù)結(jié)構(gòu)》為例,在教學(xué)中將《C語言》作為重要的先行課程,以保證學(xué)生在學(xué)習(xí)《數(shù)據(jù)結(jié)構(gòu)》內(nèi)容的時(shí)候可以具備良好語言基礎(chǔ),更深入地理解并靈活地應(yīng)用數(shù)據(jù)結(jié)構(gòu)當(dāng)中的算法。
而在完成《數(shù)據(jù)結(jié)構(gòu)》學(xué)習(xí)以后,應(yīng)根據(jù)學(xué)生就業(yè)走向和市場的實(shí)際需求來確定是否安排《JAVA語言程序設(shè)計(jì)》課程教學(xué)。這樣一來,學(xué)生的學(xué)習(xí)成績實(shí)現(xiàn)了有效地提高,更利于學(xué)生未來就業(yè)。除此之外,對(duì)內(nèi)容重復(fù)的課程進(jìn)行有效地壓縮,將落后的課程內(nèi)容適當(dāng)?shù)貏h除,與專業(yè)特點(diǎn)相結(jié)合。
由此可見,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在高校教學(xué)中,對(duì)于專業(yè)建設(shè)以及課程改革決策具有積極的作用。
三、網(wǎng)絡(luò)教學(xué)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用
在網(wǎng)絡(luò)教學(xué)中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從Web文件以及Web活動(dòng)當(dāng)中選擇出用戶較為感興趣的有價(jià)值模式以及信息,這就是所謂的Web挖掘[3]。因?yàn)榻邮芙逃龑?duì)象在多個(gè)方面都存在差異,具體表現(xiàn)在個(gè)人學(xué)習(xí)目標(biāo)、學(xué)習(xí)能力與知識(shí)基礎(chǔ)的差異等。為此,網(wǎng)絡(luò)教學(xué)也必須要能夠適應(yīng)個(gè)性化的學(xué)習(xí)需求??梢园巡煌脩魧W(xué)習(xí)狀況與軌跡詳細(xì)記錄并存放至數(shù)據(jù)庫當(dāng)中,通過對(duì)WEB挖掘技術(shù)的合理運(yùn)用,在序列模式挖掘的作用下合理地分類文檔,以保證學(xué)生信息檢索速度的提高。
另外,也可以根據(jù)學(xué)生訪問瀏覽的數(shù)據(jù)挖掘并分析,針對(duì)訪問的數(shù)據(jù)展開聚類分析,以保證更好地了解學(xué)生感興趣的內(nèi)容,并為其推送相關(guān)內(nèi)容。與此同時(shí),可以在相關(guān)聯(lián)的頁面當(dāng)中合理地設(shè)置超鏈接,對(duì)網(wǎng)站結(jié)構(gòu)予以有效地改善,確保頁面間的鏈接與用戶訪問的習(xí)慣更吻合。
結(jié)束語:
總而言之,在高校教育教學(xué)中合理地運(yùn)用數(shù)據(jù)挖掘技術(shù)可以在大量數(shù)據(jù)信息當(dāng)中處理并提取出更具價(jià)值的信息內(nèi)容,促進(jìn)高等院校教育教學(xué)管理工作的正常開展,特別是評(píng)估與決策方面,數(shù)據(jù)挖掘技術(shù)的作用更為明顯。
除此之外,該技術(shù)也可以應(yīng)用在網(wǎng)絡(luò)教學(xué)當(dāng)中,使得網(wǎng)絡(luò)教學(xué)資源配置更加合理,在教育教學(xué)中充分發(fā)揮自身的效用。上文針對(duì)數(shù)據(jù)挖掘技術(shù)在高校教育教學(xué)中的實(shí)際應(yīng)用展開了相關(guān)性地研究和分析,主要的目的就是為了更好地幫助高校進(jìn)行決策,為學(xué)生提供更為理想的學(xué)習(xí)環(huán)境,在提高學(xué)生學(xué)習(xí)興趣的基礎(chǔ)上,增強(qiáng)高校教育教學(xué)的質(zhì)量與效率。
參考文獻(xiàn)
[1]侯錕.數(shù)據(jù)挖掘技術(shù)在高校教育教學(xué)中的應(yīng)用[J].吉林省教育學(xué)院學(xué)報(bào)(下旬),2012,28(7):51-52.
【關(guān)鍵詞】數(shù)據(jù)挖掘教學(xué)質(zhì)量教學(xué)評(píng)價(jià)
隨著高職教育的快速發(fā)展,高職院校的教學(xué)質(zhì)量的自我評(píng)價(jià)已經(jīng)成為學(xué)??茖W(xué)管理的重要保障。教育部為了確保高校的教育質(zhì)量,于2003年確立了5年一輪的評(píng)估制度。各高職院校在推進(jìn)教育評(píng)估工作的同時(shí),積極地組織自評(píng),建立健全了全院教職工共同參與的教學(xué)質(zhì)量內(nèi)部自我評(píng)估機(jī)制。而建立健全高職院校教學(xué)質(zhì)量評(píng)價(jià)系統(tǒng)是提高教師教學(xué)質(zhì)量的重要途徑,也是提高教學(xué)管理水平的迫切需要。數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取知識(shí)的有效技術(shù),不僅可以實(shí)現(xiàn)教學(xué)評(píng)教數(shù)據(jù)的知識(shí)挖掘。這些知識(shí)可以為學(xué)校提高教學(xué)質(zhì)量,同時(shí)也可以輔助學(xué)校管理者決策,為進(jìn)一步優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)。
一、教學(xué)質(zhì)量評(píng)價(jià)的作用
高職院校的教學(xué)質(zhì)量是高等職業(yè)教育的生命線,教學(xué)質(zhì)量的評(píng)價(jià)作為提高教學(xué)質(zhì)量的手段被擺到了越來越重要的位置,而教師在教育工作中擔(dān)負(fù)著溝通教與學(xué)的橋梁作用,其工作質(zhì)量的好與壞會(huì)直接影響到教育質(zhì)量的好壞。在教學(xué)管理中,對(duì)高職教師進(jìn)行教學(xué)質(zhì)量測(cè)評(píng),是教學(xué)活動(dòng)中提高教學(xué)質(zhì)量的一個(gè)重要環(huán)節(jié),也是教學(xué)管理的核心。教學(xué)質(zhì)量測(cè)評(píng)在教學(xué)過程中發(fā)揮著諸多作用,具體表現(xiàn)在以下幾個(gè)方面:
1、通過教學(xué)質(zhì)量測(cè)評(píng),進(jìn)一步加強(qiáng)人才培養(yǎng)工作的宏觀管理與指導(dǎo),推動(dòng)學(xué)校自覺地按照教育規(guī)律不斷明確辦學(xué)指導(dǎo)思想、堅(jiān)持教育創(chuàng)新、深化教學(xué)改革、加強(qiáng)教學(xué)基本建設(shè)、強(qiáng)化教學(xué)管理、全面提高教育質(zhì)量。
2、教學(xué)質(zhì)量評(píng)價(jià)能夠從整體上對(duì)教學(xué)活動(dòng)進(jìn)行調(diào)控,以確保教學(xué)活動(dòng)能夠按照預(yù)定目標(biāo)進(jìn)行,并且能最終達(dá)到該目標(biāo)。
二、數(shù)據(jù)挖掘概述
1、數(shù)據(jù)挖掘的定義
簡單的說,數(shù)據(jù)挖掘(Data Mining)就是從大量的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取或挖掘隱含在其中的、人們事先不知道的、但又有用的知識(shí)的過程。數(shù)據(jù)挖掘涉及多學(xué)科技術(shù)的集成,包括了數(shù)據(jù)庫和數(shù)據(jù)倉庫、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、人工智能、神經(jīng)網(wǎng)絡(luò)、信息檢索、模式識(shí)別等多個(gè)領(lǐng)域的理論和方法。與數(shù)據(jù)挖掘相近的同義詞有知識(shí)提取、數(shù)據(jù)捕撈、數(shù)據(jù)融合、數(shù)據(jù)分析、決策支持和從數(shù)據(jù)中挖掘知識(shí)等。
2、數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘源于多個(gè)學(xué)科,受多個(gè)學(xué)科影響,數(shù)據(jù)挖掘的核心技術(shù)融合了數(shù)據(jù)庫、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、人工智能等多個(gè)學(xué)科領(lǐng)域的理論和方法,數(shù)據(jù)挖掘利用的技術(shù)越多,得出結(jié)果的精確性就會(huì)越高。目前數(shù)據(jù)挖掘方法很多,比較典型的有關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析等。
(1)關(guān)聯(lián)分析
所謂關(guān)聯(lián)分析,也就是利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,通過關(guān)聯(lián)規(guī)則挖掘,可以發(fā)現(xiàn)那些隱藏在海量數(shù)據(jù)間的相互關(guān)系,發(fā)現(xiàn)那些潛在的、隱含在數(shù)據(jù)記錄中的有用信息。利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘是由Rakesh Apwal等人首先提出的。
(2)序列模式分析
序列模式分析,側(cè)重分析數(shù)據(jù)間的前后序列關(guān)系,它能發(fā)現(xiàn)數(shù)據(jù)庫中“在一段時(shí)間內(nèi),先進(jìn)行了一活動(dòng)后,又接著進(jìn)行了另一項(xiàng)活動(dòng)”之類的知識(shí)。
(4)聚類分析
聚類分析是統(tǒng)計(jì)學(xué)中的一種研究方法,主要研究”物以類聚”的問題,它是把物理或抽象的集合分割為多個(gè)類的過程,使得同一類中的對(duì)象具有高度的相似性,而不同類之間對(duì)象的差別較明顯。與分類分析不同,在聚類分析中,預(yù)先不知道記錄數(shù)據(jù)中分類信息,并且目標(biāo)數(shù)據(jù)分成幾類也不知道,需要依據(jù)某種度量標(biāo)準(zhǔn),合理地劃分記錄數(shù)據(jù)到各個(gè)簇中。聚類分析的方法很多,具體可以分為系統(tǒng)聚類法、模糊聚類法、基于密度的方法等。
三、教學(xué)質(zhì)量評(píng)價(jià)存在的問題
現(xiàn)在的教學(xué)質(zhì)量評(píng)價(jià)中尚存在著一些新的問題。像許多高職院校一樣,我院在多年來的教學(xué)、管理和教學(xué)質(zhì)量評(píng)價(jià)工作積累了大量的數(shù)據(jù),但目前對(duì)這些海量數(shù)據(jù)的研究處理還僅停留在初級(jí)的數(shù)據(jù)備份、查詢及簡單基本的統(tǒng)計(jì)階段,使得這些數(shù)據(jù)不能發(fā)揮其應(yīng)有的價(jià)值。如何更有效地利用大這些大量的數(shù)據(jù)記錄信息理性探析并指導(dǎo)高職院校教師更好的教學(xué)已變得非常重要。
四、數(shù)據(jù)挖掘技術(shù)在教學(xué)評(píng)價(jià)中的應(yīng)用
1、基于數(shù)據(jù)挖掘的教學(xué)評(píng)價(jià)流程
(1)確定挖掘?qū)ο蟆T磾?shù)據(jù)庫存儲(chǔ)了來自教務(wù)系統(tǒng)不同模塊的數(shù)據(jù),主要有教師基本信息、課程基本信息、評(píng)價(jià)基本信息等,這些都是評(píng)價(jià)數(shù)據(jù)分析的基礎(chǔ)。清晰定義問題,認(rèn)清數(shù)據(jù)挖掘的目的,是數(shù)據(jù)挖掘的關(guān)鍵一步,挖掘的最后結(jié)果是不可預(yù)測(cè)的,但是要探索的問題一般是可以預(yù)見的。
(2)數(shù)據(jù)的采集。教師需要在教學(xué)過程中,主要收集教學(xué)數(shù)據(jù)信息,有些信息需要可以直接獲得,有的信息需要進(jìn)行調(diào)查獲得。此項(xiàng)工作繁瑣,耗時(shí),工作量大。
(3)數(shù)據(jù)的預(yù)處理。數(shù)據(jù)的預(yù)處理主要包括數(shù)據(jù)集成、選擇、轉(zhuǎn)換等過程。此過程的實(shí)施是針對(duì)算法而準(zhǔn)備的,不同的算法一般需要不同的分析數(shù)據(jù)模型。
(4)數(shù)據(jù)分析。進(jìn)行數(shù)據(jù)分析,首先要選擇合適的挖掘算法,目的是為了建立一個(gè)分析數(shù)據(jù)模型,并使用合適的軟件實(shí)現(xiàn)這一算法,繼而對(duì)所轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。
(5)結(jié)果分析與表示。根據(jù)用戶的不同,對(duì)分析結(jié)果庫中的數(shù)據(jù)進(jìn)行分析,把具有價(jià)值信息提取出來,以文字、圖形等形式反饋給最終用戶。例如教師可利用所得的信息改進(jìn)教學(xué)策略,指導(dǎo)進(jìn)一步的教學(xué)。
2、數(shù)據(jù)挖掘在高職院校教學(xué)評(píng)價(jià)中的作用
在高職院校的教學(xué)工作中,有許多教師根據(jù)教學(xué)需要,往往每位教師所教的課程不止一門,在整個(gè)教學(xué)質(zhì)量評(píng)價(jià)活動(dòng)中,評(píng)價(jià)某位教師的授課質(zhì)量不能僅限于某個(gè)班級(jí)、某一學(xué)期、某一門課程成績排名,而是由我們事先設(shè)定好的挖掘模型從其開始授課時(shí)起,對(duì)其在各個(gè)學(xué)期、不同的班級(jí)及不同課程的平均成績進(jìn)行數(shù)據(jù)挖掘,客觀得出該教師的總體教學(xué)效果。
總之,我院擁有信息量龐大的歷屆教學(xué)評(píng)價(jià)數(shù)據(jù)和人事信息數(shù)據(jù),現(xiàn)在我們很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找決策的依據(jù),數(shù)據(jù)挖掘作為一種工具,其技術(shù)日趨成熟,我們將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)評(píng)價(jià)中,可以借助它去發(fā)掘數(shù)據(jù)中隱藏的規(guī)律或模式,為建立教學(xué)評(píng)價(jià)模型提供了捷徑,為決策提供科學(xué)的依據(jù)。
注:河北省教育學(xué)會(huì)“十二五”規(guī)劃課題(XHX NO,12550038)
參考文獻(xiàn):
級(jí)別:省級(jí)期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:省級(jí)期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級(jí)別:部級(jí)期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:CSCD期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫