网站首页
教育杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
医学杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
经济杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
金融杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
管理杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
科技杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
工业杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
SCI杂志
中科院1区 中科院2区 中科院3区 中科院4区
全部期刊
公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)下的學(xué)生管理數(shù)據(jù)

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)下的學(xué)生管理數(shù)據(jù)范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘技術(shù)下的學(xué)生管理數(shù)據(jù)

摘要:隨著教育信息化的普及,如何有效地利用學(xué)生管理過程中產(chǎn)生的數(shù)據(jù),提高學(xué)生管理水平和效率,成為了新時代學(xué)生管理過程中亟需解決的問題。文章通過決策樹分析,研究了溫州職業(yè)技術(shù)學(xué)院2013年9月-2018年12月學(xué)生晚歸與當(dāng)時天氣情況的聯(lián)系。研究發(fā)現(xiàn)在晴天、高溫(29℃以上)、風(fēng)力強(qiáng)(3級以上)的情況下,更容易發(fā)生晚歸。而在晴天、高溫(29℃以上)、風(fēng)力弱(0-3級)和晴天、低溫(20℃以下)的情況下,發(fā)生晚歸的情況明顯低于平均值。文章的研究結(jié)論可以幫助學(xué)生公寓管理人員,通過天氣預(yù)報提前識別可能發(fā)生的晚歸風(fēng)險,有針對性地進(jìn)行學(xué)生回寢的統(tǒng)計和檢查。從而降低因晚歸帶來的管理風(fēng)險,提高學(xué)生管理工作的有效性和針對性。

關(guān)鍵詞:晚歸;數(shù)據(jù)挖掘;決策樹;教育大數(shù)據(jù)

1概述

隨著現(xiàn)代計算機(jī)和存儲技術(shù)的發(fā)展,每天產(chǎn)生并被記錄的數(shù)據(jù)越來越多。在教育領(lǐng)域這些龐雜的數(shù)據(jù)涵蓋了學(xué)生學(xué)習(xí)、生活和管理的方方面面,是學(xué)校一筆隱性的資源。但是,由于數(shù)據(jù)本身量大,信息渠道錯綜復(fù)雜,導(dǎo)致大量數(shù)據(jù)不被重視,從而被認(rèn)為是“垃圾”而被忽略[1]。與此同時,高校規(guī)模的不斷擴(kuò)張和信息技術(shù)的發(fā)展,對學(xué)生管理、課堂教學(xué)以及就業(yè)工作都提出了新的挑戰(zhàn)。充分地利用教育領(lǐng)域的大數(shù)據(jù),及時地預(yù)測和判斷學(xué)生行為,能為高校在心理健康分析、教學(xué)質(zhì)量評估和學(xué)生就業(yè)等方面提供決策幫助[2]。隨著高校內(nèi)全面地推行一卡通,統(tǒng)一了學(xué)生管理信息獲取的渠道,為研究學(xué)生行為數(shù)據(jù)提供了物質(zhì)基礎(chǔ)。2014年12月起,成都電子科技大學(xué)教育大數(shù)據(jù)研究所在教育部的支持下,開始研發(fā)“學(xué)生畫像”系統(tǒng)。該系統(tǒng)通過學(xué)生日常生活數(shù)據(jù),如學(xué)生進(jìn)入圖書館次數(shù)、打水次數(shù)、就餐次數(shù)等,分析學(xué)生學(xué)習(xí)、生活狀態(tài)以及進(jìn)行過宅預(yù)警、抑郁預(yù)警等一系列預(yù)警,幫助教師和輔導(dǎo)員及時了解學(xué)生動態(tài)[2]。本文收集了溫州職業(yè)技術(shù)學(xué)院2013年9月-2018年12月時間內(nèi)的學(xué)生晚歸數(shù)據(jù)(晚歸定義:學(xué)生在規(guī)定的門禁時間之后回到公寓一種違紀(jì)情況),運(yùn)用決策樹分析法,研究晚歸的發(fā)生與當(dāng)天的天氣情況以及自然環(huán)境之間的關(guān)系。以此了解學(xué)生晚歸特點(diǎn),為學(xué)校公寓管理提供決策分析和幫助。

2數(shù)據(jù)與方法

本文收集了溫州職業(yè)技術(shù)學(xué)院2013年9月-2018年12月時間內(nèi)的學(xué)生晚歸數(shù)據(jù),總共整理匯總1319期學(xué)生晚歸公告。針對數(shù)據(jù)有效性進(jìn)行了篩選,最后得到832期晚歸公告,每一期公告代表一天,若該日晚上有學(xué)生晚歸,則記為該日發(fā)生晚歸,若該日無學(xué)生晚歸,則記為該日無晚歸。經(jīng)計算可知,總計832天平均發(fā)生晚歸的概率為63%。此外,根據(jù)晚歸數(shù)據(jù),查閱歷史天氣資料,整理匯總出對應(yīng)時間的最高氣溫、晴雨情況、風(fēng)力強(qiáng)度等天氣情況作為研究晚歸事件發(fā)生的標(biāo)簽[3]。數(shù)據(jù)挖掘(DataMing)本質(zhì)上是從海量的數(shù)據(jù)中提取潛在的有用信息[4]。決策樹算法是數(shù)據(jù)挖掘領(lǐng)域的一種重要的數(shù)據(jù)分類方法,其分類規(guī)則是計算劃分后樣本的信息增益,通過比較信息增益能夠快捷地將實(shí)際問題轉(zhuǎn)化成各種易操作的分類規(guī)則[5]。本文使用Python3.7實(shí)現(xiàn)決策樹ID3算法,研究晚歸發(fā)生與天氣情況之間的關(guān)系。

3數(shù)據(jù)分析與討論

為了研究學(xué)生晚歸情況與當(dāng)天天氣情況的關(guān)系,首先要將天氣情況數(shù)據(jù)離散化處理。如表1所示,根據(jù)日常經(jīng)驗(yàn)可以將風(fēng)力分為強(qiáng)弱兩類,將晴雨情況也可以分為晴天和雨天兩類。對于溫度標(biāo)簽,本文將它分為高中低三類,因此必須找到高溫與中溫、中溫和低溫的兩個臨界點(diǎn)(a,b)。筆者翻閱了相關(guān)資料發(fā)現(xiàn),對于氣溫高低的劃分并沒有統(tǒng)一的標(biāo)準(zhǔn)。為了更好地得到更好的分類結(jié)果,本文設(shè)計一個6×6溫度矩陣G,其中Gij=[ai,bj]代表一種最高溫度分類的可能,a=[15℃,16℃,17℃,18℃,19℃,20℃]b=[25℃,26℃,27℃,28℃,29℃,30℃]。根據(jù)溫度矩陣G,本文分別計算了上述36種可能的最高溫度分類情況下的決策樹。通過分別計算每一顆決策樹模型的準(zhǔn)確率,可知Gij=[20℃,29℃]時模型準(zhǔn)確率達(dá)到最高,從而實(shí)現(xiàn)對最高溫度的離散化處理,如下表1所示。如圖1a所示,本文通過Python3實(shí)現(xiàn)ID3算法,得到晚歸決策樹。分析決策樹可發(fā)現(xiàn),影響某一天晚上是否會發(fā)生晚歸的最主要因素是當(dāng)天是晴天還是雨天,其次是最高溫度,最后是風(fēng)力強(qiáng)度。該決策樹每一條樹枝的準(zhǔn)確率可通過計算得到:P1{X=晚歸│天氣晴∩氣溫高∩風(fēng)力強(qiáng)}=75%、P2{X=無│天氣晴∩氣溫高∩風(fēng)力弱}=46.9%、P3{X=晚歸│天氣晴∩氣溫中}=64.7%、P4{X=無│天氣晴∩氣溫低}=43.4%、P5{X=晚歸│天氣雨}=65.9%由上文可知,平均晚歸率為63%(即非晚歸率為37%),P1、P2和P4的準(zhǔn)確率分別都高出平均值12.5%、9.9%和6.4%,說明以上三種分類方式能夠有效地識別晚歸。P3和P5只比平均值高出1-2%,說明這兩種分類方式的效果不明顯。在決策樹模型中,針對分類效果不明顯的樹枝可以進(jìn)行適當(dāng)?shù)摹凹糁Α薄R虼?,本文根?zhǔn)確率剪去了如下兩條樹枝:{X=晚歸│天氣晴∩氣溫中}和{X=晚歸│天氣雨}。最終得到“剪枝”后的決策樹,如圖1b所示。

4結(jié)論

本文運(yùn)用數(shù)據(jù)挖掘的思想方法,對溫州職業(yè)技術(shù)學(xué)院2013年9月-2018年12月的學(xué)生晚歸數(shù)據(jù)進(jìn)行分析。通過Python實(shí)現(xiàn)決策樹ID3算法,分別研究了晚歸現(xiàn)象與最高溫度、晴雨情況以及風(fēng)力強(qiáng)度的關(guān)系。分析結(jié)果顯示,在晴天、高溫(29℃以上)、風(fēng)力強(qiáng)(3級及以上)的夜晚,發(fā)生晚歸的概率明顯高于平均值;在晴天、高溫(29℃以上)、風(fēng)力弱(0-3級)和晴天、低溫(20℃以下)的夜晚,學(xué)生晚歸的概率明顯低于平均值。該項(xiàng)研究結(jié)論可以幫助學(xué)生公寓管理人員,通過天氣預(yù)報提前識別可能發(fā)生晚歸的風(fēng)險日期,有針對性地進(jìn)行學(xué)生回寢的統(tǒng)計和檢查,提前聯(lián)系個別尚未回校的學(xué)生。從而降低因晚歸帶來的管理風(fēng)險,提高學(xué)生管理工作的有效性和針對性。

參考文獻(xiàn):

[1]丁波,孫力.教育數(shù)據(jù)挖掘研究現(xiàn)狀及趨勢[J].數(shù)字教育,2015(006):13-16.

[2]劉譞.基于學(xué)生行為的成績預(yù)測模型的研究與應(yīng)用[D].電子科技大學(xué),2017.

[3]魯瑋.數(shù)據(jù)挖掘技術(shù)在高職學(xué)生心理健康數(shù)據(jù)中的應(yīng)用研究[D].安徽大學(xué),2019.

[4]JIAWEIHAN,MICHELINEKAMBER,JIANPEI,etal.數(shù)據(jù)挖掘:概念與技術(shù)[M].2012.

[5]周志華,等.機(jī)器學(xué)習(xí)及其應(yīng)用2011[M].清華大學(xué)出版社,2011.

作者:葉超 單位:溫州職業(yè)技術(shù)學(xué)院

免责声明

本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。

AI写作,高效原创

在线指导,快速准确,满意为止

立即体验
文秘服务 AI帮写作 润色服务 论文发表