前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)分析統(tǒng)計(jì)學(xué)方法主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;統(tǒng)計(jì)學(xué);影響
隨著大數(shù)據(jù)時(shí)代的到來(lái),各企業(yè)采用了新的策略,獲得了更多的利潤(rùn)。對(duì)于統(tǒng)計(jì)專業(yè)來(lái)說(shuō),改變發(fā)展策略,使培養(yǎng)出來(lái)的專業(yè)人才能夠適應(yīng)大數(shù)據(jù)背景的需求是其主要任務(wù)。目前,高校統(tǒng)計(jì)學(xué)專業(yè)逐漸認(rèn)識(shí)到大數(shù)據(jù)時(shí)代綜合性人才培養(yǎng)的重要性,并對(duì)專業(yè)建設(shè)進(jìn)行了相關(guān)改革。
一、大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)學(xué)的影響
大數(shù)據(jù)時(shí)代的到來(lái)對(duì)現(xiàn)代統(tǒng)計(jì)專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來(lái)的人才能夠起到應(yīng)有的作用,首先要了解大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)專業(yè)所造成的影響。
(一)大數(shù)據(jù)時(shí)代使數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)性質(zhì)發(fā)生變化
網(wǎng)絡(luò)技術(shù)以及基于網(wǎng)絡(luò)技術(shù)的電子商務(wù)等新的數(shù)據(jù)記錄模式標(biāo)志著大數(shù)據(jù)時(shí)代的到來(lái)。大數(shù)據(jù)時(shí)代,不再依賴于抽樣調(diào)查的記錄模式,網(wǎng)站瀏覽、視頻監(jiān)控都將形成大量數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)甚至是數(shù)據(jù)性質(zhì)發(fā)生了變化。大量的數(shù)據(jù)信息對(duì)于需求者來(lái)說(shuō),如何甄別其可用價(jià)值成為關(guān)鍵。傳統(tǒng)的數(shù)據(jù)可以二維表格顯示和整理。但大數(shù)據(jù)時(shí)代所產(chǎn)生的數(shù)據(jù)具有多樣化和復(fù)雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數(shù)據(jù)的收集具有較強(qiáng)的目的性,才能實(shí)現(xiàn)其價(jià)值。
(二)大數(shù)據(jù)時(shí)代要求統(tǒng)計(jì)分析方法和統(tǒng)計(jì)思維更新
大數(shù)據(jù)時(shí)代的主要特征為數(shù)據(jù)多且復(fù)雜,數(shù)據(jù)分析要求分析者對(duì)總體進(jìn)行分析。在這一背景下,參數(shù)統(tǒng)計(jì)不再具有意義,假設(shè)檢驗(yàn)法也隨著總體分析而失去價(jià)值。數(shù)據(jù)的復(fù)雜化對(duì)傳統(tǒng)大數(shù)據(jù)統(tǒng)計(jì)思維造成了巨大的沖擊,要求統(tǒng)計(jì)者具有活躍的思維。只有對(duì)傳統(tǒng)數(shù)據(jù)的改變進(jìn)行分析,并且樹立新的統(tǒng)計(jì)方法。
二、大數(shù)據(jù)時(shí)代下的統(tǒng)計(jì)學(xué)發(fā)展新策略
為適應(yīng)大數(shù)據(jù)時(shí)代的需求,統(tǒng)計(jì)學(xué)專業(yè)的發(fā)展勢(shì)必要對(duì)傳統(tǒng)模式進(jìn)行改革。目前,多數(shù)高校統(tǒng)計(jì)學(xué)專業(yè)已經(jīng)認(rèn)識(shí)到大數(shù)據(jù)對(duì)于其發(fā)展帶來(lái)的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計(jì)學(xué)取得更好發(fā)展。
(一)加強(qiáng)統(tǒng)計(jì)應(yīng)用性教學(xué)
根據(jù)大數(shù)據(jù)時(shí)代數(shù)據(jù)的總體分析特征,數(shù)據(jù)分析人員應(yīng)掌握全面的分析方法。在人才培養(yǎng)過(guò)程中,應(yīng)致力于培養(yǎng)實(shí)踐分析能力,提高數(shù)據(jù)和資料收集能力,并且培養(yǎng)其強(qiáng)烈的數(shù)據(jù)價(jià)值觀,使其能夠從眾多數(shù)據(jù)中找到所需的。另外,對(duì)傳統(tǒng)模式進(jìn)行改革,增加大數(shù)據(jù)統(tǒng)計(jì)內(nèi)容,以適應(yīng)時(shí)代的需求?;诖髷?shù)據(jù)的結(jié)構(gòu)特點(diǎn),實(shí)施資料透視化教學(xué),提高分析者對(duì)復(fù)雜數(shù)據(jù)的分析能力。
(二)培養(yǎng)大數(shù)據(jù)統(tǒng)計(jì)思維
在人才培養(yǎng)過(guò)程中,新的統(tǒng)計(jì)思維的培養(yǎng)具有重要意義,即強(qiáng)調(diào)數(shù)據(jù)分析實(shí)踐能力的提高。統(tǒng)計(jì)思維的培養(yǎng)有助于數(shù)據(jù)分析者對(duì)復(fù)雜的數(shù)據(jù)進(jìn)行區(qū)分,從而整理有效信息。在大數(shù)據(jù)時(shí)代,不僅要以傳統(tǒng)的平均思維、動(dòng)態(tài)思維和變異思維為基礎(chǔ),還要注重基于整體分析的大數(shù)據(jù)思維。另外,還要培養(yǎng)數(shù)據(jù)分者的復(fù)雜性思維,以應(yīng)對(duì)復(fù)雜的數(shù)據(jù)庫(kù)??傊?,大數(shù)據(jù)時(shí)代需要數(shù)據(jù)分析者具有全面的、創(chuàng)新性的思維。
(三)強(qiáng)化基礎(chǔ)性統(tǒng)計(jì)知識(shí)
統(tǒng)計(jì)學(xué)自身具有復(fù)雜性,其改變多且抽象?;A(chǔ)的統(tǒng)計(jì)知識(shí)是進(jìn)一步掌握大數(shù)據(jù)分析思維的基礎(chǔ),可見學(xué)習(xí)基礎(chǔ)性統(tǒng)計(jì)知識(shí)的重要性是不言而喻的。為此,應(yīng)該采取深入淺出的方法,利用多媒體等方式使復(fù)雜的數(shù)據(jù)統(tǒng)計(jì)清晰化、簡(jiǎn)單化。結(jié)合具體的案例使數(shù)據(jù)分析者正確認(rèn)識(shí)統(tǒng)計(jì)概念、掌握統(tǒng)計(jì)原理和方法。此外大數(shù)據(jù)分析不再是一種專業(yè),而是更傾向于一種技術(shù),這要求我們將大數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)以外的相關(guān)知識(shí)相互聯(lián)系。注重真實(shí)相關(guān)與偽相關(guān)的講解,強(qiáng)調(diào)商務(wù)智能的開發(fā)和分析。只有具有堅(jiān)實(shí)的基礎(chǔ),才能確保數(shù)據(jù)分析者大數(shù)據(jù)分析思維的養(yǎng)成,適應(yīng)現(xiàn)代社會(huì)的需求。
(四)加強(qiáng)復(fù)合型人才培養(yǎng)
為適應(yīng)大數(shù)據(jù)時(shí)代的需求,復(fù)合型人才的培養(yǎng)是關(guān)鍵。所謂復(fù)合型人才,是指其不但要具有專業(yè)的數(shù)據(jù)分析能力,還要相應(yīng)的具備管理以及其從事專業(yè)的技術(shù)。大數(shù)據(jù)時(shí)代,高校應(yīng)建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數(shù)據(jù)分析能力、編程能力等,使其真正了解大數(shù)據(jù),懂得如何利用大數(shù)據(jù)對(duì)其所處的行業(yè)起到積極作用才是關(guān)鍵??傊?,大數(shù)據(jù)時(shí)代對(duì)綜合性人才具有更高的需求,大數(shù)據(jù)時(shí)代不僅培養(yǎng)的是一種能力,而且是一種思維,是對(duì)全新模式下的數(shù)據(jù)的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學(xué)模式的改革、對(duì)大數(shù)據(jù)時(shí)代所需教學(xué)模式的認(rèn)識(shí)是高校的主要任務(wù)。
三、總結(jié)
統(tǒng)計(jì)學(xué)是經(jīng)濟(jì)學(xué)的基礎(chǔ)課程,傳統(tǒng)的統(tǒng)計(jì)人才培養(yǎng)具有定向性。而隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)產(chǎn)生的形式多樣,且具有復(fù)雜性。大數(shù)據(jù)分析不僅是作為一種專業(yè)存在,而是應(yīng)以一項(xiàng)必備的技術(shù)而存在。大數(shù)據(jù)時(shí)代,傳統(tǒng)的統(tǒng)計(jì)思維和統(tǒng)計(jì)方法發(fā)生了改變,統(tǒng)計(jì)人才培養(yǎng)方式的改革也就勢(shì)在必行。(作者單位:海南師范大學(xué))
參考文獻(xiàn):
[1] 朱懷慶.大數(shù)據(jù)時(shí)代對(duì)本科經(jīng)管類統(tǒng)計(jì)學(xué)教學(xué)的影響及對(duì)策[J].高等教育研究,2014(3).
[2] 姚壽福.經(jīng)濟(jì)管理類本科專業(yè)統(tǒng)計(jì)學(xué)課程教學(xué)改革思考[J].高等教育研究,2012(3).
[3] 孫耀東.大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)專業(yè)課程教學(xué)探究[J].廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2015(06).
一、數(shù)理統(tǒng)計(jì)思想的形成
統(tǒng)計(jì)思想需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類社會(huì)需求的變化而開展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的數(shù)理統(tǒng)計(jì)思想。
二、數(shù)理統(tǒng)計(jì)思想的特點(diǎn)
數(shù)理統(tǒng)計(jì)思想從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在數(shù)理統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn)能從以下四個(gè)方面體現(xiàn)出:(1)數(shù)理統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)數(shù)理統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)數(shù)理統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)數(shù)理統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。
三、數(shù)理統(tǒng)計(jì)思想
就是統(tǒng)計(jì)實(shí)際工作、數(shù)理統(tǒng)計(jì)學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。數(shù)理統(tǒng)計(jì)的思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想。
1.均值思想
均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有數(shù)理統(tǒng)計(jì)學(xué)理論,是數(shù)理統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.變異思想
統(tǒng)計(jì)研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。數(shù)理統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類事物特征的抽象和宏觀度量。
3.估計(jì)思想
估計(jì)以樣本推測(cè)總體,是對(duì)同類事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。
4.相關(guān)思想
事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。
5.擬合思想
擬合是對(duì)不同類型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模于此而預(yù)示的可能性”。
6.檢驗(yàn)思想
數(shù)理統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。
四、數(shù)理統(tǒng)計(jì)的思想方法?
1.要更正不正確的思想認(rèn)識(shí)
英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如GNP、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。
2.要不斷拓展統(tǒng)計(jì)思維方式
數(shù)理統(tǒng)計(jì)學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測(cè)到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識(shí)或去驗(yàn)證一個(gè)假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過(guò)偶然性去發(fā)現(xiàn)必然性。演繹推理是對(duì)統(tǒng)計(jì)認(rèn)識(shí)能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識(shí)偶然性方面,具有很大的作用。
3.要深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí)
任何統(tǒng)計(jì)研究都離不開數(shù)據(jù)分析。因?yàn)檫@是得到統(tǒng)計(jì)研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計(jì)分析的形式隨時(shí)代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計(jì)分析的目的卻一直沒(méi)有改變。對(duì)統(tǒng)計(jì)數(shù)據(jù)分析的原因有以下三個(gè)方面:一是基于同樣的數(shù)據(jù)會(huì)得出不同、甚至相反的分析結(jié)論;二是我們所面對(duì)的分析數(shù)據(jù)有時(shí)是缺損的或存在不真實(shí)性;三是我們所面對(duì)的分析數(shù)據(jù)有時(shí)則又是海量的,讓人無(wú)從下手。雖然統(tǒng)計(jì)數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析、推斷性數(shù)據(jù)分析和探索性數(shù)據(jù)分析等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類不斷提高的要求相比,存在的問(wèn)題似乎也越來(lái)越多。所以,我們必須深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí),圍繞“準(zhǔn)確解答特定問(wèn)題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術(shù)的研究。
數(shù)理統(tǒng)計(jì)思想方法應(yīng)用必須堅(jiān)持以事實(shí)為依據(jù)、用數(shù)據(jù)說(shuō)話的原則,把統(tǒng)計(jì)技術(shù)的應(yīng)用與專業(yè)技術(shù)緊密結(jié)合,在考慮統(tǒng)計(jì)項(xiàng)目實(shí)施時(shí),應(yīng)從理論和事實(shí)層面上注重分析和使用條件,認(rèn)真權(quán)衡各種關(guān)聯(lián)因素。數(shù)理統(tǒng)計(jì)學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計(jì)的理論成果,堅(jiān)持統(tǒng)計(jì)學(xué)的社會(huì)科學(xué)性質(zhì),使統(tǒng)計(jì)理論研究更接近統(tǒng)計(jì)工作實(shí)際,在國(guó)家和社會(huì)得到廣泛發(fā)展。
參考文獻(xiàn)
[1] 陳福貴.統(tǒng)計(jì)思想雛議[J]北京統(tǒng)計(jì),?2004,(05).
[2] 龐有貴.統(tǒng)計(jì)工作及統(tǒng)計(jì)思想[J]科技情報(bào)開發(fā)與經(jīng)濟(jì),?2004,(03).
[3] 范文正.幾種基本統(tǒng)計(jì)思想的現(xiàn)實(shí)意義[J]統(tǒng)計(jì)與決策,?2007,(08).
【論文摘要】所謂統(tǒng)計(jì)思想,就是在統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論的應(yīng)用研究中,必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想等思想。文章通過(guò)對(duì)統(tǒng)計(jì)思想的闡釋,提出關(guān)于統(tǒng)計(jì)思想認(rèn)識(shí)的三點(diǎn)思考。
1關(guān)于統(tǒng)計(jì)學(xué)
統(tǒng)計(jì)學(xué)是一門實(shí)質(zhì)性的社會(huì)科學(xué),既研究社會(huì)生活的客觀規(guī)律,也研究統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計(jì)的理論成果,堅(jiān)持統(tǒng)計(jì)學(xué)的社會(huì)科學(xué)性質(zhì),使統(tǒng)計(jì)理論研究更接近統(tǒng)計(jì)工作實(shí)際,在國(guó)家和社會(huì)得到廣泛發(fā)展。
2 統(tǒng)計(jì)學(xué)中的幾種統(tǒng)計(jì)思想
2.1 統(tǒng)計(jì)思想的形成
統(tǒng)計(jì)思想不是天然形成的,需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類社會(huì)需求的變化而開展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計(jì)思想。
2.2 比較常用的幾種統(tǒng)計(jì)思想
所謂統(tǒng)計(jì)思想,就是統(tǒng)計(jì)實(shí)際工作、統(tǒng)計(jì)學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計(jì)思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想。現(xiàn)分述如下:
2.2.1 均值思想
均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有統(tǒng)計(jì)學(xué)理論,是統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.2.2 變異思想
統(tǒng)計(jì)研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類事物特征的抽象和宏觀度量。
2.2.3 估計(jì)思想
估計(jì)以樣本推測(cè)總體,是對(duì)同類事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。
2.2.4 相關(guān)思想
事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。
2.2.5 擬合思想
擬合是對(duì)不同類型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。
2.2.6 檢驗(yàn)思想
統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。
2.3 統(tǒng)計(jì)思想的特點(diǎn)
作為一門應(yīng)用統(tǒng)計(jì)學(xué),它從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn)能從以下四個(gè)方面體現(xiàn)出:(1)統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。
3 對(duì)統(tǒng)計(jì)思想的一些思考
3.1 要更正當(dāng)前存在的一些不正確的思想認(rèn)識(shí)
英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如gnp、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。
3.2要不斷拓展統(tǒng)計(jì)思維方式
統(tǒng)計(jì)學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測(cè)到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識(shí)或去驗(yàn)證一個(gè)假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過(guò)偶然性去發(fā)現(xiàn)必然性。演繹推理是對(duì)統(tǒng)計(jì)認(rèn)識(shí)能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識(shí)偶然性方面,具有很大的作用。
3.3深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí)
任何統(tǒng)計(jì)研究都離不開數(shù)據(jù)分析。因?yàn)檫@是得到統(tǒng)計(jì)研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計(jì)分析的形式隨時(shí)代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計(jì)分析的目的卻一直沒(méi)有改變。對(duì)統(tǒng)計(jì)數(shù)據(jù)分析的原因有以下三個(gè)方面:一是基于同樣的數(shù)據(jù)會(huì)得出不同、甚至相反的分析結(jié)論;二是我們所面對(duì)的分析數(shù)據(jù)有時(shí)是缺損的或存在不真實(shí)性;三是我們所面對(duì)的分析數(shù)據(jù)有時(shí)則又是海量的,讓人無(wú)從下手。雖然統(tǒng)計(jì)數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(dda)、推斷性數(shù)據(jù)分析(ida)和探索性數(shù)據(jù)分析(eda)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類不斷提高的要求相比,存在的問(wèn)題似乎也越來(lái)越多。所以,我們必須深化對(duì)數(shù)據(jù)分析的認(rèn)識(shí),圍繞“準(zhǔn)確解答特定問(wèn)題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術(shù)的研究。
參考文獻(xiàn):
[1] 陳福貴.統(tǒng)計(jì)思想雛議[j]北京統(tǒng)計(jì), 2004,(05) .
[2] 龐有貴.統(tǒng)計(jì)工作及統(tǒng)計(jì)思想[j]科技情報(bào)開發(fā)與經(jīng)濟(jì), 2004,(03) .
一、統(tǒng)計(jì)學(xué)中的幾種常見統(tǒng)計(jì)思想
統(tǒng)計(jì)思想主要包括:均值思想、變異思想、估計(jì)思想、相關(guān)思想、擬合思想、檢驗(yàn)思想等。統(tǒng)計(jì)思想不是天然形成的,需要經(jīng)歷統(tǒng)計(jì)觀念、統(tǒng)計(jì)意識(shí)、統(tǒng)計(jì)理念等階段。統(tǒng)計(jì)思想是根據(jù)人類社會(huì)需求的變化而開展各種統(tǒng)計(jì)實(shí)踐、統(tǒng)計(jì)理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計(jì)思想。作為一門應(yīng)用統(tǒng)計(jì)學(xué),它從數(shù)理統(tǒng)計(jì)學(xué)派汲取新的營(yíng)養(yǎng),并且越來(lái)越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來(lái)越密切,但在統(tǒng)計(jì)思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點(diǎn):(1)統(tǒng)計(jì)思想強(qiáng)調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計(jì)思想強(qiáng)調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計(jì)思想強(qiáng)調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計(jì)思想強(qiáng)調(diào)定性分析與定量分析的統(tǒng)一。
1.均值思想。均值是對(duì)所要研究對(duì)象的簡(jiǎn)明而重要的代表。均值概念幾乎涉及所有統(tǒng)計(jì)學(xué)理論,是統(tǒng)計(jì)學(xué)的基本思想。均值思想也要求從總體上看問(wèn)題,但要求觀察其一般發(fā)展趨勢(shì),避免個(gè)別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。
2.變異思想。統(tǒng)計(jì)研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計(jì)方法就是要認(rèn)識(shí)事物數(shù)量方面的差異。統(tǒng)計(jì)學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對(duì)同類事物特征的抽象和宏觀度量。
3.估計(jì)思想。估計(jì)以樣本推測(cè)總體,是對(duì)同類事物的由此及彼式的認(rèn)識(shí)方法。使用估計(jì)方法有一個(gè)預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計(jì)理論對(duì)置信程度的測(cè)量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。
4.相關(guān)思想。事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個(gè)別事務(wù)所組成,這些個(gè)別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個(gè)體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。
5.擬合思想。擬合是對(duì)不同類型事物之間關(guān)系之表象的抽象。任何一個(gè)單一的關(guān)系必須依賴其他關(guān)系而存在,所有實(shí)際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對(duì)規(guī)律或趨勢(shì)的擬合。擬合的成果是模型,反映一般趨勢(shì)。趨勢(shì)表達(dá)的是“事物和關(guān)系的變化過(guò)程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。
6.檢驗(yàn)思想。統(tǒng)計(jì)方法總是歸納性的,其結(jié)論永遠(yuǎn)帶有一定的或然性,基于局部特征和規(guī)律所推廣出來(lái)的判斷不可能完全可信,檢驗(yàn)過(guò)程就是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征的假設(shè)是否可信。
二、對(duì)統(tǒng)計(jì)思想的若干思考
1.要改變當(dāng)前存在的一些不正確的思想認(rèn)識(shí)。英國(guó)著名生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓曾經(jīng)說(shuō)過(guò):“統(tǒng)計(jì)學(xué)具有處理復(fù)雜問(wèn)題的非凡能力,當(dāng)科學(xué)的探索者在前進(jìn)的過(guò)程中荊棘載途時(shí),唯有統(tǒng)計(jì)學(xué)可以幫助他們打開一條通道”。但事實(shí)并非這么簡(jiǎn)單,因?yàn)槲覀兯媾R的現(xiàn)實(shí)問(wèn)題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜,越科學(xué)。在實(shí)際的分析研究中,喜歡簡(jiǎn)單問(wèn)題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實(shí),真正的科學(xué)是使復(fù)雜的問(wèn)題簡(jiǎn)單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計(jì)才是科學(xué),描述統(tǒng)計(jì)不是科學(xué),并延伸擴(kuò)大到只有數(shù)理統(tǒng)計(jì)是科學(xué)、社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)不是科學(xué)這樣的認(rèn)識(shí)。這種認(rèn)識(shí)是極其錯(cuò)誤的,至少是對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的無(wú)知。比利時(shí)數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計(jì)學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計(jì)學(xué)創(chuàng)建成改良社會(huì)的一種工具。經(jīng)濟(jì)學(xué)和人口統(tǒng)計(jì)學(xué)中的某些近代概念,如GNP、人口增長(zhǎng)率等等,均是凱特勒及其弟子們的遺產(chǎn)。
培養(yǎng)數(shù)據(jù)分析觀念是小學(xué)數(shù)學(xué)“統(tǒng)計(jì)與概率”領(lǐng)域內(nèi)容的核心目標(biāo),《義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2011)》后,特別是在2015年教育部提出“核心素養(yǎng)”以來(lái),數(shù)據(jù)分析觀念的培養(yǎng)得到前所未有的關(guān)注和重視。
數(shù)據(jù)分析是反映由一組數(shù)據(jù)引發(fā)的思考,人們可以分析與推測(cè)出可能的結(jié)論。數(shù)據(jù)分析強(qiáng)調(diào)的是數(shù)據(jù),是實(shí)證判斷,而不是憑感覺(jué)臆斷,既要回顧分析,又要做出預(yù)期,既要關(guān)注局部,又要關(guān)注整體。因此,數(shù)據(jù)分析觀念的培養(yǎng)需要學(xué)生親歷與體驗(yàn)。
史寧中教授在他的《基本概念與運(yùn)算方法》一書中指出:“統(tǒng)計(jì)學(xué)研究的基礎(chǔ)是數(shù)據(jù),是通過(guò)對(duì)數(shù)據(jù)的分析得到產(chǎn)生數(shù)據(jù)背景的信息?!苯y(tǒng)計(jì)學(xué)與數(shù)學(xué)有所不同,數(shù)學(xué)研究的基礎(chǔ)是抽象了的定義與假設(shè),而統(tǒng)計(jì)學(xué)強(qiáng)調(diào)的是數(shù)據(jù),是數(shù)據(jù)分析觀念。如平均數(shù)在數(shù)學(xué)里只是一個(gè)算式的運(yùn)算結(jié)果,而在統(tǒng)計(jì)學(xué)里是一個(gè)重要概念,使用平均數(shù)反映一組數(shù)據(jù)的水平以及產(chǎn)生的影響。
當(dāng)前,教師們關(guān)注與研究更多的是數(shù)學(xué),對(duì)統(tǒng)計(jì)學(xué)的認(rèn)識(shí)還比較模糊,在實(shí)際教學(xué)中難免出現(xiàn)偏差。那么,如何引導(dǎo)學(xué)生經(jīng)歷統(tǒng)計(jì)過(guò)程,更好地促進(jìn)和培養(yǎng)數(shù)據(jù)分析觀念呢?筆者認(rèn)為,“統(tǒng)計(jì)與概率”教學(xué)要重視以下四個(gè)方面的轉(zhuǎn)變。
一、資源利用變虛擬為真實(shí)
教材提供的活動(dòng)設(shè)計(jì),或出現(xiàn)的一組數(shù)據(jù),本質(zhì)上都是虛擬情境,學(xué)生難以獲得真實(shí)的經(jīng)歷與體驗(yàn),如果開發(fā)真實(shí)的活動(dòng)資源,經(jīng)歷真實(shí)的統(tǒng)計(jì)過(guò)程,效果更佳。
例如,教師組織課堂內(nèi)的統(tǒng)計(jì)活動(dòng)――摸球游戲:袋子里裝了10顆球,有紅球和黃球。不打開袋子看,你怎樣才能知道紅球多還是黃球多?要求先討論摸球規(guī)則,再分組進(jìn)行“我摸你猜”的摸球游戲。學(xué)生根據(jù)小組內(nèi)的摸球統(tǒng)計(jì)數(shù)據(jù),初步猜想哪種顏色的球多,感受小數(shù)據(jù)信息的作用。接著,學(xué)生進(jìn)行小組摸球情況對(duì)比,分析與大多數(shù)摸球情況不同的個(gè)案,探討能讓實(shí)驗(yàn)判斷更為準(zhǔn)確的方法。最后,匯總?cè)鄶?shù)據(jù),感受數(shù)據(jù)信息量變大之后給“哪種球多”的判斷帶來(lái)的變化。學(xué)生經(jīng)歷試驗(yàn)、猜想與驗(yàn)證的過(guò)程,感受隨機(jī)現(xiàn)象的不確定性,以及隨機(jī)現(xiàn)象背后隱藏的一般規(guī)律。有些統(tǒng)計(jì)活動(dòng)還可以從課堂內(nèi)延伸到課堂外,使學(xué)生親歷實(shí)實(shí)在在的統(tǒng)計(jì)過(guò)程。
二、統(tǒng)計(jì)活動(dòng)變“一般”為內(nèi)涵
小學(xué)階段的統(tǒng)計(jì)方式最為簡(jiǎn)單,無(wú)非是收集數(shù)據(jù)、整理數(shù)據(jù)與簡(jiǎn)單的數(shù)據(jù)分析,但從統(tǒng)計(jì)背景和統(tǒng)計(jì)學(xué)的視角看,在統(tǒng)計(jì)過(guò)程中還可以從以下方面挖掘內(nèi)涵。
1. 樣本感知。
例如,教學(xué)中進(jìn)行“全班學(xué)生最喜歡哪個(gè)體育項(xiàng)目”的調(diào)查活動(dòng),教師不應(yīng)著急調(diào)查統(tǒng)計(jì),讓學(xué)生先對(duì)樣本的選擇有初步的感受。引導(dǎo)學(xué)生選擇與討論:三種調(diào)查方法,哪種比較合適?(1)問(wèn)自己最要好的幾位同學(xué);(2)問(wèn)自己小組的所有同學(xué);(3)問(wèn)全班同學(xué)。然后,再次討論:要知道全校同學(xué)最喜歡哪種體育項(xiàng)目,你認(rèn)為哪種方法比較合適?(1)問(wèn)全校學(xué)生;(2)調(diào)查每個(gè)年級(jí)的一個(gè)班級(jí)學(xué)生;(3)在校門隨機(jī)詢問(wèn)部分學(xué)生。引導(dǎo)學(xué)生聚焦樣本的代表性與可操作性,建立樣本概念,感知總體與抽樣調(diào)查的樣本選擇。
2. 嘗試方法。
在收集數(shù)據(jù)與統(tǒng)計(jì)數(shù)據(jù)的過(guò)程中,不同情況下采用的統(tǒng)計(jì)方法也會(huì)不一樣,教師需要提供給學(xué)生嘗試不同方法的機(jī)會(huì),感受調(diào)查方法的多樣性和不同方法的優(yōu)點(diǎn)。
例如,每學(xué)年末的不同學(xué)科教師的滿意度調(diào)查,先采用逐一詢問(wèn)同學(xué)后畫正字的統(tǒng)計(jì)方式,讓學(xué)生感受該方法效率的低下;然后采用全班舉手的方式,學(xué)生感受快捷與方便,但又發(fā)現(xiàn)這樣統(tǒng)計(jì)真實(shí)性受到影響,學(xué)生對(duì)這樣的調(diào)查統(tǒng)計(jì)沒(méi)有心理安全感,進(jìn)而討論更科學(xué)的調(diào)查統(tǒng)計(jì)方法。最后采用不記名問(wèn)卷統(tǒng)計(jì)完成調(diào)查任務(wù),學(xué)生對(duì)無(wú)記名問(wèn)卷的真實(shí)性有了初步的感受。如果用網(wǎng)絡(luò)無(wú)記名調(diào)查問(wèn)卷的方式,學(xué)生在規(guī)定時(shí)間內(nèi),可以在不同地方完成問(wèn)卷,時(shí)效更佳。
3. 體會(huì)價(jià)值。
一般情況下,課堂上教師都會(huì)讓學(xué)生說(shuō)一說(shuō)統(tǒng)計(jì)與統(tǒng)計(jì)結(jié)果的用處,比如調(diào)查統(tǒng)計(jì)學(xué)生最喜歡的運(yùn)動(dòng)項(xiàng)目,那么就可以建議學(xué)校多開展這項(xiàng)體育活動(dòng),但這就像是一場(chǎng)模擬活動(dòng),學(xué)生還是沒(méi)有獲得真切的價(jià)值體驗(yàn)。我們所期待的效果是,通過(guò)統(tǒng)計(jì)活動(dòng),學(xué)生可以發(fā)現(xiàn)問(wèn)題,讓他們看到事物的發(fā)展變化,才能更好地體驗(yàn)統(tǒng)計(jì)的價(jià)值。
例如,筆者針對(duì)校園周邊環(huán)境臟亂差的現(xiàn)象,組織學(xué)生開展研究性學(xué)習(xí)活動(dòng)。學(xué)生通過(guò)調(diào)查,發(fā)現(xiàn)校園周邊臟亂差現(xiàn)象的成因是小攤小販占道經(jīng)營(yíng),不僅阻礙學(xué)生通行,還留下了許多垃圾。隨著調(diào)查的深入,他們發(fā)現(xiàn)在小攤販購(gòu)買早餐的主要群體是學(xué)生。進(jìn)一步在五年級(jí)開展的問(wèn)卷調(diào)查中,學(xué)生發(fā)現(xiàn):經(jīng)常在小攤販吃早餐的學(xué)生占全年級(jí)總數(shù)的34%,其中外來(lái)務(wù)工人員子女占92%,主要原因是父母沒(méi)時(shí)間準(zhǔn)備早餐。取得第一手?jǐn)?shù)據(jù)資料后,由學(xué)生策劃的“家里吃早餐,安全又健康”的活動(dòng)隨即展開:給家長(zhǎng)一封倡議書,開設(shè)保健與養(yǎng)生課,與街道、城管等多部門齊抓共管,使得校園周邊環(huán)境得到徹底改善。在調(diào)查、統(tǒng)計(jì)、分析、活動(dòng)的過(guò)程中,學(xué)生真切感受到調(diào)查統(tǒng)計(jì)對(duì)具體事物所產(chǎn)生的變化,體現(xiàn)了它的實(shí)用價(jià)值。
三、統(tǒng)計(jì)圖的選擇變“絕對(duì)”為“相對(duì)”
在小學(xué)階段,主要有三種統(tǒng)計(jì)圖供教學(xué)選擇,它們都可以直接表述數(shù)據(jù),但還是有各自的特點(diǎn):條形統(tǒng)計(jì)圖能清楚地表述數(shù)量的多少,扇形統(tǒng)計(jì)圖能清楚地表述數(shù)量所占的比例,折線統(tǒng)計(jì)圖能清楚地表述數(shù)量的變化情況。一般統(tǒng)計(jì)圖選擇的標(biāo)準(zhǔn)是:離散的數(shù)據(jù)用條形統(tǒng)計(jì)圖,連續(xù)的數(shù)據(jù)用折線統(tǒng)計(jì)圖。但統(tǒng)計(jì)學(xué)與數(shù)學(xué)不同,統(tǒng)計(jì)圖的選擇只有“好壞”之分而無(wú)“對(duì)錯(cuò)”之分,也就是說(shuō),要表述離散數(shù)據(jù)的變化規(guī)律或發(fā)展趨勢(shì),也可以采用折線統(tǒng)計(jì)圖,要表述連續(xù)數(shù)據(jù)的多少,也可以用條形統(tǒng)計(jì)圖。
例如,要表述兩個(gè)班在運(yùn)動(dòng)會(huì)4個(gè)項(xiàng)目上的成績(jī)對(duì)比。
如果用折線統(tǒng)計(jì)圖表示,也能清楚地反映1班各個(gè)項(xiàng)目成績(jī)總體高于2班,但在第三個(gè)項(xiàng)目成績(jī)對(duì)比中出現(xiàn)反差,2班的得分明顯高于1班,要引起1班的重視,查找原因;而2班在第三個(gè)項(xiàng)目上總結(jié)成功經(jīng)驗(yàn),在其他項(xiàng)目上要總結(jié)經(jīng)驗(yàn)教訓(xùn)、改變策略。
因此,統(tǒng)計(jì)圖選擇的關(guān)鍵在于你要表達(dá)什么,能達(dá)到目的即可,教學(xué)時(shí)切忌一刀切。
四、統(tǒng)計(jì)課程變單一學(xué)科教學(xué)為學(xué)科整合
“統(tǒng)計(jì)與概率”作為數(shù)學(xué)課程重要內(nèi)容,分布在每一冊(cè)教材中,它作為數(shù)學(xué)教學(xué)的一個(gè)模塊,意味著課時(shí)量有限,讓學(xué)生充分體驗(yàn)統(tǒng)計(jì)過(guò)程有一定難度。教師需要拓展統(tǒng)計(jì)教學(xué)的時(shí)間與空間,將統(tǒng)計(jì)活動(dòng)滲透到各個(gè)相關(guān)學(xué)科的教學(xué)中,與學(xué)科教師合作,整合課程內(nèi)容,更好地培養(yǎng)統(tǒng)計(jì)意識(shí),達(dá)成提升學(xué)生數(shù)據(jù)分析觀念水平的目的。
舉例來(lái)說(shuō),筆者所在學(xué)校開展全員體鍛活動(dòng)一年有余,體育教師感覺(jué)學(xué)生的體質(zhì)健康水平有了很大提高,這一結(jié)論要有說(shuō)服力,就需要用數(shù)據(jù)證明,讓學(xué)生親歷數(shù)據(jù)收集、整理、分析與判斷的過(guò)程是很有意義的活動(dòng)。學(xué)科教師合作引導(dǎo)學(xué)生收集體鍛前與體鍛后同年級(jí)身高、脈搏、近視率,以及各項(xiàng)運(yùn)動(dòng)水平的真實(shí)數(shù)據(jù),制作成復(fù)式條形統(tǒng)計(jì)圖和折線統(tǒng)計(jì)圖,條形統(tǒng)計(jì)圖對(duì)比前后兩年同期學(xué)生的健康水平,折線統(tǒng)計(jì)圖顯示同一個(gè)學(xué)生在體鍛前與體鍛后健康水平的差異,數(shù)據(jù)顯示,學(xué)生的脈搏與近視率等各項(xiàng)指標(biāo)的變化讓人吃驚,學(xué)生在經(jīng)歷統(tǒng)計(jì)的過(guò)程中體驗(yàn)運(yùn)動(dòng)的重要性。讓人意想不到的是,全校師生在數(shù)據(jù)面前統(tǒng)一了思想認(rèn)識(shí),全員體鍛的理念得到持久地貫徹與落實(shí)。
關(guān)鍵詞:大數(shù)據(jù);應(yīng)用統(tǒng)計(jì)學(xué);教學(xué)改革
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2016)43-0101-03
一、研究背景
自2002年桂林理工大學(xué)在廣西開辦了第一個(gè)統(tǒng)計(jì)學(xué)本科專業(yè)以來(lái),針對(duì)當(dāng)時(shí)理學(xué)學(xué)位的統(tǒng)計(jì)學(xué)專業(yè)培養(yǎng)的學(xué)生雖然數(shù)理基礎(chǔ)相對(duì)扎實(shí),但普遍統(tǒng)計(jì)思想不夠,實(shí)際應(yīng)用能力較弱的現(xiàn)狀和特點(diǎn),對(duì)統(tǒng)計(jì)學(xué)專業(yè)進(jìn)行了全方位的改革研究,確立了"數(shù)學(xué)與統(tǒng)計(jì)學(xué)相融,從培養(yǎng)學(xué)生扎實(shí)的數(shù)理基礎(chǔ)和極強(qiáng)的統(tǒng)計(jì)分析應(yīng)用能力有機(jī)相結(jié)合的理念出發(fā),構(gòu)建了新的課程體系和教學(xué)內(nèi)容,取得了系列研究成果。2009年研究成果開創(chuàng)“應(yīng)用性、實(shí)驗(yàn)性、案例性”一體化的統(tǒng)計(jì)學(xué)專業(yè)課程體系和教學(xué)模式,獲得廣西高等教育自治區(qū)級(jí)教學(xué)成果二等獎(jiǎng)[1],并在其后分別把統(tǒng)計(jì)學(xué)學(xué)科建成廣西重點(diǎn)學(xué)科和廣西高等學(xué)校優(yōu)勢(shì)特色專業(yè),以及把應(yīng)用統(tǒng)計(jì)實(shí)驗(yàn)室建成廣西高等學(xué)校重點(diǎn)實(shí)驗(yàn)室。
雖然我校統(tǒng)計(jì)學(xué)專業(yè)的教學(xué)改革和建設(shè)取得了許多成果,但近幾年,我們也逐漸感覺(jué)到在大數(shù)據(jù)新形勢(shì)下,我校應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)的教學(xué)體系還有一些不適應(yīng)的地方,且某些問(wèn)題還有日益凸顯的趨勢(shì),我們?cè)瓉?lái)的某些研究成果已不再適應(yīng)新時(shí)代的要求,這就迫使我們繼續(xù)進(jìn)行改革研究,探討在大數(shù)據(jù)背景的新形勢(shì)下,如何培養(yǎng)統(tǒng)計(jì)學(xué)專業(yè)復(fù)合型和應(yīng)用型人才,如何準(zhǔn)確把握統(tǒng)計(jì)學(xué)的發(fā)展方向與發(fā)展形勢(shì),如何調(diào)整人才培養(yǎng)模式,如何調(diào)整相關(guān)課程和課程內(nèi)容,以培養(yǎng)適應(yīng)大數(shù)據(jù)背景下社會(huì)經(jīng)濟(jì)發(fā)展需要的統(tǒng)計(jì)學(xué)專業(yè)人才。
許多國(guó)家越來(lái)越重視數(shù)據(jù)在大數(shù)據(jù)時(shí)代重要作用,我國(guó)也不例外,2012年9月,國(guó)家統(tǒng)計(jì)局第7次局務(wù)會(huì)提出,盡快開展在政府統(tǒng)計(jì)中應(yīng)用大數(shù)據(jù)的研究。2013年可以看作是我國(guó)政府統(tǒng)計(jì)之大數(shù)據(jù)元年。2015年9月《國(guó)務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》(國(guó)發(fā)〔2015〕50號(hào))[2]頒布,標(biāo)志著我國(guó)正逐步進(jìn)入大數(shù)據(jù)建設(shè)的新時(shí)代,為此,國(guó)家統(tǒng)計(jì)局積極推動(dòng)大數(shù)據(jù)在各方面的應(yīng)用與實(shí)踐。而大數(shù)據(jù)的核心是數(shù)據(jù),應(yīng)用統(tǒng)計(jì)學(xué)學(xué)科是與數(shù)據(jù)分析處理聯(lián)系最為緊密的應(yīng)用性學(xué)科,因此,應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)的教學(xué)體系應(yīng)順應(yīng)大數(shù)據(jù)發(fā)展的趨勢(shì)。在大數(shù)據(jù)背景下,應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)在繼承傳統(tǒng)數(shù)據(jù)分析技術(shù)的基礎(chǔ)上,對(duì)所需的數(shù)據(jù)處理技能提出的需求更高了。這就是說(shuō),大數(shù)據(jù)對(duì)應(yīng)用統(tǒng)計(jì)學(xué)的培養(yǎng)目標(biāo),以及教學(xué)內(nèi)容等的沖擊無(wú)疑是最大且不可避免的,這給應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)帶來(lái)了巨大的挑戰(zhàn),同時(shí)也為應(yīng)用統(tǒng)計(jì)學(xué)學(xué)科的發(fā)展帶來(lái)了前所未有的機(jī)遇。
大數(shù)據(jù)逼迫人們改變分析、處理數(shù)據(jù)的手段、思維和理念,這就逼迫應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)改革必須引入新手段、新思維和新理念。培養(yǎng)應(yīng)用統(tǒng)計(jì)學(xué)人才必須與時(shí)俱進(jìn),才能不斷適應(yīng)大數(shù)據(jù)新時(shí)代的要求,這關(guān)系到應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)培養(yǎng)的人才能否適應(yīng)和滿足社會(huì)的需求,因此,這一研究是十分必要、十分迫切且有著重要的理論和實(shí)際應(yīng)用意義。
二、大數(shù)據(jù)背景下應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)的改革探討
一、大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的區(qū)別
統(tǒng)計(jì)知識(shí)在大數(shù)據(jù)的利用研究中有多樣化的應(yīng)用形式,主要是對(duì)“大數(shù)據(jù)”進(jìn)行肢解,對(duì)爆炸增長(zhǎng)的數(shù)據(jù)信息進(jìn)行搜索、分類以及整合主要依賴于統(tǒng)計(jì)學(xué)。因此,大數(shù)據(jù)的相關(guān)研究在一定程度上運(yùn)用了統(tǒng)計(jì)學(xué)的知識(shí)。但是,大數(shù)據(jù)的使用尚未被統(tǒng)計(jì)學(xué)這門學(xué)科充分利用,這主要是因?yàn)榇髷?shù)據(jù)的運(yùn)用方式,使用模式和統(tǒng)計(jì)學(xué)之間存在著重要差異。統(tǒng)計(jì)學(xué)主要利用的是樣本統(tǒng)計(jì)資源,樣本主要在根據(jù)既定的概率標(biāo)準(zhǔn)從總體中抽樣調(diào)查,但是隨機(jī)抽樣調(diào)查是帶有成本屬性的,例如消耗時(shí)間、資本投入的成本等。在樣本數(shù)量逐漸增加的情況下,樣本估計(jì)的誤差范圍是伴隨著總體樣本數(shù)量的增大而逐漸增加的,這是樣本統(tǒng)計(jì)學(xué)不能忽視的缺點(diǎn)。大數(shù)據(jù)時(shí)代最具代表性的就是海量的信息數(shù)據(jù)化以及即時(shí)電子商務(wù)信息,大數(shù)據(jù)在整體上呈現(xiàn)出“總體樣本數(shù)據(jù)化”的趨勢(shì),這樣的特征恰好可以補(bǔ)充樣本統(tǒng)計(jì)的弊端。大數(shù)據(jù)環(huán)境下的整體樣本統(tǒng)計(jì)即使可以囊括全部的樣本容量,但是因?yàn)楹芏嗲闆r下數(shù)據(jù)具有非結(jié)構(gòu)性和半數(shù)據(jù)化的特征,而且大量的數(shù)據(jù)資源呈現(xiàn)的是重視尾部分布的狀態(tài),方差、標(biāo)準(zhǔn)差等標(biāo)準(zhǔn)化的方法變得毫無(wú)意義,整體依靠性和不穩(wěn)定性經(jīng)常會(huì)超越經(jīng)典時(shí)間內(nèi)的時(shí)間序列的整體假設(shè)性,所以概率論的應(yīng)用范圍呈現(xiàn)狹窄化的發(fā)展趨勢(shì)。因此,統(tǒng)計(jì)學(xué)在利用大數(shù)據(jù)進(jìn)行樣本統(tǒng)計(jì)的過(guò)程中,可以對(duì)整體上的數(shù)據(jù)資源進(jìn)行融合和選擇,這和樣本統(tǒng)計(jì)中的數(shù)據(jù)化處理技術(shù)存在異曲同工之妙。
二、大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)教育的發(fā)展
1.全面培養(yǎng)人才素質(zhì)
統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生需要具備良好與人交往能力。統(tǒng)計(jì)學(xué)的學(xué)生很多都是理科出身的學(xué)生,不善于交際。但是在日常的工作中,有數(shù)據(jù)經(jīng)驗(yàn)的科學(xué)家應(yīng)該經(jīng)常和每個(gè)部門的工作人員交流,協(xié)同工作。怎么樣才能讓頗具專業(yè)性的數(shù)據(jù)分析結(jié)果讓普通的老百姓也可以讀懂,讓每個(gè)部門的工作人員都能無(wú)障礙地理解,這是不容易做到的。要訓(xùn)練自己的交往能力和溝通技能,主動(dòng)地參加演講活動(dòng)是不錯(cuò)的渠道,演講活動(dòng)鍛煉了演講者的自信,在整個(gè)演講的過(guò)程中,能否清晰地表達(dá)自己的思想以及給人以信服力是至關(guān)重要的。需要培養(yǎng)數(shù)據(jù)常識(shí),廣其見聞。數(shù)據(jù)科學(xué)家經(jīng)常面對(duì)各種各樣的海量數(shù)據(jù),并需要從這些數(shù)據(jù)中挖掘出有價(jià)值的信息,這就需要數(shù)據(jù)科學(xué)家具有強(qiáng)烈的數(shù)據(jù)敏感性。對(duì)數(shù)據(jù)的敏感程度的訓(xùn)練不是一蹴而就的,要經(jīng)過(guò)長(zhǎng)時(shí)間的積累和數(shù)據(jù)分析工作的磨練,同時(shí)也可以根據(jù)閱讀數(shù)據(jù)分析材料積累閱歷,提升對(duì)數(shù)據(jù)資源的敏感程度。
2.培養(yǎng)應(yīng)用型人才
大數(shù)據(jù)時(shí)代培養(yǎng)的數(shù)據(jù)科學(xué)家需要兩方面的基本素質(zhì),第一是概念性,也就前面所說(shuō)的數(shù)據(jù)科學(xué)家需要掌握的基本素養(yǎng)和專業(yè)知識(shí);第二是實(shí)踐性,也就是本文中我們提及的應(yīng)用型人才,也就是實(shí)際操作中處理數(shù)據(jù)的能力。在高校開展大數(shù)據(jù)分析研究生學(xué)科,最大的問(wèn)題是沒(méi)有可用的數(shù)據(jù),這就需要高效與大數(shù)據(jù)企業(yè)合作,進(jìn)行研究生的聯(lián)合培養(yǎng),注重學(xué)生的實(shí)際操作能力,這里面涉及到我們的應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)碩士的雙導(dǎo)師培養(yǎng)制度,一名校內(nèi)導(dǎo)師一名校外導(dǎo)師,校內(nèi)導(dǎo)師注重學(xué)生的概念性,校外導(dǎo)師注重學(xué)生的實(shí)踐性,學(xué)生通過(guò)在校外導(dǎo)師單位的實(shí)習(xí),從而熟悉并且掌握實(shí)際工作中所需要的技能。
3.促進(jìn)統(tǒng)計(jì)與數(shù)學(xué)、計(jì)算機(jī)學(xué)科合作
“大數(shù)據(jù)”時(shí)代需要的海量數(shù)據(jù)分析資源僅僅憑借統(tǒng)計(jì)學(xué)科單一學(xué)科的發(fā)展是不能滿足發(fā)展需求的,大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)性特征已經(jīng)拋棄了傳統(tǒng)意義上的數(shù)據(jù)分析模式的非智能化框架,而且數(shù)據(jù)分析需要利用新型的數(shù)據(jù)運(yùn)算方式以及計(jì)算機(jī)技能分析,這也是進(jìn)行數(shù)據(jù)分析工作的攔路虎。所以,數(shù)據(jù)科學(xué)家的成長(zhǎng)僅僅依靠單一的統(tǒng)計(jì)學(xué)科知識(shí)的學(xué)習(xí)是遠(yuǎn)遠(yuǎn)不夠的,其需要的是數(shù)學(xué)、計(jì)算機(jī)和統(tǒng)計(jì)學(xué)三門學(xué)科融合發(fā)展,緊密結(jié)合。三門學(xué)科之間交叉發(fā)展,融會(huì)貫通,這樣既可以發(fā)揮學(xué)科的優(yōu)勢(shì)資源,同時(shí)也能彌補(bǔ)其他學(xué)科的弊端。
【關(guān)鍵詞】函數(shù)數(shù)據(jù) 函數(shù)數(shù)據(jù)分析 網(wǎng)上拍賣
近幾十年來(lái),由于統(tǒng)計(jì)學(xué)的不斷發(fā)展,出現(xiàn)并發(fā)展了一些新的方法解決了很多問(wèn)題。然而,無(wú)論獲得的是截面數(shù)據(jù)還是時(shí)間序列數(shù)據(jù),我們只能進(jìn)行某一橫向研究或縱向研究,同時(shí)其前提條件很多不能滿足,因此常常導(dǎo)致數(shù)據(jù)分析結(jié)果的不可靠性。雖然面板數(shù)據(jù)模型將截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)結(jié)合起來(lái),具有較強(qiáng)的因果推理屬性,但是三者存在共同的缺陷:即所建立的模型都是線性的,而在實(shí)際應(yīng)用過(guò)程中無(wú)法完全保證變量間的線性關(guān)系,并且也難以確保數(shù)據(jù)滿足前提假設(shè)條件,從而使方法的具體應(yīng)用及方法適用于數(shù)據(jù)的類型均具有一定的局限性。函數(shù)數(shù)據(jù)分析是將觀測(cè)數(shù)據(jù)當(dāng)作一個(gè)整體(函數(shù)),而不是一系列單個(gè)離散的觀測(cè)結(jié)果。之所以這樣做是因?yàn)樵谘芯恐形覀儾粌H關(guān)心的已得到的數(shù)據(jù),更關(guān)心未得到的或者無(wú)法得到的數(shù)據(jù)。函數(shù)性數(shù)據(jù)分析(Functional Data Analysis,F(xiàn)DA)的概念,始見于加拿大統(tǒng)計(jì)學(xué)家J.0.Ramsay和C.J.Dalzell于1991年發(fā)表的論文《函數(shù)性數(shù)據(jù)分析的一些工具》。文中提出了適用于研究時(shí)間上無(wú)限維度的函數(shù)型數(shù)據(jù)一些方法和工具,并使用函數(shù)型數(shù)據(jù)的主成分分析和線性模型對(duì)加拿大溫度與降水量的關(guān)系進(jìn)行實(shí)證研究。此后在1997年J.0.Ramsay和B.W.silverman總結(jié)了函數(shù)數(shù)據(jù)分析的理論和方法,出版了《Functional Data Analysis》一書。
雖然函數(shù)性數(shù)據(jù)的來(lái)源形式多種多樣,但就其本質(zhì)來(lái)說(shuō),它們由函數(shù)構(gòu)成。這些函數(shù)的幾何圖形可能是光滑的曲線,也可能是不光滑的藍(lán)線。函數(shù)性數(shù)據(jù)分析的基本思想是把觀測(cè)到的數(shù)據(jù)函數(shù)看作一個(gè)整體,而不僅僅是個(gè)體觀測(cè)值的順序排列。函數(shù)指的是數(shù)據(jù)的內(nèi)在結(jié)構(gòu),而不是它們直觀的外在表現(xiàn)形式。實(shí)際中,之所以要從函數(shù)的視角對(duì)數(shù)據(jù)進(jìn)行分析是因?yàn)椋簩?shí)際中,獲得數(shù)據(jù)的方式和技術(shù)多種多樣,更重要的是,原本用于工程技術(shù)分析的修勻(光滑)和插值技術(shù),可以由有限組的觀測(cè)數(shù)據(jù)產(chǎn)生出相應(yīng)的函數(shù)表示;盡管只有有限次的觀測(cè)數(shù)據(jù)可供利用,但有一些建模問(wèn)題,將其納入到函數(shù)范式下進(jìn)行考慮,會(huì)使分析更加全面、深刻;在有些情況下,如果想利用有限組的數(shù)據(jù)估計(jì)函數(shù)或其導(dǎo)數(shù),則分析從本質(zhì)上來(lái)看就具有函數(shù)性的特征;將平滑性引入到一個(gè)函數(shù)過(guò)程所產(chǎn)生的多元數(shù)據(jù)的處理中,對(duì)分析具有重要的意義。
函數(shù)型數(shù)據(jù)分析有以下優(yōu)點(diǎn):打破了連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)長(zhǎng)期以來(lái)的分離狀態(tài),實(shí)現(xiàn)離散和連續(xù)的過(guò)渡;可分析大批量的數(shù)據(jù),實(shí)現(xiàn)從有限維數(shù)據(jù)到無(wú)限維數(shù)據(jù)的轉(zhuǎn)換,得到的數(shù)據(jù)信息更豐富、更可靠;很少依賴于模型構(gòu)建及假設(shè)條件;由于假設(shè)函數(shù)都是可導(dǎo)的,因此可進(jìn)行微分分析,如:得到位相圖,實(shí)現(xiàn)動(dòng)能與勢(shì)能之間的轉(zhuǎn)換;將多元統(tǒng)計(jì)分析方法進(jìn)一步延伸。
典型的函數(shù)數(shù)據(jù)具有這樣的形式:
Y1,Y2,…Yn,其中Yi=(Yi1,Yi2,…Yini)來(lái)自第i條曲線,Yij是在時(shí)間tij上測(cè)量,i=1,…N;j=1,…ni,為了簡(jiǎn)化,我們通常都假定nij=n,Yij=Xi(tij)+εij,εij是測(cè)量誤差,E(εij)=0,Var(εij)=σ2。
估計(jì)X(t)在函數(shù)數(shù)據(jù)分析中是關(guān)鍵的一步,最常用的兩種方法是基展開和平滑判罰。
一、基展開的方法
原理:一組在某種意義下相互獨(dú)立的函數(shù){φk},其線性組合可以逼近任意的函數(shù)。
這樣函數(shù)Xi(t)有如下的基展開
一般情況下,對(duì)于周期函數(shù),我們常用Fourier級(jí)數(shù)來(lái)擬合;而對(duì)于非周期函數(shù),我們常用樣條函數(shù)來(lái)擬合。
Fourier級(jí)數(shù):1,sin(wt),cos(wt),sin(2wt),cos(2wt),…
樣條函數(shù):將函數(shù)的定義區(qū)間用斷點(diǎn)序列,τ=(t0,t1,…,tL)(t0與tL:為定義區(qū)間兩端點(diǎn))分成L個(gè)子區(qū)間,在每個(gè)子區(qū)間上,定義一個(gè)階為m的多項(xiàng)式,這里的階是指定義多項(xiàng)
式所需的系數(shù)個(gè)數(shù)。相鄰多項(xiàng)式要求在斷點(diǎn)處連續(xù),并且在定義域上存在m-2次導(dǎo)數(shù),這樣樣條函數(shù)就m-2次可導(dǎo)。
樣條函數(shù)的自由度=階數(shù)+內(nèi)點(diǎn)個(gè)數(shù)。
B樣條:每個(gè)m階B樣條基函數(shù)只在不超過(guò)m個(gè)相鄰子區(qū)間上取正值,在其他定義域上取0,這種緊支集性質(zhì)就給了B樣條基函數(shù)良好的數(shù)值計(jì)算性質(zhì)。
Bi,1(t)=1 ti≤t≤ti+10 else
二、平滑判罰
在基展開方法中,平滑參數(shù)K的選擇比較麻煩,我們可以獲得更好的結(jié)果多選一些基但加一個(gè)粗糙度判罰來(lái)控制模型復(fù)雜度。
通常選擇J(x)為二階導(dǎo)數(shù)的積分
三、函數(shù)數(shù)據(jù)的主成分分析
在多元統(tǒng)計(jì)分析中,記錄的是同一時(shí)期或時(shí)點(diǎn)上對(duì)每一觀測(cè)對(duì)象多個(gè)變量的數(shù)據(jù)信息.為了達(dá)到簡(jiǎn)化數(shù)據(jù)的目的,通常是把大量的原始變量綜合為少數(shù)幾個(gè)綜合變量。
函數(shù)性數(shù)據(jù)記錄了每個(gè)觀測(cè)對(duì)象的同一個(gè)變量某個(gè)區(qū)間上很多個(gè)時(shí)刻的數(shù)據(jù)信息.如果將時(shí)間看作多元數(shù)據(jù)對(duì)應(yīng)的變量(變化因素) ,則發(fā)現(xiàn)函數(shù)性數(shù)據(jù)分析面臨更大的"維數(shù)災(zāi)難"基于這種特點(diǎn),可以將多元主成分分析的技術(shù)引入到函數(shù)性數(shù)據(jù)分析中,稱為函數(shù)性主成分分析。
四、函數(shù)性數(shù)據(jù)分析的基本步驟總結(jié)
(1)原始數(shù)據(jù)的收集、整理和組織。
(2)將離散數(shù)據(jù)轉(zhuǎn)換成函數(shù)型數(shù)據(jù)。采用基函數(shù)的線性組合,常用的B樣條基和傅立葉基。
[關(guān)鍵詞] 大數(shù)據(jù)時(shí)代;數(shù)據(jù)質(zhì)量;信息孤島
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 23. 093
[中圖分類號(hào)] TP311 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2016)23- 0178- 02
1 大數(shù)據(jù)與大數(shù)據(jù)時(shí)代
近年來(lái),隨著英國(guó)維克托?邁爾-舍恩伯格的《大數(shù)據(jù)時(shí)代》和美國(guó)Bill Franks的《駕馭大數(shù)據(jù)》等著作的出版,大數(shù)據(jù)引起了社會(huì)的廣泛關(guān)注,人們已經(jīng)意識(shí)到大數(shù)據(jù)時(shí)代正在呼嘯而至。大數(shù)據(jù)幾乎對(duì)每個(gè)領(lǐng)域都會(huì)產(chǎn)生影響,所以限于不同領(lǐng)域各自的特點(diǎn),對(duì)大數(shù)據(jù)的表述也不同,但是一個(gè)廣泛的觀點(diǎn)是:“大數(shù)據(jù)是一個(gè)數(shù)據(jù)集合,這個(gè)數(shù)據(jù)集合是無(wú)法在規(guī)定時(shí)間里用常規(guī)軟件工具對(duì)它進(jìn)行搜集、整理和分析的?!?/p>
2 大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)數(shù)據(jù)的挑戰(zhàn)
大數(shù)據(jù)時(shí)代需要既講機(jī)遇也講挑戰(zhàn)。各個(gè)應(yīng)用領(lǐng)域的不斷變化使得統(tǒng)計(jì)學(xué)成為一門難以成熟的學(xué)科。所以在數(shù)據(jù)分析的世界里,統(tǒng)計(jì)學(xué)發(fā)展的終身動(dòng)力是不斷提高駕馭數(shù)據(jù)的能力。大數(shù)據(jù)是推斷數(shù)據(jù),不是原始數(shù)據(jù),所以會(huì)存在抽樣偏倚、隨機(jī)的和非隨機(jī)的誤差。數(shù)據(jù)包括原始數(shù)據(jù)和推斷的數(shù)據(jù)。數(shù)據(jù)的認(rèn)知范圍有限,所以數(shù)據(jù)可解釋的范圍就有限。模型是對(duì)數(shù)據(jù)信息的匯總,由于數(shù)據(jù)信息有限,所以模型可解釋的程度也有限。超出模型可解釋的程度,就是對(duì)模型進(jìn)行一系列的假設(shè)。大數(shù)據(jù)方法研究需要多學(xué)科的聯(lián)合,統(tǒng)計(jì)學(xué)家需要關(guān)注實(shí)時(shí)決策和計(jì)算機(jī)資源,計(jì)算機(jī)學(xué)家需要了解算法和統(tǒng)計(jì)推斷的復(fù)雜性。
3 大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的影響
3.1 大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)時(shí)效性的影響
庫(kù)克耶和舍恩伯格認(rèn)為:大數(shù)據(jù)不用抽樣調(diào)查的方法,而用所有數(shù)據(jù)的方法。數(shù)據(jù)科學(xué)家甚至提出“樣本=總體”,這或許意味著統(tǒng)計(jì)工作重心要轉(zhuǎn)移。舍恩伯格和庫(kù)克耶認(rèn)為抽樣調(diào)查有很多自身的不足:一是樣本的隨機(jī)性很難實(shí)現(xiàn);二是不適合考察有子類別的情況;三是采樣忽略了細(xì)節(jié)的考察,而大數(shù)據(jù)分析則可以彌補(bǔ)抽樣調(diào)查的這些不足之處。如果說(shuō)之前統(tǒng)計(jì)工作的重點(diǎn)在于數(shù)據(jù)搜集和整理,那么大數(shù)據(jù)時(shí)代統(tǒng)計(jì)工作的重心就是如何搜集整理分析有用的信息。這樣一來(lái),已經(jīng)得出的數(shù)據(jù)結(jié)論可能不具有這個(gè)時(shí)代的特點(diǎn),即失去了時(shí)效性。
3.2 大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)真實(shí)性的影響
大數(shù)據(jù)時(shí)代除了對(duì)數(shù)據(jù)的時(shí)效性有影響之外,對(duì)數(shù)據(jù)的真實(shí)性也有影響。由此,當(dāng)通過(guò)網(wǎng)絡(luò)搜集數(shù)據(jù)時(shí),首先需要考慮的是,數(shù)據(jù)是否是由自動(dòng)化算法系統(tǒng)產(chǎn)生?如果是,究竟有多少?以淘寶網(wǎng)為例,大量的虛假評(píng)論已經(jīng)影響了信息的真實(shí)。
4 大數(shù)據(jù)時(shí)代統(tǒng)計(jì)工作的應(yīng)對(duì)之策
大多數(shù)的研究指出,當(dāng)前統(tǒng)計(jì)方面存在的問(wèn)題在于業(yè)務(wù)部門沒(méi)有利用好大數(shù)據(jù)導(dǎo)致數(shù)據(jù)資源缺乏;企業(yè)內(nèi)部信息孤島導(dǎo)致數(shù)據(jù)的有效信息無(wú)法充分利用;工作人員數(shù)據(jù)分析能力差導(dǎo)致大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)工作很難進(jìn)行。
4.1 國(guó)家應(yīng)對(duì)之策
在大數(shù)據(jù)時(shí)代下,要保障統(tǒng)計(jì)數(shù)據(jù)質(zhì)量,國(guó)家應(yīng)當(dāng)做到以下幾點(diǎn):
(1)盡快改革當(dāng)前統(tǒng)計(jì)管理體制的制約,保證統(tǒng)計(jì)獨(dú)立調(diào)查、獨(dú)立報(bào)告、獨(dú)立監(jiān)督的職權(quán)不受侵犯。在大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)體制改革要與時(shí)俱進(jìn),盡快建立符合我國(guó)國(guó)情的統(tǒng)計(jì)管理體制。
(2)充分發(fā)揮黨委政府的主導(dǎo)作用,賦予各其統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的主體責(zé)任。要發(fā)揮各級(jí)地方黨委政府對(duì)本區(qū)域統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的主體責(zé)任,將統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的好壞作為考核一個(gè)地區(qū)領(lǐng)導(dǎo)業(yè)績(jī)的主要方面之一。
(3)盡快建立引導(dǎo)一個(gè)提速增效的統(tǒng)計(jì)考核評(píng)價(jià)指標(biāo)體系,完善黨政領(lǐng)導(dǎo)的績(jī)效考評(píng)機(jī)制。
4.2 企業(yè)應(yīng)對(duì)之策
企業(yè)應(yīng)做到以下幾點(diǎn):信息以數(shù)據(jù)形式呈現(xiàn),強(qiáng)化建設(shè)數(shù)據(jù)標(biāo)準(zhǔn);融合結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);推廣應(yīng)用大數(shù)據(jù),促進(jìn)使用信息資源;重視數(shù)據(jù)的安全管理。
4.3 個(gè)人應(yīng)對(duì)之策
統(tǒng)計(jì)學(xué)家必須積極學(xué)習(xí)新事物,適應(yīng)大數(shù)據(jù)環(huán)境,拓展統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域,創(chuàng)造出新的統(tǒng)計(jì)方法。大數(shù)據(jù)時(shí)代帶給我們的挑戰(zhàn)與機(jī)遇并存。
主要參考文獻(xiàn)
[1]朱建平,章貴軍,劉曉葳.大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計(jì)研究,2014(2).
[2]鄭京平,王眾全.官方統(tǒng)計(jì)應(yīng)如何面對(duì)BigData挑戰(zhàn)[J].統(tǒng)計(jì)研究,2012(12).
[3][英]維克托?邁爾-舍恩伯格.大數(shù)據(jù)時(shí)代――生活工作與思維的大變革[M].周濤,譯.杭州:浙江人民出版社,2013.
[4]Brian Hopkins,Boris Evelson.Expand Your Digital Horizon with Bigdata[N/OL],2011-09-30.
[5]邱東.大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014(1).
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:CSCD期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)