公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術(shù)在土壤肥力評(píng)價(jià)中應(yīng)用

前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)在土壤肥力評(píng)價(jià)中應(yīng)用范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

數(shù)據(jù)挖掘技術(shù)在土壤肥力評(píng)價(jià)中應(yīng)用

摘要:土壤肥力狀況直接影響農(nóng)作物的產(chǎn)量,傳統(tǒng)的農(nóng)業(yè)生產(chǎn)自動(dòng)化水平低,化肥和農(nóng)藥的施放無(wú)法做到精確把控,同時(shí)缺乏對(duì)土壤肥力的實(shí)時(shí)在線監(jiān)測(cè)和評(píng)價(jià),不利于農(nóng)作物的生長(zhǎng),嚴(yán)重時(shí)會(huì)給農(nóng)田和生態(tài)環(huán)境帶來(lái)較大的污染,影響農(nóng)作物的生產(chǎn)質(zhì)量和產(chǎn)量,對(duì)人類(lèi)和牲畜的人身安全構(gòu)成了較大威脅。為此,深入研究分析了數(shù)據(jù)挖掘技術(shù),并將其應(yīng)用在土壤肥力評(píng)價(jià)系統(tǒng)中,針對(duì)具體的研究區(qū)域進(jìn)行土壤圖設(shè)計(jì)和土壤狀態(tài)分析,建立了土壤肥力采樣數(shù)據(jù)庫(kù),并利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則算法對(duì)土壤肥力和農(nóng)作物產(chǎn)量進(jìn)行等級(jí)分類(lèi),計(jì)算分析得到土壤肥力與農(nóng)作物產(chǎn)量之間的關(guān)聯(lián)關(guān)系。結(jié)果表明:智能數(shù)據(jù)挖掘技術(shù)在土壤肥力評(píng)價(jià)系統(tǒng)中發(fā)揮了重要作用,在對(duì)土壤肥力進(jìn)行準(zhǔn)確監(jiān)控的同時(shí)能夠準(zhǔn)確評(píng)價(jià)土壤肥力與農(nóng)作物產(chǎn)量之間的相關(guān)程度,對(duì)指導(dǎo)農(nóng)業(yè)生產(chǎn)、提高農(nóng)作物生產(chǎn)質(zhì)量和產(chǎn)量具有重要意義。

關(guān)鍵詞:土壤肥力評(píng)價(jià);數(shù)據(jù)挖掘;數(shù)據(jù)庫(kù);關(guān)聯(lián)規(guī)則算法

0引言

我國(guó)傳統(tǒng)的農(nóng)藥和化肥施放主要依靠作業(yè)人員的經(jīng)驗(yàn)進(jìn)行,施放效率低,農(nóng)藥利用率低,造成了農(nóng)藥和化肥的浪費(fèi),給生態(tài)環(huán)境帶來(lái)了一定的影響。農(nóng)藥和化肥的不合理利用會(huì)對(duì)農(nóng)作物的生長(zhǎng)產(chǎn)生一定的制約,嚴(yán)重時(shí)會(huì)對(duì)消費(fèi)者的健康造成威脅,因此對(duì)農(nóng)藥和化肥的合理利用、對(duì)土壤肥力的準(zhǔn)確監(jiān)控越來(lái)越引起諸多學(xué)者的關(guān)注。隨著科學(xué)技術(shù)的發(fā)展,很多學(xué)者將神經(jīng)網(wǎng)絡(luò)算法、模糊理論及專(zhuān)家系統(tǒng)等先進(jìn)理論應(yīng)用于土壤肥力監(jiān)測(cè)和評(píng)價(jià)系統(tǒng)中,對(duì)土壤肥力的狀態(tài)和信息有了一定的掌握。各種智能算法和先進(jìn)理論解決了土壤肥力評(píng)價(jià)指標(biāo)的優(yōu)化問(wèn)題,但是對(duì)土壤肥力評(píng)價(jià)系統(tǒng)的數(shù)據(jù)來(lái)源、數(shù)據(jù)實(shí)時(shí)性和數(shù)據(jù)可用性無(wú)法精準(zhǔn)掌握,導(dǎo)致各類(lèi)智能算法在土壤肥力評(píng)價(jià)系統(tǒng)中實(shí)時(shí)性和準(zhǔn)確性不高,對(duì)土壤肥力評(píng)價(jià)的指導(dǎo)性不強(qiáng)。為此,筆者深入研究數(shù)據(jù)挖掘技術(shù),通過(guò)比較其中的關(guān)聯(lián)規(guī)則法、聚類(lèi)分析法和人工神經(jīng)網(wǎng)絡(luò)法等不同算法,選用關(guān)聯(lián)規(guī)則法完成對(duì)所選研究區(qū)域土壤肥力狀況的分析,繪制了土壤肥力的空間變異圖,實(shí)現(xiàn)了對(duì)土壤肥力監(jiān)測(cè)的可視化,并應(yīng)用關(guān)聯(lián)規(guī)則法得到土壤肥力和農(nóng)作物產(chǎn)量的關(guān)聯(lián)關(guān)系,對(duì)指導(dǎo)農(nóng)業(yè)生產(chǎn)作業(yè)、提高農(nóng)業(yè)生產(chǎn)效益具有重要的借鑒意義。

1數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘是一個(gè)信息探索的過(guò)程,是從大量的隨機(jī)數(shù)據(jù)中提取有用的潛在信息和數(shù)據(jù),并轉(zhuǎn)換為可以理解的數(shù)據(jù)。此類(lèi)隨機(jī)數(shù)據(jù)多為不完全數(shù)據(jù),并伴隨有噪音、干擾信號(hào)等隨機(jī)信息。數(shù)據(jù)挖掘的對(duì)象既包括數(shù)據(jù)庫(kù),還可以包含各類(lèi)文本、視頻、圖像和Web數(shù)據(jù)等,解決了傳統(tǒng)數(shù)據(jù)庫(kù)無(wú)法預(yù)測(cè)未來(lái)發(fā)展趨勢(shì)的難題。數(shù)據(jù)挖掘的分析方法較多,主要包括決策樹(shù)、聚類(lèi)分析法、關(guān)聯(lián)規(guī)則法、人工神經(jīng)網(wǎng)絡(luò)法和時(shí)序算法。具體功能如下:1)數(shù)據(jù)總結(jié)。運(yùn)用統(tǒng)計(jì)分析法(求平均值、加權(quán)處理、直方圖)對(duì)數(shù)據(jù)源信息進(jìn)行統(tǒng)計(jì)分析,便于數(shù)據(jù)分類(lèi)。2)數(shù)據(jù)分類(lèi)。利用分類(lèi)函數(shù)將待數(shù)據(jù)挖掘的數(shù)據(jù)按不同類(lèi)型、不同標(biāo)識(shí)進(jìn)行分類(lèi)。3)聚類(lèi)。將數(shù)據(jù)庫(kù)信息按集群進(jìn)行劃分,利用聚類(lèi)分析法找出集群中特性相似的集群進(jìn)行區(qū)分。4)關(guān)聯(lián)分析。通過(guò)關(guān)聯(lián)規(guī)則法計(jì)算分析數(shù)據(jù)庫(kù)中同一事件的不同項(xiàng)的關(guān)聯(lián)性,根據(jù)關(guān)聯(lián)性預(yù)測(cè)結(jié)果。5)預(yù)測(cè)。根據(jù)數(shù)據(jù)挖掘的結(jié)果對(duì)研究對(duì)象的發(fā)展規(guī)律進(jìn)行預(yù)測(cè),分析后續(xù)變化趨勢(shì)。

2研究區(qū)域概況

選取的研究區(qū)域?yàn)榧质∞r(nóng)安縣開(kāi)安鎮(zhèn),坐標(biāo)東經(jīng)121°10'、北緯44°10',大陸性季風(fēng)氣候,地下水源豐富,年平均降水量535㎜,為國(guó)家農(nóng)業(yè)示范基地。

2.1土壤圖設(shè)計(jì)通過(guò)查閱資料、查找相關(guān)部門(mén)網(wǎng)站信息,得到第2次土壤普查圖(比例1:5)。以此為基礎(chǔ),完成該研究區(qū)域土壤矢量圖的繪制,如圖1所示。

2.2土壤狀態(tài)分析

由圖1可知,農(nóng)安縣土壤的類(lèi)型較多。按土壤的類(lèi)型和狀態(tài)可將農(nóng)安縣土壤進(jìn)行分類(lèi),如表1所示。

2.3土壤狀態(tài)采樣

將農(nóng)安縣土壤矢量圖和土壤狀態(tài)等數(shù)據(jù)進(jìn)行分析處理,構(gòu)建土壤狀態(tài)數(shù)據(jù)庫(kù),重點(diǎn)監(jiān)測(cè)土壤養(yǎng)分值和采樣點(diǎn)的經(jīng)緯度。土壤養(yǎng)分值主要包括3個(gè)指標(biāo),即堿解氮、有效磷和速效鉀。農(nóng)安縣土壤狀態(tài)采樣數(shù)據(jù)如表2所示。

3土壤肥力分布變化

通過(guò)對(duì)不同采樣點(diǎn)的土壤肥力狀態(tài)的監(jiān)測(cè),完成了對(duì)土壤不同養(yǎng)分堿解氮、有效磷和速效鉀的含量分析和研究,得到土壤中堿解氮、有效磷和速效鉀的空間分布圖,如圖2、圖3所示。為確保數(shù)據(jù)的可靠性,對(duì)不同年份的土壤養(yǎng)分值進(jìn)行匯總和分析,最后得到連續(xù)2年的堿解氮和速效鉀的空間分布變化圖。由圖2和圖3可知:土壤堿解氮含量呈下降趨勢(shì)。其中,第1年最小值為108mg/kg,最大值為216mg/kg,差值為108mg/kg;第2年最小值為86mg/kg,最大值為173mg/kg,差值為87mg/kg。這表明,經(jīng)過(guò)連續(xù)2年的精準(zhǔn)施肥后,土壤肥力的差異逐漸變小。

4數(shù)據(jù)挖掘分析

4.1關(guān)聯(lián)規(guī)則算法

應(yīng)用關(guān)聯(lián)規(guī)則算法進(jìn)行數(shù)據(jù)挖掘時(shí),主要解決兩個(gè)問(wèn)題,即頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則算法的作業(yè)步驟為:①挖掘頻繁項(xiàng)集;②生成關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集與支持度相關(guān),即數(shù)據(jù)庫(kù)中支持度大于規(guī)定支持度的項(xiàng)目。關(guān)聯(lián)規(guī)則與支持度和可信度相關(guān),即支持度和可信度均大于規(guī)定支持度和可信度的關(guān)聯(lián)規(guī)則。支持度sup的計(jì)算公式為sup(A=>B)=sup(a∪b)={T|T∈Dand(a∪b)}D其中:支持度sup表示事件A和事件B同時(shí)出現(xiàn)的概率??尚哦萩onf的計(jì)算公式為conf(a=>b)=sup(a∪b)sup(a)其中,可信度conf表示條件概率。提升度lift的計(jì)算公式為lift=P(B|A)P(B)其中:提升度lift表示事件A對(duì)事件B的提升度。lift=1,說(shuō)明事件A與事件B沒(méi)有關(guān)聯(lián);lift>1,說(shuō)明事件A與事件B相關(guān)聯(lián),且關(guān)聯(lián)規(guī)則較好,關(guān)聯(lián)性好;lift<1,說(shuō)明事件A與事件B相排斥,得到的關(guān)聯(lián)規(guī)則沒(méi)有意義,關(guān)聯(lián)性差。

4.2關(guān)聯(lián)規(guī)則分析

關(guān)聯(lián)規(guī)則算法是基于數(shù)據(jù)挖掘工具Weka軟件完成的。通過(guò)對(duì)采樣數(shù)據(jù)的分析計(jì)算,并將數(shù)據(jù)導(dǎo)入Weka軟件中,建立新的數(shù)據(jù)源,利用軟件自帶的算法庫(kù),篩選頻繁項(xiàng)集,根據(jù)專(zhuān)家經(jīng)驗(yàn)將數(shù)據(jù)分為6組,進(jìn)行土壤肥力和農(nóng)作物產(chǎn)量的關(guān)聯(lián)規(guī)則計(jì)算,得到土壤肥力和產(chǎn)量數(shù)據(jù)的等級(jí)分類(lèi),如表3所示。由表3可知:根據(jù)專(zhuān)家經(jīng)驗(yàn),土壤養(yǎng)分值劃分為6個(gè)等級(jí),農(nóng)作物產(chǎn)量劃分為3個(gè)等級(jí)。根據(jù)關(guān)聯(lián)規(guī)則,計(jì)算分析土壤肥力與農(nóng)作物產(chǎn)量之間的關(guān)聯(lián)性。

4.3關(guān)聯(lián)結(jié)果

運(yùn)行Weka軟件,選取Apriori算法,設(shè)定支持度sup范圍為10%~100%,提升度lift大于1.0,計(jì)算關(guān)聯(lián)規(guī)則,得到關(guān)聯(lián)規(guī)則結(jié)果,如圖4所示。由圖4可知:當(dāng)速效磷等級(jí)為D時(shí),農(nóng)作物產(chǎn)量為A的概率為95%;當(dāng)速效鉀為等級(jí)D的時(shí)候,農(nóng)作物產(chǎn)量為A的概率為63%;當(dāng)速效鉀等級(jí)為E時(shí),農(nóng)作物產(chǎn)量為B的概率為46%;當(dāng)農(nóng)作物產(chǎn)量為A時(shí),速效磷等級(jí)為D的概率為38%;當(dāng)速效磷等級(jí)為D時(shí),農(nóng)作物產(chǎn)量為C的概率為45%。

5結(jié)論

為解決傳統(tǒng)土壤肥力監(jiān)測(cè)不及時(shí)、肥力評(píng)價(jià)不準(zhǔn)確等問(wèn)題,深入分析了數(shù)據(jù)挖掘技術(shù),對(duì)數(shù)據(jù)挖掘的主要算法和功能進(jìn)行分析,完成了研究區(qū)域的土壤圖繪制和土壤狀態(tài)分析。同時(shí),對(duì)不同采樣點(diǎn)的土壤肥力和經(jīng)緯度進(jìn)行監(jiān)測(cè),完成了土壤不同養(yǎng)分堿解氮、有效磷和速效鉀的空間分布變化趨勢(shì)的分析。應(yīng)用關(guān)聯(lián)規(guī)則算法,利用數(shù)據(jù)挖掘工具Weka,完成土壤肥力與產(chǎn)量的等級(jí)分類(lèi),得到土壤肥力與農(nóng)作物產(chǎn)量的關(guān)聯(lián)關(guān)系。結(jié)果表明:智能數(shù)據(jù)挖掘技術(shù)在土壤肥力評(píng)價(jià)系統(tǒng)中發(fā)揮了重要作用,既可以對(duì)土壤肥力的空間分布進(jìn)行準(zhǔn)確監(jiān)測(cè),又能夠?qū)r(nóng)作物產(chǎn)量進(jìn)行準(zhǔn)確預(yù)測(cè),在提高農(nóng)藥和化肥利用率的同時(shí)減小對(duì)生態(tài)環(huán)境的危害,對(duì)提高農(nóng)業(yè)生產(chǎn)質(zhì)量具有顯著效果。

作者:徐霖 單位:無(wú)錫工藝職業(yè)技術(shù)學(xué)院