网站首页
教育杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
医学杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
经济杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
金融杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
管理杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
科技杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
工业杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
SCI杂志
中科院1区 中科院2区 中科院3区 中科院4区
全部期刊
公務(wù)員期刊網(wǎng) 論文中心 正文

軟件工程數(shù)據(jù)挖掘技術(shù)應(yīng)用分析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了軟件工程數(shù)據(jù)挖掘技術(shù)應(yīng)用分析范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

軟件工程數(shù)據(jù)挖掘技術(shù)應(yīng)用分析

摘要:數(shù)據(jù)挖掘是90年代初期出現(xiàn)的新型數(shù)據(jù)庫(kù)技術(shù),經(jīng)過多年發(fā)展,現(xiàn)階段,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為數(shù)據(jù)庫(kù)研究主要分支,在軟件工程中,利用數(shù)據(jù)挖掘技術(shù),可以對(duì)軟件運(yùn)行軌跡、代碼庫(kù)、bug數(shù)據(jù)庫(kù)、修改歷史數(shù)據(jù)進(jìn)行有效處理。本文首先對(duì)數(shù)據(jù)挖掘技術(shù)對(duì)于軟件工程開發(fā)的重要作用做出闡述,然后說明數(shù)據(jù)挖掘技術(shù)運(yùn)作流程、應(yīng)用范圍,最后結(jié)合實(shí)際情況,對(duì)數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用展開分析,希望可以對(duì)業(yè)內(nèi)起到一定參考作用。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;重要作用;應(yīng)用分析

隨著互聯(lián)網(wǎng)技術(shù)、信息技術(shù)的迅速發(fā)展,現(xiàn)階段,計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)能力、處理能力不斷提升,應(yīng)用計(jì)算機(jī)與信息技術(shù)管理數(shù)據(jù)信息已經(jīng)成為各行各業(yè)信息管理的主要方式,與此同時(shí),人們所面臨的信息數(shù)據(jù)海洋也在迅速擴(kuò)張。在信息爆炸時(shí)代中,如何在大量數(shù)據(jù)信息中提取有用信息、真實(shí)信息,會(huì)直接影響人們的工作效率與企業(yè)的生產(chǎn)效率。在此背景下,數(shù)據(jù)挖掘技術(shù)得到了社會(huì)各界的廣泛關(guān)注,數(shù)據(jù)挖掘技術(shù)本身融合了人工智能技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、知識(shí)工程技術(shù)、統(tǒng)計(jì)學(xué)技術(shù)以及信息檢索技術(shù)、數(shù)據(jù)可計(jì)算技術(shù),在軟件工程中,通過對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理應(yīng)用,可以有效提升數(shù)據(jù)信息處理效率,以為軟件工程高質(zhì)量開發(fā)奠定基礎(chǔ)。

1數(shù)據(jù)挖掘技術(shù)對(duì)于軟件工程開發(fā)的重要作用

數(shù)據(jù)挖掘技術(shù)對(duì)于軟件工程開發(fā)的重要作用可以歸納為:(1)增強(qiáng)數(shù)據(jù)信息理解。在軟件工程開發(fā)工作開展中,數(shù)據(jù)挖掘技術(shù)應(yīng)用具有增強(qiáng)數(shù)據(jù)信息理解的重要作用,對(duì)于同一條信息而言,每個(gè)人都有著不同理解,如果利用人力方法開展數(shù)據(jù)采集工作、數(shù)據(jù)理解工作,那么就會(huì)讓整體時(shí)間成本增加,對(duì)數(shù)據(jù)信息權(quán)威性造成不利影響,利用數(shù)據(jù)挖掘技術(shù),可以對(duì)數(shù)據(jù)信息進(jìn)行科學(xué)分類處理,讓數(shù)據(jù)就權(quán)威性、準(zhǔn)確性得到保證。(2)提高數(shù)據(jù)處理質(zhì)量。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以在短時(shí)間內(nèi)多次篩選、處理無效數(shù)據(jù)、混亂數(shù)據(jù),讓數(shù)據(jù)處理質(zhì)量、處理效率得到保證。和傳統(tǒng)技術(shù)相比,數(shù)據(jù)挖掘技術(shù)還可以防止數(shù)據(jù)丟失情況產(chǎn)生,避免企業(yè)損失。(3)增強(qiáng)數(shù)據(jù)利用效率。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從多個(gè)角度分類、整理數(shù)據(jù)信息,讓無用數(shù)據(jù)信息轉(zhuǎn)化為可理解信息資源,以為企業(yè)商業(yè)決策工作有效開展提供幫助,以增強(qiáng)數(shù)據(jù)利用效率。

2數(shù)據(jù)挖掘技術(shù)的基本概述

2.1運(yùn)作流程

數(shù)據(jù)挖掘,主要指的是從不完全、模糊、大量、隨機(jī)數(shù)據(jù)中挖掘潛在、有價(jià)值、易被理解信息的過程。數(shù)據(jù)挖掘技術(shù)運(yùn)作流程主要是利用計(jì)算機(jī)程序、綜合算法進(jìn)行復(fù)雜運(yùn)算,在預(yù)處理數(shù)據(jù)信息后,開展數(shù)據(jù)挖掘工作,最后對(duì)信息進(jìn)行收集、整合。在數(shù)據(jù)選擇中,需使用具有強(qiáng)大運(yùn)算后臺(tái)的軟件,以此來保證信息選擇準(zhǔn)確性、有效性;在數(shù)據(jù)預(yù)處理中,需要針對(duì)選擇、收集原始數(shù)據(jù)信息,采用科學(xué)算法轉(zhuǎn)碼數(shù)據(jù)、識(shí)別數(shù)據(jù),保證用戶可以直接得到數(shù)據(jù)信息;在數(shù)據(jù)挖掘中,應(yīng)利用軟件智能算法以及計(jì)算機(jī)快速運(yùn)算優(yōu)勢(shì),采集處理數(shù)據(jù)信息,以在海量數(shù)據(jù)信息中得到真實(shí)數(shù)據(jù)、原始數(shù)據(jù),在數(shù)據(jù)挖掘工作開展中,一方面,需要依照數(shù)據(jù)信息不同特點(diǎn),選擇科學(xué)挖掘算法,另一方面,需要對(duì)實(shí)際運(yùn)行系統(tǒng)要求、用戶要求,挖掘用戶容易理解、描述性知識(shí),或是用戶想得到預(yù)測(cè)性、前瞻性知識(shí);在模式評(píng)價(jià)和知識(shí)表示過程中,根據(jù)某種興趣度量,可以對(duì)表示知識(shí)真正有趣模式予以識(shí)別,以完成模式評(píng)價(jià)工作,由特定領(lǐng)域用戶、專家、領(lǐng)域標(biāo)準(zhǔn)可以得出度量具體數(shù)值,利用可視化技術(shù)可以轉(zhuǎn)換結(jié)果為用戶易接受形式,并提交給用戶。值得注意的是,數(shù)據(jù)挖掘流程本身具有反復(fù)性特點(diǎn),例如,在對(duì)數(shù)據(jù)信息進(jìn)行清洗、準(zhǔn)備過程中,就有可能在某數(shù)據(jù)源中發(fā)現(xiàn)挖掘數(shù)據(jù)不可用,或是數(shù)據(jù)信息來源于異構(gòu)數(shù)據(jù)源,對(duì)此,需要開展預(yù)處理工作,通過反復(fù)挖掘提升數(shù)據(jù)信息充分性、準(zhǔn)確性。

2.2應(yīng)用范圍

數(shù)據(jù)挖掘技術(shù)可以完成概念描述工作、關(guān)聯(lián)分析工作、分類與預(yù)測(cè)工作、聚類分析工作、異類分析與檢測(cè)工作、演化分析工作以及數(shù)據(jù)約簡(jiǎn)工作?,F(xiàn)階段,數(shù)據(jù)挖掘技術(shù)的應(yīng)用具有面向?qū)嶋H特點(diǎn),在電信領(lǐng)域、銀行領(lǐng)域、醫(yī)學(xué)領(lǐng)域、保險(xiǎn)領(lǐng)域、交通領(lǐng)域中均得到了廣泛應(yīng)用,利用數(shù)據(jù)挖掘技術(shù),可以完成數(shù)據(jù)庫(kù)營(yíng)銷工作、背景分析工作、客戶群體分類工作、市場(chǎng)交叉銷售工作、客戶關(guān)系管理工作等。如在銀行領(lǐng)域中,利用數(shù)據(jù)挖掘技術(shù)就可以分析客戶信譽(yù)度情況,避免信用卡欺詐問題產(chǎn)生;如在醫(yī)學(xué)領(lǐng)域中,利用數(shù)據(jù)挖掘技術(shù)就可以完成醫(yī)療診斷工作。除此之外,數(shù)據(jù)挖掘技術(shù)還可以應(yīng)用在農(nóng)業(yè)領(lǐng)域、工業(yè)領(lǐng)域、互聯(lián)網(wǎng)領(lǐng)域以及軍事領(lǐng)域。

3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析

3.1軟件版本信息挖掘

在軟件工程中,軟件版本信息挖掘管理是關(guān)鍵工作內(nèi)容,當(dāng)前,幾乎所有企業(yè)都會(huì)使用版本控制系統(tǒng)維護(hù)軟件,保證團(tuán)隊(duì)成員得到一致代碼。在大型軟件開發(fā)團(tuán)隊(duì)中,軟件版本信息管理具有復(fù)雜性,每次更新都有可能產(chǎn)生代碼管理混亂問題。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以有效挖掘軟件變更歷史信息,通過對(duì)比分析大量代碼,可以對(duì)各個(gè)版本、模塊之間內(nèi)部聯(lián)系予以確認(rèn),在保證代碼融合效率基礎(chǔ)上,可以避免漏洞問題產(chǎn)生。

3.2軟件執(zhí)行記錄挖掘

利用數(shù)據(jù)挖掘技術(shù)挖掘軟件執(zhí)行記錄,可以對(duì)程序進(jìn)行全面分析,利用程序預(yù)定安裝路徑,可以挖掘運(yùn)行數(shù)據(jù)信息,利用科學(xué)算法,可以對(duì)軟件運(yùn)行是否符合預(yù)期進(jìn)行判斷。在執(zhí)行記錄挖掘工作開展中,需要全面查詢安裝路徑,逆向建模處理數(shù)據(jù)結(jié)構(gòu),以對(duì)軟件開展維護(hù)工作、檢測(cè)工作,讓軟件運(yùn)行存在的漏洞問題得到提前發(fā)現(xiàn),讓軟件運(yùn)行穩(wěn)定性得到保證。與此同時(shí),需要全面分析安裝系統(tǒng),利用系統(tǒng)、軟件數(shù)據(jù)接口訪問系統(tǒng),可以挖掘相應(yīng)軟件信息,并提取運(yùn)行需要數(shù)據(jù)信息。

3.3檢測(cè)漏洞

在軟件工程中,利用數(shù)據(jù)挖掘技術(shù)可以對(duì)軟件漏洞進(jìn)行有效檢測(cè),以提升數(shù)據(jù)信息穩(wěn)定性、安全性,在錯(cuò)誤造成嚴(yán)重后果之前修復(fù)漏洞。通常情況下,在技術(shù)應(yīng)用中,首先,應(yīng)結(jié)合軟件特點(diǎn)進(jìn)行合理調(diào)整,在用戶基本需求得到滿足的前提條件下,可以對(duì)軟件測(cè)評(píng)方式進(jìn)行科學(xué)確認(rèn);其次,應(yīng)利用此測(cè)評(píng)方式,對(duì)軟件數(shù)據(jù)錯(cuò)誤進(jìn)行排查、修復(fù),以完成數(shù)據(jù)加密工作、保護(hù)工作。值得注意的是,針對(duì)軟件所需后臺(tái)信息,還應(yīng)開展處理工作,對(duì)后臺(tái)冗余數(shù)據(jù)進(jìn)行定期清除,針對(duì)長(zhǎng)時(shí)間運(yùn)行出現(xiàn)數(shù)據(jù),應(yīng)對(duì)其進(jìn)行過濾處理,針對(duì)必要關(guān)鍵信息,應(yīng)對(duì)其予以保留,讓軟件運(yùn)行穩(wěn)定性、安全性得到保證。在建模工作中,應(yīng)結(jié)合數(shù)據(jù)信息大小情況、特性對(duì)數(shù)據(jù)模型進(jìn)行合理選擇、對(duì)比驗(yàn)證,讓信息真實(shí)性、安全性得到保證。除此之外,應(yīng)針對(duì)軟件多種用途,結(jié)合項(xiàng)目需要,對(duì)數(shù)據(jù)挖掘方式進(jìn)行科學(xué)選擇,對(duì)多種數(shù)據(jù)信息進(jìn)行比較分析,保證軟件可以為用戶帶來最佳體驗(yàn)。

3.4軟件故障檢測(cè)中的數(shù)據(jù)挖掘

在軟件故障檢測(cè)工作中,通過科學(xué)應(yīng)用數(shù)據(jù)挖掘技術(shù),可以對(duì)軟件故障進(jìn)行有效檢測(cè),并針對(duì)故障產(chǎn)生原因、常見類型,開展修復(fù)工作、維護(hù)工作。

3.4.1故障檢測(cè)在軟件工程中,數(shù)據(jù)挖掘技術(shù)不僅可以提升挖掘任務(wù)完成效率、挖掘程序執(zhí)行記錄具體說明,同時(shí)還可以完成故障檢測(cè)工作。在程序挖掘過程中,首先,應(yīng)設(shè)定挖掘主要目標(biāo),對(duì)信息進(jìn)行跟蹤了解,提升程序熟悉度,為后續(xù)工作高質(zhì)量開展提供保證;其次,應(yīng)對(duì)數(shù)據(jù)挖掘方式進(jìn)行合理選擇,如利用基于規(guī)則和自動(dòng)化類數(shù)據(jù)挖掘技術(shù),就可以讓抽象處理、抽象挖掘工作得以高質(zhì)量完成。當(dāng)前,軟件因多種因素影響,可能會(huì)產(chǎn)生故障問題,傳統(tǒng)定位技術(shù)固然可以對(duì)故障進(jìn)行處理,但其具有一定煩瑣性、低效性,定位精準(zhǔn)度可能存在問題。而利用數(shù)據(jù)挖掘技術(shù),結(jié)合新的定位方法,如使用程序譜抽象定位處理運(yùn)行軌跡,利用對(duì)比方法對(duì)故障進(jìn)行有效排除,就可以讓故障源頭得以迅速找出,讓故障排查效率、檢測(cè)準(zhǔn)確性得以提升。

3.4.2軟件維護(hù)在數(shù)據(jù)挖掘技術(shù)支持下,通過鑒別該評(píng)估軟件缺陷程序,可以對(duì)軟件修復(fù)環(huán)節(jié)缺陷進(jìn)行分析,對(duì)修復(fù)優(yōu)先順序予以判斷,讓各個(gè)缺陷最佳修復(fù)方法得以確定。為保證修復(fù)效率,應(yīng)強(qiáng)化處理檢測(cè)重復(fù)缺陷報(bào)告技術(shù),在缺陷報(bào)告中融入自然語言、執(zhí)行語言相似度信息,保證依照定義向量維度可以完成描述軟件缺陷工作。最后,可以加權(quán)求和處理相似度,以開展缺陷修復(fù)工作。

4結(jié)語

綜上所述,數(shù)據(jù)挖掘技術(shù)的科學(xué)應(yīng)用是信息化時(shí)代數(shù)據(jù)信息處理的關(guān)鍵,在軟件工程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以高質(zhì)量開展軟件版本信息挖掘工作、軟件執(zhí)行記錄挖掘工作、檢測(cè)漏洞工作、故障檢測(cè)工作以及軟件維護(hù)工作,以提升軟件工程開發(fā)效率、開發(fā)質(zhì)量,降低軟件工程開發(fā)成本,提升軟件工程開發(fā)經(jīng)濟(jì)效益。

參考文獻(xiàn):

[1]周鶴.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用探究[J].計(jì)算機(jī)產(chǎn)品與流通,2020(8):22.

[2]李金召.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用與研究[J].計(jì)算機(jī)產(chǎn)品與流通,2020(5):30.

[3]余世文,王渝波,劉啟明.軟件工程數(shù)據(jù)挖掘研究進(jìn)展探析[J].農(nóng)家參謀,2020(7):139.

[4]豐婉伊.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].信息通信,2020,33(3):192-193.

[5]黃俊.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].信息通信,2020(02):254-256.

[6]李怡.淺析軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].中國(guó)新通信,2018,20(4):102.

作者:王鵬 胥司祿 陳夢(mèng)杰 孫曉康 金蔓 單位:大連理工大學(xué)城市學(xué)院計(jì)算機(jī)工程學(xué)院

免责声明

本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。

AI写作,高效原创

在线指导,快速准确,满意为止

立即体验
相關(guān)熱門標(biāo)簽
文秘服务 AI帮写作 润色服务 论文发表