公務(wù)員期刊網(wǎng) 論文中心 正文

爬蟲技術(shù)的就業(yè)信息管理平臺(tái)設(shè)計(jì)

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了爬蟲技術(shù)的就業(yè)信息管理平臺(tái)設(shè)計(jì)范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

爬蟲技術(shù)的就業(yè)信息管理平臺(tái)設(shè)計(jì)

1平臺(tái)功能及架構(gòu)

1.1平臺(tái)功能

按照不同用戶和流程的需求,該平臺(tái)需要具備多種功能,具體包括基礎(chǔ)信息管理、撰寫簡(jiǎn)歷的功能、基礎(chǔ)參數(shù)設(shè)置、招聘方管理、權(quán)限管理、互聯(lián)網(wǎng)招聘和求職等等。

1.2平臺(tái)功能架構(gòu)

校方、企業(yè)等有關(guān)方面的聯(lián)系是通過該信息平臺(tái)聯(lián)系起來的,因此,信息即時(shí)傳輸、共享以及分類是其應(yīng)具備的基本功能,以不同方面的實(shí)際需求作為切入點(diǎn),對(duì)求職、推薦符合需求的人才等功能需求予以充分滿足,按照使用群體,可以更進(jìn)一步的劃分該平臺(tái)。對(duì)招聘需求予以充分滿足,是該平臺(tái)企業(yè)子系統(tǒng)的主要作用,其涵蓋的功能有注冊(cè)、信息、在線招聘(審核人員是否滿足相關(guān)要求、在線筆試和面試)、反饋聘用結(jié)果等。對(duì)求職要求予以滿足是學(xué)生子系統(tǒng)的主要作用,相對(duì)于企業(yè)子系統(tǒng)其具有更加豐富的功能,具體有維護(hù)個(gè)人信息、撰寫和修改求職簡(jiǎn)歷、登記求職信息等。求職意向是其中比較重要的功能,學(xué)生對(duì)于工作行業(yè)、職務(wù)、薪酬等方面的要求均通過該功能進(jìn)行設(shè)置,除此之外,該功能還可以充分融合學(xué)生具有的工作和學(xué)習(xí)經(jīng)歷,并以此為基礎(chǔ)生成相應(yīng)的特征參數(shù);該子系統(tǒng)眾多功能中最關(guān)鍵的就是職位推薦,其在相應(yīng)特征參數(shù)的基礎(chǔ)上展開推薦算法,相似度計(jì)算的數(shù)據(jù)來自于招聘信息,在向特定學(xué)生推薦職位時(shí)是以位于該計(jì)算所得結(jié)果為依據(jù)的,如此,就業(yè)推薦等工作的精準(zhǔn)性可以得到可靠保證。對(duì)于就業(yè)招聘的各個(gè)相關(guān)方面而言,其聯(lián)系是通過學(xué)校實(shí)現(xiàn)的,基于此,審核企業(yè)等方面的資質(zhì)是該子系統(tǒng)必須具備的功能,同時(shí)可以提供合理的就業(yè)指導(dǎo)等,及時(shí)傳達(dá)和正確解釋國(guó)家有關(guān)部門下發(fā)的通知等,調(diào)查就業(yè)狀況、統(tǒng)計(jì)和分析就業(yè)局勢(shì)、管理相關(guān)信息的功能等。在上述眾多功能中最核心的就是數(shù)據(jù)管理,招聘職位的數(shù)據(jù)量會(huì)直接影響到就業(yè)成功率,招聘數(shù)據(jù)的來源主要包括兩方面,其一是注冊(cè)企業(yè);其二,則是智聯(lián)招聘等既有的比較具有代表性的人才招聘平臺(tái),校方會(huì)定期從中對(duì)招聘信息進(jìn)行挖掘,通過篩選和整理相關(guān)數(shù)據(jù)可以促使相應(yīng)的大數(shù)據(jù)得以形成。

2平臺(tái)的關(guān)鍵信息及技術(shù)

2.1學(xué)生求職意向特征模型的設(shè)計(jì)

本研究創(chuàng)建的平臺(tái)模型也是由多個(gè)不同維度構(gòu)成的,為了給預(yù)測(cè)和挖掘數(shù)據(jù)創(chuàng)造有利條件,本文對(duì)不同維度在取值上進(jìn)行了嚴(yán)格的規(guī)范,不同維度的意義和對(duì)應(yīng)取值為:構(gòu)成特征模型的維度共計(jì)8項(xiàng),具體涵蓋了受教育程度、經(jīng)驗(yàn)等。不同維度的意義和取值是:受教育程度:該維度被劃分為7個(gè)不同等級(jí),具體按照學(xué)歷由高到低排列,博士位居首位,而初中或無要求則位居第七。工作經(jīng)驗(yàn):n。n的值表示工作經(jīng)驗(yàn)?zāi)晗?;?duì)此沒有特殊要求的表示為0,反之,則規(guī)定具體的n值。期望單位性質(zhì):1事業(yè);2國(guó)企;3民營(yíng);4上市;5外資。期望工作地點(diǎn):省/市;省;直轄市;直轄市/區(qū),如果只是寫上了省或直轄市,那么則可以直接等同于這一整個(gè)省的人群渴望從事這一項(xiàng)行業(yè):相關(guān)行業(yè)的各項(xiàng)操作也必須要予以規(guī)范化處理。期望崗位:根據(jù)國(guó)家相關(guān)職位的分類標(biāo)準(zhǔn)來進(jìn)行詳細(xì)劃分,并做出妥善化處置。期望月薪:這里主要是用n來予以表示,[n-500,n+500,不管在什么時(shí)候,其的浮動(dòng)空間都在500元左右,一切都是由系統(tǒng)直接進(jìn)行設(shè)置。期望福利:這里主要囊括了“五險(xiǎn)一金、周末雙休……”等在內(nèi)的多種表達(dá)類型。

2.2基于特征標(biāo)識(shí)的爬蟲技術(shù)的職位信息抓取

當(dāng)開始對(duì)于“行業(yè)”這一層次進(jìn)行劃分,某服務(wù)平臺(tái)還是會(huì)將其直接劃分成為11個(gè)一級(jí)大類,而在另外一個(gè)平臺(tái)當(dāng)中則會(huì)與前者保持著一定的差異,其包含的是13個(gè)一級(jí)大類,甚至于在一些特殊情況之下,還會(huì)將招聘崗位的名稱、招聘人數(shù)等全部都包含其中。事實(shí)上,將上述要素刨除之外,我們還應(yīng)該要充分的了解到企業(yè)人力資源對(duì)求職者的反饋時(shí)間等,只有如此,企業(yè)的效率才會(huì)真正展現(xiàn)出來?;诖?,對(duì)于某一種服務(wù)平臺(tái),我們除了需要對(duì)其平臺(tái)內(nèi)容進(jìn)行了解外,還必須要充分的了解到職位信息頁面的相關(guān)源代碼,做出妥善化判斷。并通過Python語言來編寫出一系列完善的爬蟲程序,相關(guān)數(shù)據(jù)也會(huì)被清晰的記錄到位。

2.3基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)職位信息的清洗與歸整

舉例而言,在“工作經(jīng)驗(yàn)”方面主要有以下幾類措辭,具體如下:“5-7年經(jīng)驗(yàn)、1年經(jīng)驗(yàn)”等,具體的描寫還是由社會(huì)企業(yè)而定。在“招聘人數(shù)”方面主要有以下幾類措辭,具體如下:“招2人、招若干人”等;。所以,想要了解這一系列爬取的原生數(shù)據(jù),就必須要對(duì)其進(jìn)行透徹化的分析與處理,每一項(xiàng)數(shù)據(jù)都需要被定時(shí)的清洗并全部都?xì)w整到一起,文本信息數(shù)值也會(huì)達(dá)到最大化狀態(tài)。這一平臺(tái)還是會(huì)基于數(shù)據(jù)來做出約定處理,相關(guān)“工作經(jīng)驗(yàn)”也會(huì)直接被規(guī)整為“n或n-m”,“招聘人數(shù)”的數(shù)據(jù)也會(huì)被直接確定為整數(shù)。

2.4基于用戶需求特征的職位推薦算法

在進(jìn)行職位推薦的時(shí)候,我們都應(yīng)該要充分的了解到每一位學(xué)生的個(gè)性求職需求,結(jié)合當(dāng)下的實(shí)際情況來將這一招聘崗位的特點(diǎn)全部都揭示出來,學(xué)生也能夠從中了解到適合自己的職位?,F(xiàn)如今,在運(yùn)用推薦算法的時(shí)候,我們還是應(yīng)該要充分地將人口統(tǒng)計(jì)學(xué)的推薦、基于內(nèi)容的推薦等三種方式充分的利用起來,在具體的情況之下來做出最優(yōu)的選擇。之所以會(huì)選擇人口統(tǒng)計(jì)學(xué)的推薦方式,主要還是因?yàn)闉榱四軌虺浞值牧私獾綄W(xué)生的求職期望,只有如此,個(gè)體與其它學(xué)生的相似度也能夠全部都揭示出來,一些與學(xué)生相似度較高的職位也會(huì)被推薦出來,然而在這種情況之下,這一算法僅僅只是了解了當(dāng)下學(xué)生求職期望的相似度,但是卻沒有充分的考慮到學(xué)生與職位的匹配程度。關(guān)于內(nèi)容的推薦這一方式,其實(shí)與人口統(tǒng)計(jì)學(xué)的推薦存在極大的類似情況,究其核心,還是需要考慮到內(nèi)容數(shù)據(jù)的實(shí)際建模情況,在這種情況之下,學(xué)生在了解了一系列招聘職位的相似度之后,還會(huì)直接影響到算法的實(shí)際精度?;诋?dāng)前的這一協(xié)同過濾推薦算法,其發(fā)展核心還是需要根據(jù)用戶交互行為的實(shí)際化數(shù)據(jù)來推進(jìn)建模工作的完成,更加具體而言,其主要囊括了用戶的推薦(User-basedRecommendationUF)、項(xiàng)目的推薦(Item-basedRecommendationOF)等三種方式,每一項(xiàng)都必須要予以切實(shí)的了解。事實(shí)上,基于用戶的推薦與基于人口統(tǒng)計(jì)學(xué)的推薦方式本身就存在極大的類似性,在一定程度之上,我們必須要清楚的了解到每一位學(xué)生對(duì)招聘職位歷史的偏好數(shù)據(jù),并將“k鄰近”算法予以充分的利用,這能夠很好的完成用戶的實(shí)際化相似度,學(xué)生們必須要充分的了解招聘職位的歷史偏好數(shù)據(jù),并對(duì)其做出準(zhǔn)確化的分析,運(yùn)用“k鄰近”的這一種算法能夠很好的將招聘職位的相似度計(jì)算出來,并構(gòu)建起一個(gè)完善的推薦模型。

3爬蟲技術(shù)實(shí)現(xiàn)

在了解了當(dāng)前這一類典型人才招聘服務(wù)平臺(tái)所的招聘職位數(shù)據(jù)情況之后,我們必須要承認(rèn)一點(diǎn),只有依靠爬蟲程序才能夠確保整個(gè)平臺(tái)的運(yùn)行更加深入、持續(xù),在完成了一系列的初步清洗工作之后,其已經(jīng)獲得了87000條數(shù)據(jù)。在進(jìn)行數(shù)據(jù)整理的時(shí)候,其還是應(yīng)該要針對(duì)于單位性質(zhì)、學(xué)歷等多個(gè)部分予以切實(shí)的調(diào)整,從而將其做出歸納與升級(jí)。

4結(jié)束語

本文主要是基于當(dāng)前就業(yè)管理工作目標(biāo)的實(shí)際情況,在充分的完成了一系列就業(yè)指導(dǎo)、管理等工作之后,我們能夠更好地滿足每一個(gè)學(xué)生的工作需求,針對(duì)于目前就業(yè)工作當(dāng)中所存在的招聘職位數(shù)量和質(zhì)量需求難的這一問題予以詳細(xì)化分析,并采取專業(yè)化的措施來將其解決?;趯W(xué)生自身的工作需求,在了解了人口統(tǒng)計(jì)學(xué)之后,采用合適的算法為學(xué)生推薦個(gè)性化工作,促進(jìn)學(xué)生能夠順利就業(yè)。大量實(shí)踐的結(jié)果可以證明,這一系統(tǒng)能夠很好的讓學(xué)生實(shí)現(xiàn)就業(yè),找尋到自身心儀的工作,企業(yè)也能夠更好的選擇優(yōu)秀的人才,學(xué)校的就業(yè)工作質(zhì)量也明顯提升,因此,可以進(jìn)一步推廣。

參考文獻(xiàn)

[1]林佳一.基于Web服務(wù)的高校就業(yè)信息服務(wù)平臺(tái)研究[J].計(jì)算機(jī)時(shí)代,2015(05).

[2]李暉,牛犇,李維皓.移動(dòng)互聯(lián)網(wǎng)服務(wù)的隱私保護(hù)機(jī)制[J].中興通訊技術(shù),2015(03).

[3]李廣杰.高職院校導(dǎo)向型學(xué)籍管理網(wǎng)絡(luò)平臺(tái)的設(shè)計(jì)[J].信息與電腦(論版),2015(08).

[4]田建勇.基于云計(jì)算的Web數(shù)據(jù)挖掘研究[J].信息安全與術(shù),2015(04).

作者:曹素娥 單位:山西大同大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)工程學(xué)院