国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Python的動(dòng)態(tài)網(wǎng)頁(yè)評(píng)價(jià)爬蟲(chóng)算法

2016-04-29 00:44夏火松李保國(guó)
軟件工程 2016年2期
關(guān)鍵詞:Python語(yǔ)言

夏火松 李保國(guó)

摘 要:在大數(shù)據(jù)獲取中面臨著如何采集動(dòng)態(tài)評(píng)論網(wǎng)頁(yè)的問(wèn)題,這篇論文使用靜態(tài)網(wǎng)頁(yè)信息構(gòu)造動(dòng)態(tài)鏈接,提出了基于Python的動(dòng)態(tài)網(wǎng)頁(yè)評(píng)論爬蟲(chóng)算法。在此基礎(chǔ)上實(shí)現(xiàn)了評(píng)論收集程序。最后將它與通用爬蟲(chóng)算法進(jìn)行比較,證實(shí)了該算法具有針對(duì)性強(qiáng)、數(shù)據(jù)采集速度快、易嵌入開(kāi)發(fā)、簡(jiǎn)單等優(yōu)點(diǎn),為不善于編程的新聞、文學(xué)、管理等學(xué)科的研究者提供了快速獲取評(píng)論信息的方法。

關(guān)鍵詞:Python語(yǔ)言;靜態(tài)地址;動(dòng)態(tài)鏈接;動(dòng)態(tài)網(wǎng)頁(yè)評(píng)論;爬蟲(chóng)算法

中圖分類號(hào):TP312 文獻(xiàn)標(biāo)識(shí)碼:A

1 引言(Introduction)

大數(shù)據(jù)具有數(shù)據(jù)體量巨大(Volume)、數(shù)據(jù)類型繁多(Variety)、價(jià)值密度低(Value)、處理速度快(Velocity)的特點(diǎn)。在大數(shù)據(jù)獲取中面臨的一個(gè)數(shù)據(jù)源問(wèn)題為:如何獲取大量的動(dòng)態(tài)評(píng)論數(shù)據(jù)?Python是一門獨(dú)立的語(yǔ)言,可以直接操作數(shù)據(jù)庫(kù),便于對(duì)大規(guī)模數(shù)據(jù)的操作與分析[1]。而且,由于Python包含結(jié)巴分詞等程序包,可以直接進(jìn)行分詞,適宜于自然語(yǔ)言處理[2]。

現(xiàn)在很多網(wǎng)頁(yè)通過(guò)Ajax動(dòng)態(tài)請(qǐng)求、異步刷新生成數(shù)據(jù)[3]。Python由于先天局限,它爬取靜態(tài)網(wǎng)頁(yè)的方法難于直接提取動(dòng)態(tài)網(wǎng)頁(yè)。而爬取動(dòng)態(tài)網(wǎng)頁(yè)的方法雖然有很多,但便于新聞學(xué)、語(yǔ)言學(xué)、管理等學(xué)科的研究者應(yīng)用的方法卻很少。所以這篇論文研究如何用Python語(yǔ)言爬取Ajax動(dòng)態(tài)生成的評(píng)論數(shù)據(jù)。

這篇論文延續(xù)前人的方法,通過(guò)靜態(tài)網(wǎng)址信息構(gòu)造動(dòng)態(tài)鏈接,并增加了翻頁(yè)的部分,把各種商品、新聞、社交網(wǎng)站、TV等動(dòng)態(tài)網(wǎng)頁(yè)評(píng)論的爬取方法歸結(jié)為一套抽象的爬蟲(chóng)算法流程圖。在此基礎(chǔ)上實(shí)現(xiàn)了商品評(píng)論收集程序[4]。本文為實(shí)時(shí)評(píng)價(jià)數(shù)據(jù)采集技術(shù)的研究提供了新路徑[5]。

2 基于Python的爬蟲(chóng)算法 (Reptiles algorithms

based on Python)

網(wǎng)絡(luò)爬蟲(chóng)即數(shù)據(jù)采集程序。主要有搜索引擎網(wǎng)絡(luò)爬蟲(chóng)[6]、基于Agent的網(wǎng)絡(luò)爬蟲(chóng)、遷移的網(wǎng)絡(luò)爬蟲(chóng)、通用網(wǎng)絡(luò)爬蟲(chóng)和聚焦爬蟲(chóng)等。其中聚焦爬蟲(chóng)是一種主題網(wǎng)絡(luò)爬蟲(chóng),它圍繞主題內(nèi)容采集數(shù)據(jù)。

靜態(tài)網(wǎng)頁(yè)是指不應(yīng)用程序而直接或間接制作成Html的網(wǎng)頁(yè),每一個(gè)頁(yè)面都有一個(gè)固定的URL地址,這個(gè)URL和相應(yīng)的Html可以通過(guò)Python直接獲取。動(dòng)態(tài)網(wǎng)頁(yè)一般使用腳本語(yǔ)言(Php、Asp等)將網(wǎng)站內(nèi)容存于數(shù)據(jù)庫(kù)中,相應(yīng)URL動(dòng)態(tài)鏈接不可以通過(guò)Python獲取。但是動(dòng)態(tài)URL的變化部分一般可以在相關(guān)靜態(tài)URL及源代碼中尋找,所以這篇論文在前人的基礎(chǔ)上,利用靜態(tài)的URL地址和相應(yīng)的網(wǎng)頁(yè)源代碼構(gòu)造動(dòng)態(tài)鏈接,從而實(shí)現(xiàn)了Python直接對(duì)動(dòng)態(tài)網(wǎng)頁(yè)的爬取。本研究在前人基礎(chǔ)上,通過(guò)對(duì)各主流商品、新聞、社交網(wǎng)站、TV等動(dòng)態(tài)網(wǎng)頁(yè)評(píng)論分析,提出了基于Python的動(dòng)態(tài)網(wǎng)頁(yè)爬蟲(chóng)算法流程圖,如圖1所示。

3 相關(guān)操作與爬蟲(chóng)程序(Operation and Reptiles

procedure)

為顧及新聞、管理等的學(xué)科的研究者,相關(guān)操作比較詳細(xì)。工具:使用Chrome瀏覽器的開(kāi)發(fā)人員工具或火狐瀏覽器的Firebug插件,這篇論文以Firebug插件為例[7]。首先安裝火狐瀏覽器,版本為40.0,并裝上Firebug,版本為2.0.13。程序以商品評(píng)論為例,具體分五步。

3.1 靜態(tài)URL構(gòu)造動(dòng)態(tài)URL

(1)提取某個(gè)商品的靜態(tài)URL網(wǎng)址

該文以商品為例,用瀏覽器打開(kāi)某個(gè)商品的頁(yè)面,復(fù)制地址欄網(wǎng)址如①所示。

http://item.jd.com/492036.html①

(2)提取對(duì)應(yīng)評(píng)論頁(yè)的靜態(tài)URL

a.單擊“商品評(píng)價(jià)”;b.復(fù)制地址欄的網(wǎng)址如②所示。

http://item.jd.com/492036.html#comment②

(3)提取含有評(píng)論數(shù)據(jù)的Ajax動(dòng)態(tài)鏈接

這里總結(jié)前人獲取評(píng)論動(dòng)態(tài)鏈接的方法如下:a.用火狐瀏覽器在評(píng)論頁(yè)空白部分,右鍵——使用Firebug查看元素,打開(kāi)“Firebug工作面板”;b.點(diǎn)擊工具面板上的“網(wǎng)絡(luò)”;c.其子菜單默認(rèn)在“全部”處;d.單擊工作面板左上角的“清除”,以清除已有請(qǐng)求;e.在瀏覽器窗口中,點(diǎn)擊評(píng)論第二頁(yè)的圖標(biāo);f.在“Firebug工作面板”上,右擊"GET p-492036-……"這個(gè)動(dòng)態(tài)請(qǐng)求,然后點(diǎn)擊“復(fù)制地址”;其中,選定"GET p-492036-……"這個(gè)請(qǐng)求的原因?yàn)椋哼@個(gè)請(qǐng)求的“響應(yīng)”含有評(píng)論數(shù)據(jù);g.粘貼這個(gè)“第二頁(yè)”評(píng)論的動(dòng)態(tài)地址如③所示。

http://club.jd.com/productpage/p-492036-s-0-t-3-p-1.html?callback=fetchJSON_comment98vv216③

通過(guò)動(dòng)態(tài)網(wǎng)址③就可以得到第2頁(yè)的評(píng)論。獲取動(dòng)態(tài)鏈接的操作如圖2所示。

動(dòng)態(tài)網(wǎng)址③含有一些時(shí)間戳等無(wú)用部分,可以進(jìn)行適當(dāng)?shù)暮?jiǎn)化。簡(jiǎn)化方法為:將網(wǎng)址③粘貼到瀏覽器地址欄,在保證網(wǎng)頁(yè)結(jié)果保留JSON格式信息的前提下,按照分隔符逐個(gè)刪除,直到最簡(jiǎn),如④所示。

http://club.jd.com/productpage/p-492036-s-0-t-3-p-1.html④

(4)提取存儲(chǔ)評(píng)論數(shù)據(jù)的另一頁(yè)的Ajax動(dòng)態(tài)鏈接

操作和3.1的第3節(jié)相同,但是,在其中的第5部分,應(yīng)該點(diǎn)擊評(píng)論的第三頁(yè)。最后得到第三頁(yè)評(píng)論的動(dòng)態(tài)網(wǎng)址,并簡(jiǎn)化如⑤所示。

http://club.jd.com/productpage/p-492036-s-0-t-3-p-2.html⑤

(5)提取另外一個(gè)商品的已簡(jiǎn)化的Ajax動(dòng)態(tài)鏈接如⑥所示

http://club.jd.com/productpage/p-1298665-s-0-t-3-p-1.html⑥

(6)根據(jù)靜態(tài)網(wǎng)頁(yè)信息構(gòu)造Ajax動(dòng)態(tài)鏈接

分析④⑤⑥動(dòng)態(tài)網(wǎng)址的變化部分,找出組成結(jié)構(gòu)如⑦所示

http://club.jd.com/productpage/p-+商品ID+-s-0-t-3-p-+頁(yè)碼標(biāo)識(shí)+.html⑦

“商品ID”唯一標(biāo)識(shí)了這個(gè)商品,“頁(yè)碼標(biāo)識(shí)”表示不同的頁(yè)碼。在Ajax動(dòng)態(tài)鏈接的組成結(jié)構(gòu)中,對(duì)于變化部分,一般可以在靜態(tài)網(wǎng)址①②以及由①②所得到網(wǎng)頁(yè)的源代碼中尋找,其中獲取源代碼方法:網(wǎng)頁(yè)空白處右鍵單擊——查看網(wǎng)頁(yè)源代碼。而對(duì)于這個(gè)網(wǎng)站,“商品ID”可以由靜態(tài)網(wǎng)址①得到,“頁(yè)碼標(biāo)識(shí)”一般為1…N的自然數(shù)。這樣就可以由商品的靜態(tài)網(wǎng)址及網(wǎng)頁(yè)數(shù)據(jù)構(gòu)造出評(píng)論的動(dòng)態(tài)鏈接,從而爬取評(píng)論信息。

一般在一種網(wǎng)站中,不同商品對(duì)應(yīng)的評(píng)論頁(yè)動(dòng)態(tài)網(wǎng)址⑦的格式是相同的。所以可以選擇某一個(gè)商品的動(dòng)態(tài)評(píng)論網(wǎng)址,設(shè)置為標(biāo)準(zhǔn)動(dòng)態(tài)網(wǎng)址(comment_Norm),為方便起見(jiàn),這篇論文把網(wǎng)址④設(shè)置為comment_Norm。這樣,對(duì)于任意一種商品,把comment_Norm的商品ID置換為本商品的ID,就可以得到這個(gè)商品的動(dòng)態(tài)網(wǎng)址;置換頁(yè)數(shù),可以得到2…N頁(yè)的動(dòng)態(tài)網(wǎng)址(commentsUrl),因?yàn)榈?頁(yè)的動(dòng)態(tài)網(wǎng)址不易獲取,所以從第2頁(yè)開(kāi)始爬取。

3.2 獲取該Ajax請(qǐng)求返回的Json數(shù)據(jù)

用requests的get/post方法(或urllib、urllib2、beautifuSoup等)發(fā)送請(qǐng)求并接收數(shù)據(jù):content=requests.get(comments_Url).content。用正則表達(dá)式提取標(biāo)準(zhǔn)數(shù)據(jù):content='{'+re.findall(r"{(.+)}",content)[0]+'}'。然后轉(zhuǎn)換為Json庫(kù)函數(shù)可以處理的字典格式:dict=json.loads(content,"gbk"),其中“gbk”為這個(gè)網(wǎng)頁(yè)的數(shù)據(jù)編碼方式,Python默認(rèn)編碼方式為“Ascii”,當(dāng)網(wǎng)站編碼方式也為“Ascii”時(shí),直接用json.loads(content)。

3.3 解析Json數(shù)據(jù)并保存結(jié)果

(1)解析Json數(shù)據(jù)

使用Python IDE即PyCharm解析Json數(shù)據(jù),PyCharm版本4.0.5,python版本2.7.10。操作為:a.在dict=json.loads(content,"gbk")這句設(shè)置斷點(diǎn);b.點(diǎn)擊“Debug/綠色甲蟲(chóng)”圖標(biāo);c.點(diǎn)擊“Step Over”;d.在“Variables”中右擊“dict”變量;e.左鍵單擊“add to watches”;f.在“Watches”窗口中點(diǎn)擊“dict”變量前的三角符號(hào),就得到了dict的樹(shù)狀結(jié)構(gòu)。操作如圖3所示。

也可以使用一般瀏覽器的“FeHelper”插件解析Json數(shù)據(jù),“FeHelper”插件版本v7.5。操作:把3.1的第3節(jié)的第6部分的“Response/響應(yīng)”復(fù)制粘貼到FeHelper的“Json串格式化”的窗口中,單擊格式化。也可以直接用Firebug插件,操作:在在3.1的第3節(jié)的第6部分,點(diǎn)擊含有評(píng)論數(shù)據(jù)的響應(yīng)——單擊“JSON”按鈕。在“JSON”內(nèi),即為Json數(shù)據(jù)的樹(shù)狀結(jié)構(gòu),如圖2所示。

(2)尋找評(píng)論路徑

dict['comments'][j]['content']即為評(píng)論,j為0-9自然數(shù)。

(3)保存結(jié)果

用easy_install或者是pip安裝相應(yīng)python包,以及安裝對(duì)應(yīng)的數(shù)據(jù)庫(kù)軟件。結(jié)果可以保存到mysql[8]、csv、excel、mongodb等數(shù)據(jù)庫(kù)中。

3.4 停止條件

一般通過(guò)評(píng)論總頁(yè)數(shù)判斷,可以直接看有多少頁(yè)(京東商城、國(guó)美在線等);或則用評(píng)論總數(shù)除以每頁(yè)個(gè)數(shù)得到總頁(yè)碼(天貓網(wǎng)、淘寶網(wǎng)、當(dāng)當(dāng)網(wǎng)、亞馬遜卓越網(wǎng)、蘇寧易購(gòu)等)?;蛲ㄟ^(guò)判斷動(dòng)態(tài)鏈接請(qǐng)求的返回值是否為空作為停止條件。

3.5 程序及結(jié)果

最后構(gòu)造程序如圖4所示。

3.6 特殊情況

(1)自動(dòng)獲取停止爬取的標(biāo)志

一般需要從含有評(píng)論數(shù)據(jù)的動(dòng)態(tài)網(wǎng)頁(yè)或其他動(dòng)態(tài)網(wǎng)頁(yè)中尋找相關(guān)數(shù)據(jù)。a.通過(guò)評(píng)論總頁(yè)數(shù):例如淘寶網(wǎng),dict['maxPage']即為總頁(yè)數(shù)。b.通過(guò)評(píng)論總數(shù):例如京東商城的dict['productCommentSummary']['commentCount']為評(píng)論總個(gè)數(shù),再除以每頁(yè)的個(gè)數(shù),即得到總頁(yè)數(shù)。c.通過(guò)停止標(biāo)志:例如騰訊TV、騰訊新聞。它們的停止標(biāo)志為dict['data']['hasnext'],該值如果為false,則應(yīng)停止爬取。

(2)頁(yè)碼標(biāo)志符不是自然數(shù)

標(biāo)志符一般需要從相關(guān)動(dòng)態(tài)網(wǎng)頁(yè)中尋找。例如騰訊新聞、TV。首先選取某個(gè)新聞,提取第一頁(yè)已簡(jiǎn)化的動(dòng)態(tài)評(píng)論網(wǎng)址如⑧所示,提取第二頁(yè)的如⑨所示,動(dòng)態(tài)網(wǎng)址的結(jié)構(gòu)見(jiàn)⑩。

http://coral.qq.com/article/1267477591/comment?commentid=0&reqnum=10⑧

http://coral.qq.com/article/1267477591/comment?commentid=6081308797779398298&reqnum=20⑨

http://coral.qq.com/article/+新聞ID+/comment?commentid=+pageID+&reqnum=+rNUM⑩

“新聞ID”從評(píng)論頁(yè)靜態(tài)網(wǎng)址中提取;第1頁(yè)評(píng)論動(dòng)態(tài)網(wǎng)頁(yè)的“rNUM”為10,第2…N頁(yè)的“rNUM”為20;第1頁(yè)的“pageID”為固定值“0”,其他頁(yè)的“pageID”從前一頁(yè)的動(dòng)態(tài)網(wǎng)頁(yè)中找,其中pageID=dict['last']。以此類推,這樣就可以得到第1…N頁(yè)的動(dòng)態(tài)網(wǎng)址了。

其中第一頁(yè)動(dòng)態(tài)網(wǎng)址的獲取方法為:進(jìn)入評(píng)論頁(yè),打開(kāi)“Firebug工作面板”,單擊“清除”,然后刷新頁(yè)面,在請(qǐng)求中逐個(gè)尋找。存儲(chǔ)評(píng)論的請(qǐng)求一般包含在“網(wǎng)絡(luò)”子菜單的JavaScript或XHR中,可以直接在這里找。

(3)遵守robot協(xié)議

在爬取數(shù)據(jù)的過(guò)程中,應(yīng)嚴(yán)格遵守網(wǎng)絡(luò)協(xié)議規(guī)定,經(jīng)測(cè)試,6秒對(duì)服務(wù)器發(fā)起一次請(qǐng)求較為合適。用time.sleep(6)來(lái)控制速度。

(4)應(yīng)對(duì)防爬蟲(chóng)方法

a.表頭信息:對(duì)于一些網(wǎng)站需要表頭信息,程序?yàn)椋篶ontent=requests.get(comments_Url,headers=header).content。其中的comments_Url為存儲(chǔ)評(píng)論信息的動(dòng)態(tài)網(wǎng)址。Header為表頭信息,獲取方法為:在3.1的第3節(jié)的第6部分點(diǎn)擊任意一個(gè)請(qǐng)求—頭信息—請(qǐng)求頭信息—“User-Agent”。b.cookie:對(duì)于一些需要登錄信息的網(wǎng)站,例如新浪/騰訊微博、twitter、QQ空間、Facebook、朋友網(wǎng)、人人網(wǎng)、網(wǎng)頁(yè)版微信/來(lái)往等,需要Cookie信息。程序?yàn)椋篶ontent=requests.get(comments_Url,cookies=cook).content。Cookie的獲取方法為:先用瀏覽器登錄賬號(hào),在3.1的第3節(jié)的第6部分點(diǎn)擊含有評(píng)論信息的請(qǐng)求—頭信息—請(qǐng)求頭信息—Cookie。c.Form Data(表單數(shù)據(jù)):例如鳳凰新聞、TV評(píng)論,由評(píng)論頁(yè)動(dòng)態(tài)網(wǎng)址并不能得到評(píng)論數(shù)據(jù),還得加入Form Data,而且通過(guò)更改表單數(shù)據(jù)中'p'的值來(lái)翻頁(yè)。程序如下:

comments_Url='http://comment.ifeng.com/get?job=1&order=DESC&orderBy=create_time&format=json&pagesize=20'

data={'p':'1','docurl':'http://news.ifeng.com/a/20151121/46335318_0.shtml'}

content=requests.post(comments_Url,data=data).content

data為表單數(shù)據(jù)的信息。獲取方法為:在3.1的第3節(jié)的第6部分點(diǎn)擊含有評(píng)論信息的請(qǐng)求—Post—參數(shù)。

(5)其他

環(huán)球新聞?dòng)胏ontent=re.findall(r"comment_list\((.+)\);",content)[0]語(yǔ)句提取標(biāo)準(zhǔn)Json數(shù)據(jù)。新浪、騰訊等網(wǎng)站,評(píng)論不分頁(yè)顯示,“加載更多/加載更多評(píng)論”按鈕相當(dāng)于第2…N頁(yè)。優(yōu)酷TV,動(dòng)態(tài)鏈接返回Html。用正則表達(dá)式提取評(píng)論信息。對(duì)評(píng)論部分的字符串(例如:comment="\u559c\u6b22\u59ae"),用comment=comment.decode("unicode-escape")進(jìn)行反編碼后得到對(duì)應(yīng)漢字。

4 對(duì)比分析(Comparative analysis)

該研究把本文所設(shè)計(jì)的爬蟲(chóng)與目前應(yīng)用廣泛的通用爬蟲(chóng)比較:通用爬蟲(chóng)以集搜客和網(wǎng)絡(luò)神采為例。網(wǎng)絡(luò)神采通用性最強(qiáng)(采集瀏覽器看到的),采集內(nèi)容范圍廣(支持登錄、跨層、POST、腳本、動(dòng)態(tài)網(wǎng)頁(yè)),但需要設(shè)置許多參數(shù);基于Python的動(dòng)態(tài)網(wǎng)頁(yè)評(píng)論爬蟲(chóng)專門針對(duì)評(píng)論,而且爬取過(guò)程不依賴于瀏覽器,因此其效率比集搜客和網(wǎng)絡(luò)神采快些。在復(fù)雜度方面,網(wǎng)絡(luò)神采考慮的因素比較全面,所以比評(píng)論爬蟲(chóng)算法復(fù)雜得多;而集搜客,基本不用編寫(xiě)程序,甚至直接使用現(xiàn)成的采集規(guī)則。網(wǎng)絡(luò)神采擴(kuò)展性強(qiáng)(支持存儲(chǔ)過(guò)程、插件、二次開(kāi)發(fā)),集搜客可以導(dǎo)入excel,而Python可操作各種DB。三種爬蟲(chóng)對(duì)比分析詳見(jiàn)表2。

5 結(jié)論(Conclusion)

研究在前人的基礎(chǔ)上,設(shè)計(jì)了基于Python的商品、新聞、社交網(wǎng)站、TV評(píng)論聚焦爬蟲(chóng)算法。以此為基礎(chǔ),實(shí)現(xiàn)了商品評(píng)論的收集程序?;赑ython的評(píng)論爬蟲(chóng)具有一定的高效性、通用性、實(shí)時(shí)性,所以可以作為實(shí)時(shí)商品、新聞、社交網(wǎng)站、TV評(píng)論采集算法;這種算法基于自然語(yǔ)言處理能力強(qiáng)的Python語(yǔ)言,利于對(duì)評(píng)論文本的后續(xù)分析以及相應(yīng)爬蟲(chóng)軟件[9]的開(kāi)發(fā)。而且這種爬蟲(chóng)比較簡(jiǎn)單,可以被計(jì)算機(jī)基礎(chǔ)弱的評(píng)論挖掘研究者使用。

參考文獻(xiàn)(References)

[1] 彭磊,李先國(guó).大數(shù)據(jù)量Excel數(shù)據(jù)導(dǎo)入系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].

計(jì)算機(jī)應(yīng)用技術(shù),2014(14):57-59.

[2] 吳宏洲.分詞技術(shù)的研究與應(yīng)用——一種抽取新詞的簡(jiǎn)便方

法[J].軟件工程師,2015,18(12):64-68.

[3] 王佳.支持Ajax技術(shù)的主題網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)研究與實(shí)現(xiàn)[D].北

京:北京交通大學(xué),2011:22-27.

[4] 方美玉,鄭小林,陳德人.商品評(píng)論聚焦爬蟲(chóng)算法設(shè)計(jì)與實(shí)現(xiàn)

[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2012(S1):377-381.

[5] 陳國(guó)良.基于商品評(píng)論信息的特征挖掘[J].福建電腦,2015(05):

106-107.

[6] 劉典型.基于概念聚類的Web數(shù)據(jù)挖掘搜索引擎的設(shè)計(jì)與實(shí)

現(xiàn)[J].軟件工程師,2015,18(5):18-20.

[7] Winterto1990.python爬取ajax動(dòng)態(tài)生成的數(shù)據(jù)以抓取淘寶

評(píng)論為例子[EB/OL].[2015-08-26]http://www.th7.cn/web/

ajax/201508/117293.shtml.

[8] 陳瀟.SQL Server2008數(shù)據(jù)庫(kù)存儲(chǔ)過(guò)程的應(yīng)用[J].軟件工程師.

2015,18(6):18-19.

[9] 劉正春.基于Carbide.C++的Symbian OS軟件開(kāi)發(fā)[J].電腦與

電信,2009(01):47-49.

作者簡(jiǎn)介:

夏火松(1964-),男,博士,教授.研究領(lǐng)域:決策支持系統(tǒng).

李保國(guó)(1990-),男,研究生.研究領(lǐng)域:信息管理.

猜你喜歡
Python語(yǔ)言
關(guān)于面向非計(jì)算機(jī)專業(yè)開(kāi)設(shè)Python語(yǔ)言的幾點(diǎn)思考
計(jì)算思維培養(yǎng)視域下《Python程序設(shè)計(jì)》課程的教學(xué)改革實(shí)踐
在高中信息技術(shù)課中培養(yǎng)學(xué)生計(jì)算思維的有效方法探討
基于KNN算法的手寫(xiě)數(shù)字識(shí)別
Python語(yǔ)言教學(xué)中問(wèn)題解決能力和創(chuàng)新能力的培養(yǎng)實(shí)踐
Python語(yǔ)言程序設(shè)計(jì)教學(xué)體系建設(shè)
面向計(jì)算生態(tài)的Python語(yǔ)言入門課程教學(xué)方案
基于Python語(yǔ)言和支持向量機(jī)的字符驗(yàn)證碼識(shí)別
論P(yáng)ython程序設(shè)計(jì)語(yǔ)言
基于Python語(yǔ)言的面向?qū)ο笳n程實(shí)踐教學(xué)探討