国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于小世界模型的EMBA潛在生源挖掘方法

2014-01-07 03:06:50王海泉楊文靜
科技視界 2014年31期
關鍵詞:派系爬蟲生源

胡 鶴 王海泉 楊 穎 楊文靜

(1.北京航空航天大學經濟管理學院,中國 北京100191;2.北京航空航天大學軟件學院,中國 北京100191;3.北京航空航天大學網絡技術北京市重點實驗室,中國 北京100191)

0 引言

隨著EMBA教育逐漸為社會各界所熟識,EMBA培養(yǎng)院校的招生工作目前面臨巨大壓力。從市場競爭的格局來看:一方面,國內EMBA院校已經達到64所,加上境外大學的教學項目,在國內招生的EMBA項目已經近百所,而且還有繼續(xù)擴大的趨勢,未來的競爭會更加激烈。另一方面,隨著MBA和其他碩士教育的迅速普及,未來EMBA的申請人數量將呈逐年下降的趨勢。這使得市場競爭態(tài)勢更加雪上加霜,商學院必須有所轉變,不能取得某一細分市場優(yōu)勢地位的EMBA項目,或者沒有建立自己品牌特色的項目將面臨生存危機。

在各培養(yǎng)院校的招生過程中,尤其是EMBA項目的市場調研中,如何在龐大的數據、人際關系網絡中找到關鍵節(jié)點,進而通過關鍵節(jié)點尋找到適合EMBA招生的生源群體,是目前EMBA招生環(huán)節(jié)中的關鍵問題。當今社會的人際關系網絡錯綜復雜,變化萬千,如何對人際關系進行系統性的描述和梳理,劃分出相應的群體并研究他們的共同特征,是系統科學中十分關鍵的問題。復雜網絡理論由于其具有小世界、集群等特性,十分適用于對社會網絡即人際關系網絡中的人群進行分類與描述,進而尋找出人際關系網絡的關鍵節(jié)點和群體,為尋找出潛在招生對象提供依據。

1 相關工作

現代市場營銷職能體系包括商品銷售、市場調查研究、生產與供應、創(chuàng)造市場要求和協調平衡公共關系五大職能。對于高等教育市場來看,高等教育提供的產品就是教育,教育市場有市場的需求,同時也具備了價值交換的能力,所以教育活動完全可以與市場接軌參與市場競爭。人際關系網絡是一個錯綜復雜、變化萬千的復雜系統。近年來隨著復雜網絡研究的興起,人們在這些理論的指導下能夠更好的了解和解釋現實世界的很多現象,比如反映社區(qū)特性的“物以類聚、人以群分”現象、反映小世界特性的“六度分隔”現象,以及反映復雜網絡節(jié)點的不對等特性的“馬太效應”等等。在很好的理解和解釋了這些現象的基礎上,研究者開始嘗試利用這些理論去幫助人們利用這些現象,并開發(fā)了很多的實際的應用和系統。例如:城市交通網絡、電子商務推薦系統、人際關系挖掘系統等。

近年來,學界關于復雜網絡的研究方興未艾。1998年Watts和Strogatz在Nature雜志上發(fā)表文章,引入了小世界(Small-World)網絡模型,以描述從完全規(guī)則網絡到完全隨機網絡的轉變。小世界網絡既具有與規(guī)則網絡類似的聚類特性,又具有與隨機網絡類似的較小的平均路徑長度。二是1999年Barabasi和Albert在Science上發(fā)表文章指出,許多實際的復雜網絡的連接度分布具有冪律形式。由于冪律分布沒有明顯的特征長度,該類網絡又被稱為無標度(Scale-Free)網絡。而后科學家們又研究了各種復雜網絡的各種特性。

在人際關系網絡獲取方面,由于網絡內不僅節(jié)點眾多,而且關系的分類也多種多樣。因此獲取人際關系是一項非常復雜的工程,歷史上幾次比較大規(guī)模的實驗也僅僅是采用書信或者政府檔案的方式,覆蓋面十分有限。隨著網絡的發(fā)展,互聯網的內容日新月異,互聯網成為了最大的非結構化數據庫,使從網絡中探索人際關系成為了可能。目前網絡的關系獲取方法主要有兩種:關系搜索引擎和社區(qū)資源。關系搜索引擎的的基本原理是利用網絡爬蟲從網頁中抽取出人名、地名、機構名以及中文短語,再根據算法計算出他們存在關系的可能性。現階段國內的關系搜索引擎有微軟人立方 (http://renlifang.msra.cn/)、雅虎人物搜索和搜搜華爾茲(http://tag.soso.com/)。但是由于網頁的來源比較復雜,而且存在重名的問題,得到的結果往往不精確,難以真實的表現出真實的人際關系。第二種搜索方式則是利用網絡中現有的社區(qū)資源,對其信息進行抓取,得到的信息雖然規(guī)模有限,但是可以確定所有節(jié)點信息,具有更強的結構化特性,更加符合真實人際關系的無標度和小世界特性。

2 基于復雜網絡的招生生源社團分析方法

2.1 系統的設計目標與創(chuàng)新點

在整個人際關系網絡中,存在一些子網,它們對于其內部的節(jié)點具有高類聚性,而對于子網外部節(jié)點的連接確相對稀疏的特性,我們稱之為人群的社團結構。

通過實現社團劃分系統,并對真實人際關系網絡進行處理和分析,研究復雜網絡社團劃分技術在未來人際關系網絡處理上的潛在應用以及較以前撒網式處理方式的優(yōu)勢。本系統希望能夠對招生生源的人際關系網絡進行分析,尋找出人際關系中的關鍵節(jié)點以及關鍵社團信息,以此為EMBA招生生源選取以及宣傳廣告的定向投放目標選擇提供必要依據。

該方法是對傳統市場調查分析、廣告宣傳領域的再思考,相比廣泛撒網式的宣傳與調查,該方法具有效率高、定位準確、耗費人力物力較少、資源可重復利用性強等優(yōu)點,十分適合于解決EMBA面臨的招生生源困難這一具體問題。

2.2 網絡社區(qū)的選擇

選取網絡社區(qū)需要綜合考慮多方面因素:

(1)關系要真實有效,即網絡的好友關系能比較客觀的反映出現實生活中的好友關系。

(2)關系網絡要足夠大,僅僅包括幾千個節(jié)點的網絡能夠在非常短的時間內遍歷完畢,不能夠反映出來真實人際關系非常難以獲取的特點,不具有研究價值。

(3)關系網絡可以比較方便的獲得,部分網絡社區(qū)采用了加密設置,非注冊用戶不能夠獲得其他人的好友關系,雖然從技術上可以進行破解,但是存在較大的風險。

(4)社區(qū)允許爬蟲進行抓取,對于需要的頁面不存在robot.txt的限制。

(5)服務器比較強大,可以應對每秒鐘幾百次(包括爬蟲的訪問次數在內)的請求。

經過對國內較大的幾家SNS(社會性網絡服務)網站的測試分析,最終選取了聚友網(http://www.myspace.cn)作為實驗的樣本。聚友網是以SNS為基礎的娛樂平臺,是全球最大的在線交友平臺之一MySpace的中國本地化網站,符合以上幾點要求,且服務器可供校園網訪問。聚友網(Myspace),是以SNS為基礎的娛樂平臺,是全球最大的在線交友平臺Myspace的中國本地化網站,提供免費的微型博客、個人主頁、個人空間、電子相冊、博客空間、音樂盒視頻上傳空間等服務。我們所要采用的Myspace網絡是從該網站的眾多用戶中,使用網絡爬蟲技術獲得的其中的13569個用戶,網絡中包含了99185條關系,兩個節(jié)點之間的一條邊則意味著相應的兩個用戶之間互為好友關系。

2.3 招生生源社團分析系統

招生生源社團劃分系統包括爬蟲獲取信息、關系分析、數據讀入、數據顯示、社團劃分和數據顯示六個個部分。網絡爬蟲系統將分析出的典型社會網絡信息,經過關系分析處理,最終存儲成為網絡原始結構數據。用戶可以使用社團劃分系統讀入已有的人際關系網絡數據,并讓系統對其進行社團劃分。在系統運行算法完畢后,將會自動保存對該人際關系網絡社團劃分后的最終結果,用戶可以通過窗口查看各個社團所包含的派系、節(jié)點等信息,被查看的社團還可以用圖片的形式顯示出來。

圖1 社會網絡信息獲取流

圖2 系統處理流程

其中各模塊的功能如下:

爬蟲模塊:負責從典型社交網絡中獲取社交信息。

關系分析模塊:負責將社交信息之間的關系進行處理并存儲形成網絡原始結構數據。

數據讀入:讀入系統需要分析的原始數據。

數據寫出:將經過社團劃分系統處理后的數據保存到文檔中。

數據顯示:在社團劃分系統中顯示社團劃分的結果。

社團劃分:核心算法,分為2個部分。第一步,尋找原始數據中所有的派系;第二步,通過派系重疊矩陣劃分出k-派系社團。

系統各功能所隊型的模塊如下表所示:

表1 系統功能分配

3 實驗與分析

3.1 招生生源社團分析系統

社團劃分系統采用了復雜網絡社團劃分技術中的派系過濾算法為其主要核心。本章主要是使用社團劃分系統分析Myspace這一真實的人際關系網絡,將獲得的社團結果和統計結果與實際情況相對比,測試核心算法在系統中是否正確的運行,并驗證得出利用社團劃分系統分析學生的人際關系網絡,能夠得到合理的社團結構,滿足尋找潛在生源的目的,為EMBA招生起到提高宣傳推廣效率的作用。

聚友網(Myspace),是以SNS為基礎的娛樂平臺,是全球最大的在線交友平臺Myspace的中國本地化網站,提供免費的微型博客、個人主頁、個人空間、電子相冊、博客空間、音樂盒視頻上傳空間等服務。我們所要采用的Myspace網絡是從該網站的眾多用戶中,使用網絡爬蟲技術獲得的其中的13569個用戶,網絡中包含了 99185條關系,兩個節(jié)點之間的一條邊則意味著相應的兩個用戶之間互為好友關系。下圖展示了Myspace的好友關系圖。

圖3 Myspace網絡用戶關系展示

3.2 系統分析結果

通過社團劃分系統對Myspace網絡的分析,我們共獲得各派系共12446個,派系社團559個。下圖為使用社團劃分系統分析Myspace網絡后,獲得的一個17-派系社團結構(k=17)和一個33-派系社團結構(k=33)。

圖4 Myspace網絡的一個17-派系社團(k=17)

圖5 Myspace網絡的一個33-派系社團(k=33)

3.3 結果分析

選取Myspace網絡社團劃分結果中的3-派系社團(k=3)、4派系社團(k=4)和5派系社團(k=5)作為我們的分析目標。

經統計分析,Myspace網絡中3-派系社團(k=3)、4派系社團(k=4)和5派系社團(k=5)的社團大小分布圖(Size Distribution)和重疊量分布圖(Overlap Distribution)如下圖所示。

圖 6 Myspace 網絡 3、4、5-派系社團(k=3、k=4、k=5)的統計特性

我們可以看到,無論社團大小分布圖還是重疊量分布圖都大致滿足冪律分布,且隨著k值的減小,曲線變得更為平滑。但是當k值比較大時,因為社團較少,所以曲線呈現鋸齒狀圖樣,這可能是因為在使用網絡爬蟲技術對Myspace網站進行數據收集時,由于該網站用戶數量十分的龐大,網絡爬蟲并沒有存儲所有的用戶信息,而只是選取了其中13569個用戶來組成的Myspace網絡。盡管Myspace網絡基本滿足應有的小世界及無標度特性,但從上圖可以看出,其數據集仍然存在著缺陷。

3.4 小結

3.4.1 測試結果

首先,系統總體效率需要提高,無論是派系過濾算法還是系統其它功能,在分析Myspace網絡中效率都顯得比較低,這在之前分析較小規(guī)模的網絡上并不是十分明顯。然后,社團劃分的統計結果在大體上還是滿足冪律分布的,本文認為這是因為Myspace網絡數據集存在的缺陷引起的,并不是因為社團劃分系統算法運行的問題。考慮到Myspace網站龐大的用戶數量、測試條件與個人能力的限制,總體測試的結果還是可以接受的。最后,盡管派系過濾算法本身的時間復雜度偏高、計算量大,但是在更新更快的社團劃分算法開發(fā)出來之前,它是分析大型復雜網絡社團結構最符合實際要求的算法。

3.4.2 應用驗證

Mysapce網絡規(guī)模較大,因此要想直接觀察其社團結構是非常不方便的,所以我們采用社團結構的統計特性來進行驗證。對社團劃分系統分析Myspace網絡所獲得的社團結構進行統計分析,我們可以看出社團劃分系統在大型人際關系網絡分析中依然可以獲得合理的結果。學校招生應用中,即使面對大規(guī)模的學生人際關系網絡,也能夠得到較為準確的結果,這在提高學校招生宣傳的精準度上有良好促進作用。

4 結束語

本文通過對市場營銷理論的研究,對如何將教育營銷理論融入到EMBA招生這一具體問題進行了分析與探討。本文通過將復雜網絡理論引入教育營銷中,分析人際關系網絡中的復雜網絡特性,尤其是其聚集聚團性,并根據該性質設計并實現了一套適用于EMBA招生生源獲取的人際關系社團分析系統。對典型的社會網絡(Myspace網絡)實例的分析結果表明,該社團分析系統可以很好的對人際關系網絡社團性質進行發(fā)現和獲取,為學校招生應用中,即使面對大規(guī)模的學生人際關系網絡,也能夠得到較為準確的結果,這在提高學校招生宣傳的精準度上有良好促進作用。

[1]張新民.中國EMBA教育透視[J].企業(yè)管理,2004(05).

[2]曾小軍.民辦高校引入營銷理念與招生策略研究[J].教育導刊,2009(09).

[3]周廣訓.談高校營銷的特點[J].中國成人教育,2004(09).

[4]徐芳.教育營銷和教育營銷戰(zhàn)略[J].廣東職業(yè)技術師范學院學報,2001(1):7.

[5]林進奎.營銷創(chuàng)新與教育營銷[J].東岳論叢,2004(03).

[6]惠曦.高等教育營銷策略初探[J].遼寧教育研究,2002(09).

猜你喜歡
派系爬蟲生源
長洲怡生源記貨單考論
廣州文博(2023年0期)2023-12-21 07:23:28
利用網絡爬蟲技術驗證房地產灰犀牛之說
基于Python的網絡爬蟲和反爬蟲技術研究
農村生源不是“搖錢樹”
鄉(xiāng)籍、派系與黨政:抗戰(zhàn)時期吉安縣商會選舉之爭
近代史學刊(2020年2期)2020-11-18 09:15:58
利用爬蟲技術的Geo-Gnutel la VANET流量采集
電子測試(2018年1期)2018-04-18 11:53:04
“派系撕裂校園”:暨南大學驅長風潮研究(1933—1934)
近代史學刊(2017年2期)2017-06-06 02:25:25
大數據環(huán)境下基于python的網絡爬蟲技術
電子制作(2017年9期)2017-04-17 03:00:46
派系政治與農民上訪的邏輯
學院派系
風采童裝(2016年10期)2016-11-12 09:27:17
桦甸市| 老河口市| 天镇县| 英超| 读书| 大埔区| 枣强县| 游戏| 大英县| 平远县| 固阳县| 昌邑市| 邳州市| 鄂温| 柳河县| 常州市| 通州市| 农安县| 牡丹江市| 周宁县| 遂昌县| 铜陵市| 沛县| 汉阴县| 灌南县| 南华县| 东平县| 历史| 枝江市| 苗栗县| 札达县| 漠河县| 苍山县| 独山县| 涞水县| 广州市| 静宁县| 泰州市| 信宜市| 邹城市| 弋阳县|