国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

第三方支付粗糙復(fù)雜網(wǎng)絡(luò)知識發(fā)現(xiàn)方法研究*

2016-08-31 09:06:32曹黎俠黃光球西安建筑科技大學(xué)管理學(xué)院西安700552西安工業(yè)大學(xué)理學(xué)院西安70032
計(jì)算機(jī)與生活 2016年8期
關(guān)鍵詞:時(shí)間序列分析第三方支付

曹黎俠,黃光球,李 艷.西安建筑科技大學(xué) 管理學(xué)院,西安 700552.西安工業(yè)大學(xué) 理學(xué)院,西安 70032

第三方支付粗糙復(fù)雜網(wǎng)絡(luò)知識發(fā)現(xiàn)方法研究*

曹黎俠1,2+,黃光球1,李艷1
1.西安建筑科技大學(xué) 管理學(xué)院,西安 710055
2.西安工業(yè)大學(xué) 理學(xué)院,西安 710032

CAO Lixia,HUANG Guangqiu,LIYan.Research on the third-party payment rough complex networks knowledge discovery methods.Journal of Frontiers of Computer Science and Technology,2016,10(8):1143-1153.

摘要:第三方支付平臺的可持續(xù)發(fā)展是一個(gè)錯(cuò)綜復(fù)雜的問題,解決問題的關(guān)鍵之一是平臺潛在客戶的挖掘。建立了第三方支付粗糙復(fù)雜網(wǎng)絡(luò),通過對該粗糙復(fù)雜網(wǎng)絡(luò)的上下近似度、度分布和度的概率主值的研究,構(gòu)建了第三方支付粗糙復(fù)雜網(wǎng)絡(luò)知識發(fā)現(xiàn)模型,給出了基于粗糙集理論的時(shí)間序列分析法的求解方法。第三方支付粗糙復(fù)雜網(wǎng)絡(luò)知識發(fā)現(xiàn)方法的研究,為第三方支付平臺潛在客戶的挖掘提供了定量化可操作的方法。提出了粗糙復(fù)雜網(wǎng)絡(luò)的有關(guān)概念,以及第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的度分布,為第三方支付有關(guān)問題的研究奠定了理論基礎(chǔ);知識發(fā)現(xiàn)方法的研究,適應(yīng)了動(dòng)態(tài)知識系統(tǒng)更新的需求,因此有著廣泛的應(yīng)用前景。

關(guān)鍵詞:第三方支付;粗糙復(fù)雜網(wǎng)絡(luò);時(shí)間序列分析;知識發(fā)現(xiàn)

1 引言

經(jīng)濟(jì)發(fā)展的最高境界,不是做產(chǎn)品,不是重質(zhì)量,也不是搞標(biāo)準(zhǔn),而是打造平臺。近幾年來,第三方支付企業(yè)之所以成功,一個(gè)很重要的原因就是將產(chǎn)品做成了一個(gè)平臺,或者說平臺就是他們真正意義上的產(chǎn)品。這種借助于互聯(lián)網(wǎng)的能力是其他銷售模式都無法相提并論的,然而第三方支付企業(yè)的可持續(xù)發(fā)展問題的研究目前也只限于一些定性化的分析和主觀性的決策[1-3]。有些學(xué)者指出第三方支付平臺可持續(xù)發(fā)展的關(guān)鍵,是解決效益問題、風(fēng)險(xiǎn)問題和平臺交易的監(jiān)管問題[4-5],但是現(xiàn)有的對平臺效益、風(fēng)險(xiǎn)和交易監(jiān)管問題的研究成果都只是從經(jīng)濟(jì)學(xué)原理、經(jīng)驗(yàn)管理等領(lǐng)域給出的定性化結(jié)論,缺乏定量化和系統(tǒng)化的結(jié)果,也沒有人從理論上給出與第三方支付平臺交易中參與者的決策行為相關(guān)的論證[6-9]。

第三方支付平臺的效益、風(fēng)險(xiǎn)和監(jiān)管都是在交易中產(chǎn)生的,而平臺交易是以信息網(wǎng)絡(luò)為媒介,具有網(wǎng)絡(luò)規(guī)模龐大、節(jié)點(diǎn)復(fù)雜性、連接結(jié)構(gòu)復(fù)雜性、網(wǎng)絡(luò)時(shí)空演化過程復(fù)雜性等特點(diǎn),因此,第三方支付平臺交易實(shí)質(zhì)是復(fù)雜網(wǎng)絡(luò)中的交易活動(dòng)。鑒于以上原因,本文以復(fù)雜網(wǎng)絡(luò)理論為基礎(chǔ),對平臺交易中的效益問題、風(fēng)險(xiǎn)問題和監(jiān)管問題進(jìn)行研究。遺憾的是,現(xiàn)有的復(fù)雜網(wǎng)絡(luò)理論都是針對確定性的節(jié)點(diǎn)和連接結(jié)構(gòu)而言[9],不能滿足第三方支付平臺交易中的不確定因素與節(jié)點(diǎn)和連接結(jié)構(gòu)對知識具有的不可分辨性的需求。這樣,現(xiàn)有的復(fù)雜網(wǎng)絡(luò)理論就出現(xiàn)了應(yīng)用上的局限性。目前,國內(nèi)外關(guān)于不確定性復(fù)雜網(wǎng)絡(luò)的研究,僅有的一些成果[10-11]也只是對粗糙屬性圖的性質(zhì)進(jìn)行探索,還沒有針對實(shí)際粗糙復(fù)雜網(wǎng)絡(luò)進(jìn)行的研究。因?yàn)榇植诩碚撌翘幚聿淮_定性問題非常好的一種數(shù)學(xué)理論,所以本文首先構(gòu)建第三方支付粗糙復(fù)雜網(wǎng)絡(luò),通過對該粗糙復(fù)雜網(wǎng)絡(luò)統(tǒng)計(jì)特征的研究,建立知識發(fā)現(xiàn)模型,實(shí)現(xiàn)第三方支付平臺粗糙復(fù)雜網(wǎng)絡(luò)潛在客戶的挖掘。

知識發(fā)現(xiàn)的核心是數(shù)據(jù)挖掘,常用的數(shù)據(jù)挖掘技術(shù)有傳統(tǒng)主觀導(dǎo)向系統(tǒng)、傳統(tǒng)統(tǒng)計(jì)分析、神經(jīng)元網(wǎng)絡(luò)(neural network,NN)技術(shù)、決策樹、進(jìn)化式程序設(shè)計(jì)、遺傳算法和非線性回歸方法等[12-14]。近年來,軟計(jì)算和不確定信息處理方法的研究,也促使數(shù)據(jù)挖掘技術(shù)向更深層次發(fā)展,即Web數(shù)據(jù)挖掘[15-16]。有關(guān)文獻(xiàn)指出[17-20],基于Web的數(shù)據(jù)挖掘和Web知識表述作為數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的一個(gè)新主題,是一個(gè)新興的研究領(lǐng)域,至今還沒有形成成熟的理論和技術(shù)。Web數(shù)據(jù)挖掘中的不完整性和不確定性問題,模糊數(shù)學(xué)和基于概率方法的證據(jù)理論是處理這類問題的兩種方法,但這些方法有時(shí)需要一些數(shù)據(jù)的附加信息或先驗(yàn)知識,而這些信息有時(shí)并不容易得到。本文運(yùn)用粗糙集理論與方法處理Web數(shù)據(jù)挖掘中的不完整性和不確定性問題,克服了上述兩種方法處理問題的弊端,具有一定的理論研究意義和實(shí)際應(yīng)用價(jià)值。本文基于粗糙集理論的第三方支付復(fù)雜網(wǎng)絡(luò)知識發(fā)現(xiàn)方法的研究,希望能夠?yàn)槠脚_交易的參與者提供一些定量化的決策依據(jù)和方法。

2 第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的建立

考慮到第三方支付平臺交易實(shí)際上是由商家及其銷售的商品和服務(wù)以及顧客組成的復(fù)雜網(wǎng)絡(luò),該網(wǎng)絡(luò)是以商家和商家經(jīng)營的商品為節(jié)點(diǎn),以網(wǎng)址的鏈接為邊。顧客訪問某一節(jié)點(diǎn),具有不確定性,該節(jié)點(diǎn)與哪些節(jié)點(diǎn)相連具有不可分辨性,因此稱第三方支付平臺交易網(wǎng)絡(luò)為粗糙復(fù)雜網(wǎng)絡(luò)。

定義1在復(fù)雜網(wǎng)絡(luò)中,如果節(jié)點(diǎn)(或連邊)關(guān)于某關(guān)系具有不可分辨性,則稱這樣的復(fù)雜網(wǎng)絡(luò)為粗糙復(fù)雜網(wǎng)絡(luò);粗糙復(fù)雜網(wǎng)絡(luò)根據(jù)粗糙性產(chǎn)生的原因,可以分為粗糙節(jié)點(diǎn)復(fù)雜網(wǎng)絡(luò)和粗糙邊復(fù)雜網(wǎng)絡(luò)。

定義2在粗糙復(fù)雜網(wǎng)絡(luò)RCN中,設(shè)X是節(jié)點(diǎn)(或邊)集U的一個(gè)子集,R為U上的一個(gè)等價(jià)關(guān)系,稱為下近似粗糙節(jié)點(diǎn)(或邊)復(fù)雜網(wǎng)絡(luò),記為;稱為上近似粗糙節(jié)點(diǎn)(或邊)復(fù)雜網(wǎng)絡(luò),記為。

第三方支付平臺交易粗糙網(wǎng)絡(luò)中,設(shè)商家和商品構(gòu)成了知識庫U,X?U,R是U上的決策關(guān)系,且這種決策具有反身性、對稱性和傳遞性,則R={購買,收藏,瀏覽}。一般情況下,顧客購買前先收藏,則購買的商品和商品的鏈接形成了第三方支付下近似粗糙復(fù)雜網(wǎng)絡(luò),收藏的商品和商品的鏈接形成了第三方支付上近似粗糙復(fù)雜網(wǎng)絡(luò);瀏覽并未收藏的商品組成了以顧客決策行為為知識分類的負(fù)域。顧客訪問某商品,對同一商家的商品瀏覽的概率遠(yuǎn)遠(yuǎn)大于不同商家的商品,因此該粗糙復(fù)雜網(wǎng)絡(luò)實(shí)質(zhì)形成了以商家為社團(tuán)的復(fù)雜網(wǎng)絡(luò)。

根據(jù)第三方支付平臺運(yùn)營的實(shí)際狀況,提煉出以下特點(diǎn):

(1)某一交易平臺共有m個(gè)商家,每一商家經(jīng)營同類Vi個(gè)產(chǎn)品;

(2)顧客在瀏覽某一商品時(shí),往往會(huì)以較大的概率在同一商家的商品中去選擇,以較小的概率選擇不同商家的商品,商家相互之間可以進(jìn)行信息共享;

(3)顧客在訪問商品的頁面時(shí)可能會(huì)隨機(jī)地由此及彼地瀏覽商品,也許購買,也許收藏,也許只是瀏覽;

(4)顧客在購買前,首先收藏同類質(zhì)量和品質(zhì)相當(dāng)?shù)纳唐罚缓筮x擇銷售量(下近似粗糙網(wǎng)絡(luò)的度)比較大的購買。

這樣,在商品和商家構(gòu)成的這個(gè)復(fù)雜網(wǎng)絡(luò)中,以顧客訪問、收藏和購買為等價(jià)關(guān)系,構(gòu)建了第三方支付平臺交易的粗糙復(fù)雜網(wǎng)絡(luò),當(dāng)m=4,Vi(i=1,2,3,4) 取20~30間的整數(shù)時(shí),第三方支付粗糙復(fù)雜網(wǎng)絡(luò)如圖1所示。圖1黑色節(jié)點(diǎn)表示商家銷售的商品,紅色節(jié)點(diǎn)分別為4個(gè)商家;黑色節(jié)點(diǎn)中與商家相連的節(jié)點(diǎn)是顧客已購買的商品,其余的為顧客收藏而沒有購買的商品;有連邊沒有標(biāo)出的節(jié)點(diǎn)是顧客瀏覽且未收藏的商品。

Fig.1 The third-party payment rough complex networks圖1 第三方支付粗糙復(fù)雜網(wǎng)絡(luò)

3 第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的知識發(fā)現(xiàn)模型

3.1第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的粗糙度分布

3.1.1度分布的定義

在復(fù)雜網(wǎng)絡(luò)中,節(jié)點(diǎn)Vi的鄰邊數(shù)目ki稱為節(jié)點(diǎn)Vi的度;網(wǎng)絡(luò)中所有節(jié)點(diǎn)度的平均值,稱為網(wǎng)絡(luò)的平均度:

定義p(k)為網(wǎng)絡(luò)中度為k的節(jié)點(diǎn)在網(wǎng)絡(luò)中所占的比率,稱為網(wǎng)絡(luò)度分布。

但是上述度的定義并未考慮節(jié)點(diǎn)的權(quán)重。特別是在第三方支付平臺網(wǎng)絡(luò)中,度相同的不同節(jié)點(diǎn)在網(wǎng)絡(luò)中的地位不同,帶給商家和平臺管理者的效益也可能差別很大。鑒于此,本文給出一種新的度定義——網(wǎng)絡(luò)的加權(quán)平均度k*,可以克服文獻(xiàn)[21]定義的弊端。

其中,N表示網(wǎng)絡(luò)節(jié)點(diǎn)總數(shù);ωi是節(jié)點(diǎn)權(quán)重;ki是節(jié)點(diǎn)度。

在本文中,ωi代表商品或商家類別權(quán)重。

定義5下近似粗糙復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn)-Vi的鄰邊數(shù)目-ki稱為節(jié)點(diǎn)-Vi的下近似粗糙度;對網(wǎng)絡(luò)中所有節(jié)點(diǎn)的下近似粗糙度求平均,可得網(wǎng)絡(luò)的下近似粗糙平均度-k*:

3.1.2度分布

為考慮網(wǎng)絡(luò)的度分布,隨機(jī)性地收集了淘寶網(wǎng)站上銷量較好的50個(gè)不同品牌手機(jī)的度,經(jīng)過大量的調(diào)研,它們的連接關(guān)系如圖2所示。圖2是天貓商城被購買的手機(jī)的一個(gè)關(guān)聯(lián)網(wǎng)絡(luò)圖,也是圖1的一個(gè)下近似網(wǎng)絡(luò)圖,經(jīng)過統(tǒng)計(jì)得到該下近似網(wǎng)絡(luò)圖的度及其概率分布如表1所示。

Fig.2 The third-party payment under-approximate rough networks圖2 第三方支付下近似粗糙網(wǎng)絡(luò)

Table 1 Probability distribution table of underapproximate degree表1 下近似度的概率分布表

從度的概率分布散點(diǎn)圖可以看出度的概率分布曲線符合指數(shù)為負(fù)數(shù)的冪函數(shù)曲線,在雙對數(shù)坐標(biāo)系下這些點(diǎn)基本上都分布在一條斜率為負(fù)的直線附近。根據(jù)非線性回歸分析,得到度分布的回歸曲線為-P(-k)=0.158 9-k-0.611。

由回歸分析的顯著性檢驗(yàn)可知,回歸模型和回歸方程都是顯著的,但模型的擬合優(yōu)度一般,這是由于收集的數(shù)據(jù)比較少所致。由此可知,第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的下近似度服從冪律分布。同理可得,第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的上近似度服從冪律分布。因此,有下述定理。

定理1第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的下近似度和上近似度都服從冪律分布。

文獻(xiàn)[21]指出,冪律分布的γ越小,網(wǎng)絡(luò)的度分布越不均勻,度大的節(jié)點(diǎn)會(huì)非常突出,統(tǒng)計(jì)得到的網(wǎng)絡(luò)平均路徑與網(wǎng)絡(luò)實(shí)際平均路徑越接近,網(wǎng)絡(luò)搜索適合用最大度搜索法。顯然,如果以加權(quán)度大于網(wǎng)絡(luò)平均加權(quán)度的節(jié)點(diǎn)作為研究對象,滿足條件的節(jié)點(diǎn)會(huì)非常多,就會(huì)增大搜索空間,降低數(shù)據(jù)搜索的速度。說明了簡單地以加權(quán)度大于網(wǎng)絡(luò)平均加權(quán)度的方法來挖掘顧客,會(huì)增加平臺的工作量和運(yùn)營成本,因此顧客的挖掘問題是平臺提高效益需要解決的關(guān)鍵問題之一。

3.2第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的知識發(fā)現(xiàn)模型

在第三方支付粗糙復(fù)雜網(wǎng)絡(luò)中,平臺管理者為了吸引顧客通常會(huì)給所有的注冊會(huì)員發(fā)送促銷信息和優(yōu)惠券,但這樣做顯然具有非常大的盲目性,也難以收到預(yù)期的效果。因此,平臺的管理者很希望能夠挖掘出一批潛在的顧客,為此他們做了各種嘗試,也收到了一些效果。但是這些措施都是根據(jù)經(jīng)驗(yàn)而得到的一些結(jié)論,缺乏科學(xué)性的依據(jù)。建立起第三方支付平臺的知識發(fā)現(xiàn)模型,解決平臺潛在客戶的挖掘問題是一個(gè)非常有意義的研究課題。

關(guān)于Web知識發(fā)現(xiàn)的研究,已經(jīng)有了一些成果,但是至今還沒有形成成熟的理論和技術(shù)[20];至于粗糙復(fù)雜網(wǎng)絡(luò)的知識發(fā)現(xiàn)的研究,現(xiàn)有的文獻(xiàn)表明,還很少有人涉及這個(gè)領(lǐng)域。為此,做以下定義。

根據(jù)統(tǒng)計(jì)學(xué)原理,樣本分布在第一分位點(diǎn)Q1和第三分位點(diǎn)Q3之間的數(shù)目占樣本總數(shù)的50%,不妨把度k介于此部分的概率命名為度的概率主值。

定義8滿足式(4)的節(jié)點(diǎn)稱為下近似關(guān)鍵節(jié)點(diǎn)(key nodes),滿足式(5)的節(jié)點(diǎn)稱為上近似關(guān)鍵節(jié)點(diǎn)。

在粗糙復(fù)雜網(wǎng)絡(luò)中,關(guān)鍵節(jié)點(diǎn)的尋找可以沿著網(wǎng)絡(luò)的最短路徑去搜索。

定義9稱關(guān)鍵節(jié)點(diǎn)的購買者和收藏者為明星顧客;在此規(guī)定,只有明星顧客,才有可能成為潛在的顧客。

明星顧客的尋找可以分別在下近似粗糙網(wǎng)絡(luò)和上近似粗糙網(wǎng)絡(luò)中運(yùn)用最大度搜索法確定,這里的度是指本文定義的加權(quán)網(wǎng)絡(luò)度。

有了上述定義,就可以建立第三方支付粗糙復(fù)雜網(wǎng)絡(luò)在動(dòng)態(tài)知識系統(tǒng)中的知識發(fā)現(xiàn)模型,模型的創(chuàng)建包含以下3個(gè)階段。

階段1數(shù)據(jù)準(zhǔn)備階段

數(shù)據(jù)準(zhǔn)備又可分為3個(gè)步驟:數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理和數(shù)據(jù)轉(zhuǎn)換。

在第三方支付粗糙復(fù)雜網(wǎng)絡(luò)中隨機(jī)選取若干個(gè)節(jié)點(diǎn)統(tǒng)計(jì)其下近似度和上近似度,計(jì)算其下近似度分布和上近似度分布,下近似度的概率主值和上近似度的概率主值;以最大加權(quán)度節(jié)點(diǎn)為源節(jié)點(diǎn),確定其到其余節(jié)點(diǎn)的最短路徑,沿著網(wǎng)絡(luò)的最短路徑,依據(jù)式(4)和式(5)確定關(guān)鍵節(jié)點(diǎn),關(guān)鍵節(jié)點(diǎn)的個(gè)數(shù)依據(jù)網(wǎng)絡(luò)的規(guī)模確定;對每一個(gè)關(guān)鍵節(jié)點(diǎn),利用最大度搜索法統(tǒng)計(jì)其明星顧客近4期購買商品的數(shù)量、價(jià)格和收藏的商品價(jià)格和數(shù)量,形成目標(biāo)數(shù)據(jù);然后利用粗糙集的屬性約簡和決策規(guī)則的提取方法對目標(biāo)數(shù)據(jù)中的噪音數(shù)據(jù)、不完整及不一致進(jìn)行預(yù)處理[22],形成挖掘樣本數(shù)據(jù)庫;最后利用屬性約簡方法減小數(shù)據(jù)搜索空間,對挖掘樣本數(shù)據(jù)進(jìn)行適當(dāng)?shù)霓D(zhuǎn)換。

階段2數(shù)據(jù)挖掘階段

運(yùn)用時(shí)間序列分析法對第三方支付粗糙復(fù)雜網(wǎng)絡(luò)動(dòng)態(tài)知識系統(tǒng)進(jìn)行知識發(fā)現(xiàn)研究,從明星顧客中挖掘出潛在的顧客。挖掘算法的基本思想如下:

(1)計(jì)算每位明星顧客近4期中每期購買和收藏的商品價(jià)值總額=價(jià)格×數(shù)量,i是第i個(gè)明星顧客,j是第 j期,i=1,2,…,j=1,2,3,4。

(2)通過所有明星顧客購買和收藏量的時(shí)間序列的中心化移動(dòng)平均數(shù)的計(jì)算,消除時(shí)間序列的季節(jié)因素和不規(guī)則波動(dòng)的影響[23],再用消除季節(jié)影響的時(shí)間序列確定每位明星顧客購買總額和收藏總額的趨勢值。

(3)計(jì)算每位明星顧客的定基消費(fèi)指數(shù):

(4)根據(jù)每個(gè)明星顧客的消費(fèi)指數(shù),將消費(fèi)指數(shù)大于等于1的確定為潛在的顧客。

階段3模式解釋/評價(jià)

通過實(shí)例直接用數(shù)據(jù)來檢驗(yàn)其準(zhǔn)確性。

第三方支付粗糙復(fù)雜網(wǎng)絡(luò)中,不僅存在著信息不完全性和數(shù)據(jù)冗余,而且數(shù)據(jù)的信息量大,具有動(dòng)態(tài)變化的特征。該模型的構(gòu)建以知識發(fā)現(xiàn)方法為主線,以時(shí)間序列分析和粗糙集的知識約簡、屬性規(guī)則的提取為理論支撐,提出了基于粗糙集理論的時(shí)間序列分析挖掘方法。在此之前的研究,還沒有同時(shí)兼顧數(shù)據(jù)的不完整性和知識系統(tǒng)動(dòng)態(tài)性的相關(guān)結(jié)果。此外,本文的知識發(fā)現(xiàn)方法研究目標(biāo)明確,挖掘算法針對的數(shù)據(jù)很少出現(xiàn)模糊性,而只有不可分辨的特點(diǎn)。運(yùn)用粗糙集理論完成前期對數(shù)據(jù)的處理,消除了冗余數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)和缺省數(shù)據(jù),保證了統(tǒng)計(jì)資料的真實(shí)可靠性;減少了時(shí)間序列分析法的運(yùn)算量,提高了運(yùn)算速度,適應(yīng)了動(dòng)態(tài)知識系統(tǒng)數(shù)據(jù)不斷累加的需求。

3.3第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的知識發(fā)現(xiàn)方法的算法設(shè)計(jì)

輸出:潛在顧客potential customers。

步驟1變量賦值:

節(jié)點(diǎn)賦值:

明星顧客賦值:

步驟3以最大加權(quán)度節(jié)點(diǎn)為源節(jié)點(diǎn),運(yùn)用Dijkstra算法確定其到其余節(jié)點(diǎn)的最短路徑,并隨機(jī)地在源節(jié)點(diǎn)到其余節(jié)點(diǎn)的最短路徑上搜索,滿足式(4)或式(5)的節(jié)點(diǎn),存入key nodes;當(dāng)遍歷網(wǎng)絡(luò)中所有節(jié)點(diǎn)或是key nodes中的節(jié)點(diǎn)數(shù)等于100時(shí)停止搜索。

步驟4對于key nodes中的所有節(jié)點(diǎn),搜索其所有的購買者和收藏者,取其并集得到star customer set,連同它們近4期購買或收藏的商品價(jià)格和購買數(shù)量存入star customer,取收藏的數(shù)量均為1。

步驟5用知識約簡和屬性規(guī)則的提取對star customer中的噪音數(shù)據(jù)、不完整及不一致數(shù)據(jù)進(jìn)行預(yù)處理,減少搜索空間,形成挖掘樣本數(shù)據(jù)庫sample database。

根據(jù)步驟4整理的數(shù)據(jù),組成信息表;再將初始數(shù)據(jù)信息進(jìn)行分類,刪除star customer中的噪音數(shù)據(jù)、不完整數(shù)據(jù),合并具有不可分辨關(guān)系的對象,然后進(jìn)行屬性約簡,得到約簡屬性集;選取屬性約簡后的信息表,得到各規(guī)則的核值;根據(jù)核值表產(chǎn)生約簡規(guī)則組合,形成挖掘樣本數(shù)據(jù)庫sample database。

步驟6計(jì)算每位明星顧客近4期中每期購買和收藏的商品價(jià)值總額:

步驟7運(yùn)用時(shí)間序列分析法消除季節(jié)因素和不規(guī)則波動(dòng)的影響,確定每位明星顧客下一期購買總額的趨勢值。

步驟8計(jì)算每位明星顧客的定基消費(fèi)指數(shù):

步驟9滿足-Ii≥1或-Ii≥1的明星顧客i,即為潛在顧客potential customers。

對n個(gè)節(jié)點(diǎn)的粗糙復(fù)雜網(wǎng)絡(luò)來講,如果決策屬性有c個(gè),下近似粗糙復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)是n1,上近似粗糙復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)是n2,知識約簡與屬性規(guī)則提取后的決策屬性有d(d

4 仿真模擬

從淘寶天貓商城收集到了經(jīng)營蘋果、魅族、小米、華為、三星等品牌共4個(gè)商家78個(gè)商品組成的粗糙復(fù)雜網(wǎng)絡(luò)的上近似粗糙網(wǎng)絡(luò)圖,網(wǎng)絡(luò)結(jié)構(gòu)類似于圖1,除去圖1負(fù)域中的連邊,統(tǒng)計(jì)出每個(gè)節(jié)點(diǎn)的價(jià)格、銷售量、收藏的人氣指數(shù)、上近似度、下近似度和節(jié)點(diǎn)價(jià)格的權(quán)重。其中上近似粗糙網(wǎng)絡(luò)的節(jié)點(diǎn)度、權(quán)重如表2所示。

由表2確定表3,根據(jù)非線性回歸分析法得到上近似度分布-P(k)=0.279k-0.991。

按以下步驟完成該粗糙復(fù)雜網(wǎng)絡(luò)的知識發(fā)現(xiàn)。

步驟1計(jì)算下近似度和上近似度的概率主值:

步驟2在網(wǎng)絡(luò)節(jié)點(diǎn)上搜索,滿足式(4)或式(5)的節(jié)點(diǎn),存入key nodes,-k={5,6,7,9,10的節(jié)點(diǎn)};結(jié)果見表4,即:

key nodes={三星Note 4,小米note,華為P8,華為暢玩移動(dòng)版,酷派8270L,酷派F1 plus,vivo x5F,華為P7,榮耀6,魅族魅藍(lán),魅族M5聯(lián)通版,三星S3,酷派F1,華為6,紅米Note,榮耀4x,三星S4,華為GX1,華為P6,小米4,蘋果ip4,魅族M5,Ipad mini,三星S5,聯(lián)想s898T,紅米3}

步驟3對于key nodes中的所有節(jié)點(diǎn),搜索其所有的購買者和收藏者取其并集,連同他們近4期購買或收藏的商品價(jià)格和購買數(shù)量存入star customer。

在此,以魅族魅藍(lán)為例,表4是在網(wǎng)絡(luò)上收集的節(jié)點(diǎn)的有關(guān)信息,可以看出魅族魅藍(lán)的購買者月銷量9 680,收藏的人氣指數(shù)為11 681,數(shù)目比較多。此時(shí)可以隨機(jī)地搜集每100名購買的顧客作為1組,先組內(nèi)求并集,再組間求并集,存入star customer。

在網(wǎng)絡(luò)上搜索出購買者如圖3所示。

根據(jù)圖3,可以得出購買者的名稱,然后平臺管理者可以對購買者近4期的購買總額進(jìn)行匯總。計(jì)算每位明星顧客近4期中每期購買和收藏的商品價(jià)值總額:

以lixia1210這個(gè)帳號為例,近4年該用戶季度消費(fèi)情況如表5所示。

步驟4利用屬性約簡和決策規(guī)則的提取對star customer中的噪音數(shù)據(jù)、不完整及不一致數(shù)據(jù)進(jìn)行預(yù)處理,減少搜索空間,形成挖掘樣本數(shù)據(jù)庫sample database。

由于每位顧客購買的歷史記錄,除了顧客本人外,只有平臺管理者才可以從顧客的賬號里得到真實(shí)的數(shù)據(jù),在此只能說明運(yùn)算的過程。

Table 2 Nodes and weights table of the third-party payment up-approximation rough complex networks表2 第三方支付上近似粗糙復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn)度和權(quán)重統(tǒng)計(jì)表

Table 3 Probability distribution table of up-approximate degree表3 上近似度的概率分布表

Table 4 Nodes information table of up-approximation rough complex network表4 上近似粗糙復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)信息表

步驟5運(yùn)用時(shí)間序列分析法消除季節(jié)因素和不規(guī)則波動(dòng)的影響,確定每位明星顧客下一年購買和收藏總額的趨勢值。

Fig.3 Schematic diagram of Meizu Meilan buyers圖3 魅族魅藍(lán)的購買者示意圖

Table 5 Lixia1210 consumer records in nearly four years表5 lixia1210近4年的消費(fèi)記錄

根據(jù)時(shí)間序列分析法,計(jì)算b0和b1的公式為:

式中,Tt為t期時(shí)間序列的值;n為時(shí)期數(shù)。

得到顧客lixia1210的線性趨勢成分表達(dá)式為:

因此,顧客第5年的季度趨勢值見表6。

Table 6 Quarterly trend values of lixia1210 in the fifth year表6 顧客lixia1210第5年的季度趨勢值

步驟7由樣本數(shù)據(jù)庫sample database中所有滿足的顧客構(gòu)成潛在顧客集potential customers set。

本算例只是說明方法的有效性,在實(shí)際網(wǎng)絡(luò)中,數(shù)據(jù)的搜集必須得到平臺管理者的支持,然后通過計(jì)算機(jī)程序來實(shí)現(xiàn)知識發(fā)現(xiàn)方法的整個(gè)過程。算法的運(yùn)算復(fù)雜度由最大度搜索法、最短路徑搜索法、時(shí)間序列分析法、屬性約簡和決策規(guī)則的提取確定,近似為是上近似粗糙復(fù)雜網(wǎng)絡(luò)的度。

5 結(jié)論

第三方支付平臺的知識發(fā)現(xiàn)問題是一個(gè)錯(cuò)綜復(fù)雜的問題,由于平臺交易的客戶信息具有不完整性和冗余性,現(xiàn)有的研究還沒有給出一種有效的定量化的方法。通常情況下,管理者根據(jù)經(jīng)驗(yàn)和一些定性化的建議進(jìn)行決策,顯然增加了操作的盲目性,也增加了運(yùn)營成本。

本文構(gòu)建了第三方支付的粗糙復(fù)雜網(wǎng)絡(luò),定義了粗糙復(fù)雜網(wǎng)絡(luò)的上下近似度、度分布和度的概率主值,證明了第三方支付粗糙復(fù)雜網(wǎng)絡(luò)的上近似度和下近似度都服從冪律分布的結(jié)論,最后建立了第三方支付平臺客戶挖掘的知識發(fā)現(xiàn)模型,根據(jù)冪律分布網(wǎng)絡(luò)的特點(diǎn)給出了知識發(fā)現(xiàn)方法。仿真實(shí)例說明了本文的客戶挖掘方法是有效可行的。與現(xiàn)有運(yùn)營管理方式相比,本文的知識發(fā)現(xiàn)模型具有以下三方面的優(yōu)越性:(1)關(guān)鍵節(jié)點(diǎn)的選擇比隨機(jī)挑選度比較大的節(jié)點(diǎn)更加合理,關(guān)鍵節(jié)點(diǎn)考慮了節(jié)點(diǎn)的效益,同時(shí)也減少了操作的盲目性;(2)明星顧客的設(shè)置算法,運(yùn)用了粗糙集的屬性約簡和決策規(guī)則提取方法對數(shù)據(jù)進(jìn)行預(yù)處理,減少了搜索空間,提高了數(shù)據(jù)搜索的速度和結(jié)果的精確度;(3)運(yùn)用時(shí)間序列分析法找到潛在客戶,是經(jīng)過嚴(yán)格的數(shù)學(xué)推導(dǎo)的,科學(xué)可行,適應(yīng)了動(dòng)態(tài)知識系統(tǒng)更新的需求。因此,本文知識發(fā)現(xiàn)方法滿足了第三方支付平臺發(fā)展的需求,可以解決第三方支付平臺潛在客戶的挖掘問題。

References:

[1]Han Guohong.The third-party payment development in ten years:a literature review[J].Enterprise Economy,2012(388): 95-98.

[2]Zhao Shuo,Zhao Yang.Research of the third-party payment platform and Internet banking development issues[J].Journal of Commercial Economic,2015(11):81-82.

[3]Liao Yuping.Research of risk regulation and development on Internet financial in China—P2P platform,Balance Bao, third-party payment example[J].Economics and Management,2015,29(2):51-57.

[4]Zhu Shanhong,Kuang Tao.E-commerce model and platform based on the third-party[J].Journal of Chemical and Pharmaceutical Research,2014,6(3):863-868.

[5]Zhu Shanhong,Shi Qingmin.Research of third-party E-commerce risk and measures[J].Advanced Materials Research,2014, 926-930:3882-3885.

[6]Yang Ling,Shuai Qinghong.Profitability analysis of the thirdparty Internet payment platform[J].Computer Application Research,2014,31(3):773-775.

[7]Li Beiwei,Zhang Xinqi,Wang Ya,et al.Information ecosystem analysis of our third-party electronic trading platform—based on the perspective of complex networks[J].Information Science,2014,32(7):78-82.

[8]Duan Wenqi.Scale of critical users of third-party e-commerce platform based on a complex network[J].China Management Science,2014,22(12):93-101.

[9]Wang Xiaofan.Research on network scientific development [J].Control Science and Engineering,2014:111-118.

[10]Zhang Chunying,Guo Jingfeng.Rough property graph model and application of Web social networks[J].Computer Engineering and Science,2014,36(3):517-523.

[11]Zhang Chunying.Social network based on attribute figure modeling and theoretical studies of situation analysis[D]. Qinhuangdao:Yanshan University,2013:17-30.

[12]Ye Lisha,Wang Xuedong,Fang Jin.Research of network information resources knowledge discovery mechanism[J]. Modern Information,2014,34(8):160-163.

[13]An Haizhong,Zheng Lian,Wang Guangxiang.Situation and prospects for rough sets knowledge discovery[J].Computer Measurement&Control,2003,11(2):81-83.

[14]Zhao Xiaolin,Hao Gang,Hu Changzhen,et al.A discovery method of the dirty data transmission path based on complex network[J].Applied Mechanics and Materials,2014,651-653:1741-1747.

[15]Ferretti S.Gossiping for resource discovering:an analysis based on complex network theory[J].Future Generation Computer Systems,2013,29(6):1631-1644.

[16]Azadeh A,Saberi M,Jiryaei Z.An intelligent decision support system for forecasting and optimization of complex personnel attributes in a large bank[J].Expert Systems with Applications,2012,39(16):12358-12370.

[17]Bell L,Chowdhary R,Liu J S,et al.Integrated bio-entity network:a system for biological knowledge discovery[J].PLoS ONE,2011,6(6):e21474.

[18]Baurley J W,Conti D V,Gauderman W J,et al.Discovery of complex pathways from observational data[J].Statistics in Medicine,2010,29(19):1998-2011.

[19]Zhou Xuezhong,Chen Shibo,Liu Baoyan,et al.Development of traditional Chinese medicine clinical data warehouse for medical knowledge discovery and decision support[J].Artificial Intelligence in Medicine,2010,48(2/3):139-152.

[20]Vicient C,MorenoA.Unsupervised topic discovery in microblogging networks[J].Expert Systems with Applications,2015, 42(17/18):6472-6485.

[21]Guo Shize,Lu Zheming.Basic theory of complex networks [M].Beijing:Science Press,2012:43-45.

[22]Zhang Wenxiu,Wu Weizhi,Liang Jiye,et al.Rough set theory and methods[M].Beijing:Science Press,2001:3-10.

[23]Liu Jinlan.Management statistics[M].Tianjin:Tianjin University Press,2011:150-157.

附中文參考文獻(xiàn):

[1]韓國紅.第三方支付發(fā)展的十年回顧:一個(gè)文獻(xiàn)綜述[J].企業(yè)經(jīng)濟(jì),2012(388):95-98.

[2]趙爍,趙楊.第三方支付平臺以及互聯(lián)網(wǎng)金融發(fā)展問題研究[J].商業(yè)經(jīng)濟(jì)研究,2015(11):81-82.

[3]廖愉平.我國互聯(lián)網(wǎng)金融發(fā)展及其風(fēng)險(xiǎn)監(jiān)管研究——以P2P平臺、余額寶、第三方支付為例[J].經(jīng)濟(jì)與管理,2015, 29(2):51-57.

[6]楊玲,帥青紅.第三方互聯(lián)網(wǎng)支付平臺的盈利分析[J].計(jì)算機(jī)應(yīng)用研究,2014,31(3):773-775.

[7]李北偉,張鑫琦,王亞,等.我國第三方電子交易平臺信息生態(tài)系統(tǒng)特性分析——基于復(fù)雜網(wǎng)絡(luò)的視角[J].情報(bào)科學(xué),2014,32(7):78-82.

[8]段文奇.基于復(fù)雜網(wǎng)絡(luò)的第三方電子商務(wù)平臺臨界用戶規(guī)模研究[J].中國管理科學(xué),2014,22(12):93-101.

[9]汪小帆.網(wǎng)絡(luò)科學(xué)發(fā)展研究[J].控制科學(xué)與工程,2014: 111-118.

[10]張春英,郭景峰.Web社會(huì)網(wǎng)絡(luò)的粗糙屬性圖模型及應(yīng)用[J].計(jì)算機(jī)工程與科學(xué),2014,36(3):517-523.

[11]張春英.基于屬性圖的社交網(wǎng)絡(luò)建模與態(tài)勢分析理論研究[D].秦皇島:燕山大學(xué),2013:17-30.

[12]葉麗莎,王學(xué)東,方婧.網(wǎng)絡(luò)信息資源知識發(fā)現(xiàn)機(jī)理研究[J].現(xiàn)代情報(bào),2014,34(8):160-163.

[13]安海忠,鄭鏈,王廣祥.粗糙集知識發(fā)現(xiàn)的研究現(xiàn)狀和展望[J].計(jì)算機(jī)測量與控制,2003,11(2):81-83.

[21]郭世澤,陸哲明.復(fù)雜網(wǎng)絡(luò)基礎(chǔ)理論[M].北京:科學(xué)出版社,2012:43-45.

[22]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001:3-10.

[23]劉金蘭.管理統(tǒng)計(jì)學(xué)[M].天津:天津大學(xué)出版社,2011: 150-157.

CAO Lixia was born in 1971.She is a Ph.D.candidate at School of Management,Xi’an University of Architecture and Technology,and an associate professor at Xi’an Technological University.Her research interests include rough set,complex networks,operation research and cybernetics,management decision analysis and game theory,etc.

曹黎俠(1971—),女,陜西西安人,西安建筑科技大學(xué)管理學(xué)院博士研究生,西安工業(yè)大學(xué)副教授,主要研究領(lǐng)域?yàn)榇植诩?,?fù)雜網(wǎng)絡(luò),運(yùn)籌學(xué)與控制論,管理決策分析及博弈論等。

HUANG Guangqiu was born in 1964.He is a professor and Ph.D.supervisor at School of Management,Xi’an University of Architecture and Technology,the consultant expert of the Government of Xi’an and the assessment expert of National Natural Science Foundation.His research interests include e-business and network security, information management,systems engineering,complex system simulation and control,decision optimization and management,etc.

黃光球(1964—),男,西安建筑科技大學(xué)管理學(xué)院教授、博士生導(dǎo)師,西安市專家咨詢團(tuán)特聘專家,國家自然科學(xué)基金項(xiàng)目評審專家,教育部博士點(diǎn)基金項(xiàng)目評審專家,管理科學(xué)與工程以及計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域權(quán)威期刊審稿專家,主要研究領(lǐng)域?yàn)殡娮由虅?wù)與網(wǎng)絡(luò)安全,信息管理,系統(tǒng)工程,復(fù)雜系統(tǒng)仿真與控制,決策優(yōu)化與管理等。

LI Yan was born in 1984.He is a Ph.D.candidate at School of Management,Xi’an University of Architecture and Technology.His research interests include information confrontation,network security and systems engineering,etc.

李艷(1984—),男,蒙古族,河北承德人,西安建筑科技大學(xué)管理學(xué)院博士研究生,主要研究領(lǐng)域?yàn)樾畔梗W(wǎng)絡(luò)安全,系統(tǒng)工程等。

*The Natural Science Basic Research Program(Key)of Shaanxi Province under Grant No.2015JZ010(陜西省自然科學(xué)基礎(chǔ)研究計(jì)劃(重點(diǎn)));the Decision-Making Advisory Issue of Xi?an Science&Technology Association under Grant No.201517(西安市科協(xié)決策咨詢課題);the Social Science Fund Project of Shaanxi Province under Grant No.2014P07(陜西省社會(huì)科學(xué)基金項(xiàng)目);the Science Plan Project of Education Department of Shaanxi Province under Grant No.16JK1369(陜西省教育廳科學(xué)計(jì)劃研究項(xiàng)目).

Received 2015-12,Accepted 2016-02.

CNKI網(wǎng)絡(luò)優(yōu)先出版:2016-02-03,http://www.cnki.net/kcms/detail/11.5602.TP.20160203.1126.006.html

文獻(xiàn)標(biāo)志碼:A

中圖分類號:TP182;N945.12

doi:10.3778/j.issn.1673-9418.1512036

Research on the Third-Party Payment Rough Complex Networks Knowledge Discovery Methods*

CAO Lixia1,2+,HUANG Guangqiu1,LI Yan1
1.College of Management,Xi?an University ofArchitecture and Technology,Xi?an 710055,China
2.College of Science,Xi?an Technological University,Xi?an 710032,China
+Corresponding author:E-mail:caolx_8@163.com

Abstract:Sustainable development of the third-party payment platform is a very complex problem,the key of problem is the mining of potential customers in trading platform.This paper establishes the third-party payment rough complex networks,defines rough approximation degree,the probability principal value of complex networks and degree distribution,constructs a rough model of knowledge discovery,and gives a method based on rough set theory for knowledge discovery.The research on rough complex networks knowledge discovery method provides a quantitative and actionable method,which can solve the potential customers mining issues of the rough complex networks.This paper presents the concepts of rough complex networks,as well as degree distribution of the third-party payment rough complex networks,which lay the theoretical foundation for the third-party payment issues.The research on knowledge discovery method adapts to the needs of dynamic knowledge system updates,so there is a broad application prospect.

Key words:the third-party payment;rough complex networks;time series analysis;knowledge discovery

猜你喜歡
時(shí)間序列分析第三方支付
基于R軟件的金融時(shí)間序列的預(yù)測分析
淺析我國互聯(lián)網(wǎng)金融的發(fā)展與影響
第三方支付風(fēng)險(xiǎn)管理研究
商情(2016年40期)2016-11-28 10:34:16
論互聯(lián)網(wǎng)金融創(chuàng)新
淮北市生態(tài)足跡動(dòng)態(tài)演變分析
第三方支付平臺對國有商業(yè)銀行業(yè)務(wù)的影響
論我國互聯(lián)網(wǎng)金融的發(fā)展現(xiàn)狀與前景
微信公眾號未來發(fā)展態(tài)勢的實(shí)證預(yù)測
中國記者(2016年1期)2016-03-03 18:08:02
基于MATLAB的時(shí)間序列預(yù)測
中國石化產(chǎn)業(yè)產(chǎn)能過剩測度及預(yù)警
灌南县| 玉树县| 兖州市| 大厂| 乌审旗| 贵德县| 库尔勒市| 巨鹿县| 高雄县| 碌曲县| 原平市| 云南省| 漯河市| 久治县| 灵石县| 东莞市| 桃园市| 山东省| 贡觉县| 措美县| 曲麻莱县| 若羌县| 铜山县| 鞍山市| 广西| 望谟县| 长顺县| 吴川市| 兰西县| 南郑县| 龙门县| 宿松县| 历史| 米易县| 盖州市| 什邡市| 凌海市| 建宁县| 靖西县| 临桂县| 织金县|