張光前,白 雪
大連理工大學(xué) 管理與經(jīng)濟(jì)學(xué)部,遼寧 大連116024
電子商務(wù)推薦(系統(tǒng))在緩解商品信息過(guò)載、提高消費(fèi)者個(gè)性化體驗(yàn)和銷(xiāo)售轉(zhuǎn)化率等方面發(fā)揮著不可替代的作用[1],如Amazon 宣稱(chēng)推薦系統(tǒng)提高了其30%的銷(xiāo)售額[2]。但隨著電子商務(wù)的發(fā)展,電子商務(wù)推薦面臨兩方面的變化:①商品日益豐富,沒(méi)有被購(gòu)買(mǎi)甚至被瀏覽過(guò)的“新商品”越來(lái)越多;②消費(fèi)個(gè)性日益凸顯,消費(fèi)內(nèi)容和消費(fèi)形式都在快速變化。這些變化導(dǎo)致推薦系統(tǒng)難以給出令消費(fèi)者滿(mǎn)意的推薦結(jié)果[3],從而造成“新商品”推薦問(wèn)題。這里的新商品是從消費(fèi)者視角出發(fā)的,即對(duì)某個(gè)消費(fèi)者而言沒(méi)有被其購(gòu)買(mǎi)過(guò)的商品即為新商品。
目前,電子商務(wù)推薦的思路主要是基于各種相關(guān)關(guān)系進(jìn)行推薦,如基于商品之間的關(guān)系、消費(fèi)者之間的關(guān)系、消費(fèi)者與商品之間的關(guān)系進(jìn)行推薦等。當(dāng)面對(duì)新商品時(shí),這些相關(guān)關(guān)系沒(méi)有了或變得很少,導(dǎo)致難以對(duì)新商品做出恰當(dāng)推薦。由于導(dǎo)致新商品推薦問(wèn)題的癥結(jié)在于缺乏消費(fèi)者與新商品之間的聯(lián)系,如果能夠找到面對(duì)新商品時(shí)仍然成立的深層次關(guān)系,那么新商品推薦問(wèn)題就可能得到解決,至少會(huì)有所緩解。消費(fèi)心理學(xué)研究表明,消費(fèi)者的行為(含選擇商品)是由其內(nèi)在消費(fèi)心理決定的,且消費(fèi)心理具有穩(wěn)定性,說(shuō)明即使在面對(duì)新商品時(shí),成熟消費(fèi)者的消費(fèi)心理也基本沒(méi)有變化,而消費(fèi)內(nèi)容和形式的改變是外在的變化,也是由消費(fèi)心理決定的。因此,若能基于用戶(hù)消費(fèi)心理進(jìn)行推薦,則推薦所依賴(lài)的關(guān)系是深層而穩(wěn)定的因果關(guān)系,就有可能解決新商品推薦問(wèn)題。
實(shí)現(xiàn)這一想法需要解決兩個(gè)基本問(wèn)題,一是如何從消費(fèi)者的消費(fèi)記錄中分析出其消費(fèi)心理,二是如何根據(jù)消費(fèi)者消費(fèi)心理實(shí)現(xiàn)新商品推薦。為此,本研究根據(jù)消費(fèi)心理學(xué)中關(guān)于消費(fèi)性格的論述,以貝葉斯網(wǎng)絡(luò)為基本方法,建立消費(fèi)者購(gòu)物記錄與其消費(fèi)性格間的聯(lián)系,并據(jù)此實(shí)現(xiàn)基于消費(fèi)性格的新商品推薦。
分析推薦效果的研究表明,單純根據(jù)消費(fèi)者歷史消費(fèi)記錄進(jìn)行推薦會(huì)造成少數(shù)商品多次被推薦,而沒(méi)有被瀏覽或購(gòu)買(mǎi)過(guò)的新商品根本無(wú)法被推薦[4],導(dǎo)致電子商務(wù)推薦的實(shí)際作用有限。
由于新商品缺乏與消費(fèi)者、消費(fèi)者的朋友以及他們購(gòu)買(mǎi)或?yàn)g覽過(guò)商品之間的聯(lián)系,使現(xiàn)有協(xié)同過(guò)濾推薦、基于內(nèi)容過(guò)濾推薦等基于關(guān)系進(jìn)行推薦的方法缺乏必要的信息,無(wú)法做出合適的推薦。隨著電子商務(wù)的發(fā)展,新商品推薦問(wèn)題已經(jīng)無(wú)法回避。目前,對(duì)新商品推薦的研究通常與電子商務(wù)推薦的評(píng)價(jià)標(biāo)準(zhǔn)聯(lián)系在一起?,F(xiàn)有的評(píng)價(jià)標(biāo)準(zhǔn)可分為兩類(lèi):一類(lèi)是技術(shù)性標(biāo)準(zhǔn),主要用于衡量推薦方法的推薦精度和計(jì)算復(fù)雜性等性能指標(biāo)[5];另一類(lèi)是商務(wù)性標(biāo)準(zhǔn),如希望推薦結(jié)果達(dá)到新穎性、驚喜性和多樣性等標(biāo)準(zhǔn)[6]。這些標(biāo)準(zhǔn)反映了對(duì)個(gè)性化推薦服務(wù)的各種要求。
與新商品推薦相關(guān)的是商務(wù)性標(biāo)準(zhǔn)中的新穎性、驚喜性、多樣性3個(gè)指標(biāo)。①新穎性,指推薦消費(fèi)者不知道的商品,通常是在過(guò)濾掉消費(fèi)者購(gòu)買(mǎi)或?yàn)g覽過(guò)的商品基礎(chǔ)上進(jìn)行推薦,或者在與購(gòu)物記錄相關(guān)的商品中選擇消費(fèi)者不熟悉的,或者推薦不流行的商品,但這些做法對(duì)消費(fèi)者來(lái)說(shuō)無(wú)法保證是有用的[7]。②驚喜性,即意外發(fā)現(xiàn)新奇、有價(jià)值的事物的運(yùn)氣,指推薦結(jié)果獲得令人驚訝的成功。這個(gè)指標(biāo)強(qiáng)調(diào)一定要有新的內(nèi)容出現(xiàn)[8],通常是對(duì)帶有相同內(nèi)容標(biāo)記的商品不予推薦,而推薦與消費(fèi)者偏好距離較遠(yuǎn)的商品。但推薦結(jié)果是對(duì)自然預(yù)測(cè)的偏離,消費(fèi)者可能會(huì)試探該推薦結(jié)果,但如果發(fā)現(xiàn)推薦結(jié)果無(wú)用反而會(huì)棄用電子商務(wù)推薦系統(tǒng)。③多樣性,通常選擇與消費(fèi)者以前購(gòu)買(mǎi)的商品不相似的商品來(lái)推薦,但代價(jià)是犧牲準(zhǔn)確性,且結(jié)果可能是無(wú)用的[9]。
可見(jiàn),上述做法都是采用一種故意避開(kāi)與消費(fèi)者購(gòu)物記錄相近的商品,通過(guò)隨機(jī)選擇的方式推薦新商品,是為了達(dá)到商務(wù)性標(biāo)準(zhǔn)而采用的應(yīng)對(duì)措施,不但無(wú)法保證甚至無(wú)法解釋推薦結(jié)果具有合理性,而且還會(huì)犧牲掉電子商務(wù)推薦系統(tǒng)應(yīng)該具有的基本性能,如準(zhǔn)確性等。
消費(fèi)心理研究是在心理科學(xué)理論指導(dǎo)下,研究人們?cè)谙M(fèi)活動(dòng)中的行為和心理,以觀(guān)察和實(shí)驗(yàn)為獲取數(shù)據(jù)的基本手段,以統(tǒng)計(jì)分析為基本數(shù)據(jù)分析工具,通過(guò)對(duì)消費(fèi)者外在行為的理性分析,把握消費(fèi)習(xí)慣、消費(fèi)方式和消費(fèi)結(jié)構(gòu)產(chǎn)生的內(nèi)在心理基礎(chǔ)及其發(fā)展變化規(guī)律[10]。
消費(fèi)心理的基本規(guī)律是消費(fèi)心理是內(nèi)在且穩(wěn)定的,消費(fèi)行為是消費(fèi)心理的外在表現(xiàn),消費(fèi)心理決定消費(fèi)行為。現(xiàn)階段的消費(fèi)心理研究已經(jīng)揭示了消費(fèi)者在個(gè)性心理特征和消費(fèi)傾向等消費(fèi)心理方面的一般規(guī)律,明確了消費(fèi)心理包括消費(fèi)態(tài)度、需要、動(dòng)機(jī)、消費(fèi)者氣質(zhì)、消費(fèi)技能和消費(fèi)能力等多個(gè)方面[11]。消費(fèi)心理方面的規(guī)律多是一種統(tǒng)計(jì)規(guī)律,且這些規(guī)律通常表現(xiàn)為定性的論述。消費(fèi)者的行為表現(xiàn)與其消費(fèi)心理之間常常是一因多果、一果多因、多因多果等情況,多種因素相互作用和影響。因此,從外在表現(xiàn)定位內(nèi)在心理有一定難度。
對(duì)電子商務(wù)推薦來(lái)說(shuō),消費(fèi)心理方面的理論是理解和把握消費(fèi)者行為的領(lǐng)域知識(shí),引入消費(fèi)心理理論會(huì)極大增加電子商務(wù)推薦方法的理論基礎(chǔ)。當(dāng)然,若把消費(fèi)心理因素引入到新商品推薦方法中,必須解決如何根據(jù)以定性論述為主的消費(fèi)心理學(xué)理論對(duì)具體消費(fèi)者的消費(fèi)心理進(jìn)行定量的分析和應(yīng)用。
性格是人的個(gè)性中最重要、最顯著的個(gè)性心理特征,消費(fèi)性格是個(gè)人在消費(fèi)方面穩(wěn)定的態(tài)度和習(xí)慣的行為方式,是決定消費(fèi)行為的重要因素。通常,有什么樣的消費(fèi)性格則有相應(yīng)的消費(fèi)行為[11]。盡管消費(fèi)性格是決定消費(fèi)行為的一個(gè)重要原因,但消費(fèi)性格有不同類(lèi)型甚至混合型,其外在表現(xiàn)與具體消費(fèi)性格之間通常是多因多果關(guān)系。根據(jù)購(gòu)物記錄分析其消費(fèi)性格,是根據(jù)外在表現(xiàn)確定內(nèi)在心理,是由果溯因的過(guò)程,可以看做是確定條件概率的過(guò)程。為此,選用貝葉斯網(wǎng)絡(luò)作為工具推斷消費(fèi)性格。貝葉斯網(wǎng)絡(luò)是一種自然表示因果信息的方法,在設(shè)備故障診斷和模式識(shí)別等很多方面都有成功的應(yīng)用。
按照消費(fèi)態(tài)度的不同,消費(fèi)性格分為經(jīng)濟(jì)型、自由型、保守型、順應(yīng)型、怪僻型5種類(lèi)型。根據(jù)公認(rèn)的成熟的、關(guān)于消費(fèi)性格的論述,把各種消費(fèi)性格類(lèi)型及其表現(xiàn)進(jìn)行總結(jié),結(jié)果見(jiàn)表1。
由表1 可知,不同的消費(fèi)性格在消費(fèi)態(tài)度、行為方式和關(guān)注點(diǎn)方面有明顯差別,對(duì)消費(fèi)性格的論述是整理實(shí)際的購(gòu)物記錄并建立消費(fèi)心理及其外在表現(xiàn)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)時(shí)的理論依據(jù)及指導(dǎo)原則。
購(gòu)物記錄如實(shí)地記錄了消費(fèi)者在電子商務(wù)網(wǎng)站上的消費(fèi)行為,這些數(shù)據(jù)現(xiàn)實(shí)可得且與消費(fèi)選擇密切相關(guān),是分析消費(fèi)者消費(fèi)性格的理想素材。貝葉斯網(wǎng)絡(luò)使用的變量是離散型的,需要對(duì)購(gòu)物記錄中數(shù)值型變量進(jìn)行離散化處理。變量的含義、來(lái)源和處理說(shuō)明見(jiàn)表2,其中消費(fèi)性格是類(lèi)別變量,其余變量均為屬性變量。
應(yīng)用貝葉斯網(wǎng)絡(luò)進(jìn)行消費(fèi)性格分析就是根據(jù)某消費(fèi)者的歷史數(shù)據(jù)進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí),學(xué)習(xí)結(jié)果表明了該消費(fèi)者的消費(fèi)性格。在貝葉斯網(wǎng)絡(luò)學(xué)習(xí)方法中,由Cooper等[28]提出的K2 結(jié)構(gòu)學(xué)習(xí)算法以高效、準(zhǔn)確而著稱(chēng),本研究采用K2 算法和互信息相結(jié)合的方式進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí),根據(jù)評(píng)分函數(shù)選擇最優(yōu)模型,用貝葉斯估計(jì)進(jìn)行參數(shù)學(xué)習(xí)。具體學(xué)習(xí)過(guò)程描述如下。
表2 商品變量離散化處理Table 2 Discretization of the Variables of Commodities Variables
(1)引入條件互信息計(jì)算屬性變量之間的依賴(lài)關(guān)系,以確定K2 算法的輸入順序。根據(jù)消費(fèi)者瀏覽記錄,計(jì)算每對(duì)屬性變量Xi與Xj之間的條件互信息I(Xi;Xj|Ck),即
其中,Xi、Xj和C均為隨機(jī)變量,P為概率,xi、xj和ck為樣本中某件商品在對(duì)應(yīng)的隨機(jī)變量上的取值,i和j為對(duì)應(yīng)的具體屬性編號(hào),k 為對(duì)應(yīng)的具體消費(fèi)性格類(lèi)型。
(2)以屬性變量間的條件互信息I(Xi;Xj|C)作為權(quán)重,根據(jù)權(quán)重大小將屬性變量X1,X2,…,X9排序,并把類(lèi)別變量C 排在序列的首位,得到一組基于因果關(guān)系的變量序列{C,Y1,Y2,…,Y9},作為節(jié)點(diǎn)輸入順序,設(shè)Y ={y1,y2,…,y9}。
(3)初始化一個(gè)空網(wǎng)絡(luò),根據(jù)預(yù)先設(shè)定的節(jié)點(diǎn)輸入順序,利用網(wǎng)絡(luò)結(jié)構(gòu)評(píng)分公式(2)式和(3)式,依次為每一個(gè)節(jié)點(diǎn)添加合適的父節(jié)點(diǎn),父節(jié)點(diǎn)只能在該節(jié)點(diǎn)順序之前的節(jié)點(diǎn)集合中選取,使(2)式的概率值最高。
其中,D 為實(shí)例數(shù)據(jù);Bs為網(wǎng)絡(luò)結(jié)構(gòu);yl為Y 中各變量的取值;v(yl)為yl父節(jié)點(diǎn)的取值,即概率大小;h為該節(jié)點(diǎn)的父節(jié)點(diǎn)個(gè)數(shù);Γ()為Γ 函數(shù);?lhg為yl第g個(gè) 狀態(tài),?lh=∑?lhg;Nlhg為v(yl)的第g個(gè)狀態(tài),Nlh=∑Nlhg。
(4)根據(jù)評(píng)分公式得到一個(gè)分值最高的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)和此時(shí)各節(jié)點(diǎn)的條件概率分布表。學(xué)習(xí)類(lèi)別節(jié)點(diǎn)C的概率分布為P(Ck),該概率分布表示分析對(duì)象的消費(fèi)性格情況,概率值大的類(lèi)別表示該消費(fèi)者的主導(dǎo)消費(fèi)性格。
從電子商務(wù)推薦角度,基于消費(fèi)性格的新商品推薦是在已知某消費(fèi)者的消費(fèi)性格的情況下,當(dāng)有新商品到來(lái)時(shí),判斷是否向其推薦這一商品。落實(shí)到貝葉斯網(wǎng)絡(luò)則是一個(gè)后驗(yàn)概率問(wèn)題,即在知道了已存在的貝葉斯網(wǎng)絡(luò)中各種屬性之間組織關(guān)系的情況下,當(dāng)有新的觀(guān)察數(shù)據(jù)到來(lái)時(shí),分析網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)變化情況。在后驗(yàn)概率推理中,在已知從消費(fèi)者購(gòu)物記錄的學(xué)習(xí)中得到貝葉斯網(wǎng)絡(luò)中各節(jié)點(diǎn)的取值情況下,把新商品作為證據(jù)變量,把用戶(hù)的消費(fèi)性格作為查詢(xún)變量,通過(guò)近似推理,可以在已知完整的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖和節(jié)點(diǎn)的概率分布表的條件下,求出該消費(fèi)者在新商品條件下的消費(fèi)性格。
若新商品條件下消費(fèi)者的消費(fèi)性格與從購(gòu)物記錄得到的消費(fèi)性格之間無(wú)本質(zhì)差別,則認(rèn)為該新商品符合該用戶(hù)消費(fèi)性格,則向用戶(hù)推薦該商品,否則不向用戶(hù)做此推薦。這樣就以是否符合用戶(hù)的消費(fèi)性格作為是否推薦的判定標(biāo)準(zhǔn),實(shí)現(xiàn)對(duì)新商品的合理推薦。
根據(jù)存在的貝葉斯網(wǎng)絡(luò)圖(記為S),先對(duì)(新)商品的屬性進(jìn)行離散化處理,然后作為已知節(jié)點(diǎn)的輸入,通過(guò)貝葉斯網(wǎng)絡(luò)推理查詢(xún)“消費(fèi)性格”的后驗(yàn)概率分布,后驗(yàn)概率分布反映出在該新商品條件下該消費(fèi)性格。對(duì)已經(jīng)建立的網(wǎng)絡(luò)圖S,類(lèi)別變量“消費(fèi)性格”的概率分布為P(Ck),概率數(shù)值的大小表示屬于該種性格類(lèi)型可能性的大小。依照概率大小對(duì)性格類(lèi)型排序,選擇排序靠前的作為衡量指標(biāo)M(可能不止一個(gè)指標(biāo)),M 即為主導(dǎo)消費(fèi)性格,對(duì)應(yīng)的概率值作為閾值εM??赡艽嬖诙鄠€(gè)閾值,選擇所有在衡量指標(biāo)M的概率均高于閾值εM的商品作為推薦對(duì)象。這時(shí)該推薦方法的輸入為新商品屬性、貝葉斯網(wǎng)絡(luò)圖S,輸出為消費(fèi)性格概率P(Ck)、新商品是否進(jìn)行推薦的判定。
貝葉斯網(wǎng)絡(luò)推理過(guò)程較為復(fù)雜,由于推薦時(shí)對(duì)計(jì)算精度要求不高,故采用性能較好的、廣為應(yīng)用的連接樹(shù)近似推理算法。具體步驟如下。
(1)任意選取網(wǎng)上用戶(hù)未購(gòu)買(mǎi)過(guò)的商品,對(duì)商品屬性進(jìn)行處理,使所有的屬性變量均為離散型,并構(gòu)成商品屬性變量集合,記為A,A ={X1,X2,…,X9}。
(2)依據(jù)P(Ck)的取值進(jìn)行累計(jì)處理,把概率取值P(Ck)較大的確定為該消費(fèi)者的消費(fèi)性格閾值,記為εM,相應(yīng)的消費(fèi)性格類(lèi)型記為衡量指標(biāo)M。
(3)根據(jù)已經(jīng)存在的網(wǎng)絡(luò)圖,選擇聯(lián)合樹(shù)算法,由網(wǎng)絡(luò)結(jié)構(gòu)圖生成Moral 圖,通過(guò)無(wú)向圖三角化和量化處理,獲得處于平衡狀態(tài)的聯(lián)合樹(shù)。
(4)把新商品的屬性變量集合A 作為證據(jù)變量輸入,設(shè)定查詢(xún)變量為“消費(fèi)性格”,最終通過(guò)消息傳遞使聯(lián)合樹(shù)達(dá)到平衡。
(5)利用貝葉斯公式求解變量“消費(fèi)性格”的后驗(yàn)概率分布P(C| A),概率值記為Fk。
(6)在衡量指標(biāo)M上,比較εM與Fk的取值,若所有Fk>εM,則把該商品作為推薦的對(duì)象。
上述新商品推薦方法包括兩個(gè)部分,先通過(guò)歷史記錄分析某消費(fèi)者的消費(fèi)性格,在此基礎(chǔ)上判斷當(dāng)有新商品到來(lái)時(shí)是否向該消費(fèi)者推薦,二者是一個(gè)有機(jī)的整體,一起構(gòu)成完整的基于消費(fèi)性格的新商品推薦方法。下面采用實(shí)際數(shù)據(jù)驗(yàn)證和分析該方法的可行性和合理性。
電子商務(wù)推薦是一種個(gè)性化的信息服務(wù),首先以某個(gè)消費(fèi)者(甲)為研究對(duì)象,根據(jù)其個(gè)人在淘寶網(wǎng)上的購(gòu)物記錄,只使用甲購(gòu)買(mǎi)商品的信息,不涉及姓名、性別和年齡等隱私信息。記錄時(shí)間為2013年3月至2014年3月,對(duì)該數(shù)據(jù)樣本中商品屬性值按表2規(guī)則進(jìn)行離散化處理,可以得到貝葉斯網(wǎng)絡(luò)建立的訓(xùn)練集。新商品集合是選取甲未購(gòu)買(mǎi)過(guò)的10種網(wǎng)上商品,對(duì)其屬性進(jìn)行離散化處理,作為推理時(shí)的證據(jù)變量。
采用Matlab 軟件中的BNT 工具箱進(jìn)行輔助編程,并結(jié)合互信息進(jìn)行貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)和推理。
(1)確定K2 算法的節(jié)點(diǎn)輸入順序。根據(jù)前述的消費(fèi)性格分析步驟,計(jì)算條件互信息對(duì)稱(chēng)矩陣(僅寫(xiě)出上三角部分),計(jì)算結(jié)果見(jiàn)表3。
表3的數(shù)據(jù)表示兩個(gè)隨機(jī)變量間存在的統(tǒng)計(jì)依賴(lài)關(guān)系的大小,如第3 行第4 列的值為0.032,說(shuō)明變量X2與X3的依賴(lài)程度為0.032;第2行第4列的值為0.061,即X1與X3的依賴(lài)程度為0.061;比較兩個(gè)數(shù)值,認(rèn)為X2與X3的聯(lián)系程度不如X1與X3的聯(lián)系程度緊密。
根據(jù)表3 確定變量輸入節(jié)點(diǎn)順序,并把類(lèi)別變量C(消費(fèi)性格)加在最開(kāi)始的位置,確定最后的輸入順序?yàn)閛rder =[C,X4,X6,X3,X9,X8,X5,X7,X2,X1]。
表3 條件互信息矩陣Table 3 Matirx of Conditional Mutual Information
(2)獲得網(wǎng)絡(luò)結(jié)構(gòu)圖,通過(guò)對(duì)輸入數(shù)據(jù)的學(xué)習(xí)得到貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖,見(jiàn)圖1,箭頭方向?yàn)閺母腹?jié)點(diǎn)到子節(jié)點(diǎn)。
圖1 基于甲的購(gòu)物記錄得到的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)Figure 1 Bayesian Network Based on a Consumer′ Purchasing Data
由圖1 可知,與節(jié)點(diǎn)10 直接相連的節(jié) 點(diǎn)是2、3、7、9,故認(rèn)為該網(wǎng)絡(luò)用戶(hù)在瀏覽購(gòu)物時(shí)關(guān)注的商品屬性是折扣、質(zhì)量、銷(xiāo)量和評(píng)價(jià),對(duì)其他商品屬性關(guān)注度不大,但仍存在間接聯(lián)系。
(3)參數(shù)分布學(xué)習(xí)。通過(guò)參數(shù)學(xué)習(xí)可得到所有節(jié)點(diǎn)的條件概率表,它反映了樣本數(shù)據(jù)學(xué)習(xí)后的變量之間的依賴(lài)程度大?。?0]。每個(gè)節(jié)點(diǎn)都擁有一條件概率表,它定量地刻畫(huà)了其父節(jié)點(diǎn)對(duì)該節(jié)點(diǎn)的影響。以節(jié)點(diǎn)9的條件概率表為例,由圖1 可知,節(jié)點(diǎn)9的父節(jié)點(diǎn)是節(jié)點(diǎn)3 和節(jié)點(diǎn)10,那么節(jié)點(diǎn)9 受到節(jié)點(diǎn)3 和節(jié)點(diǎn)10的直接影響。節(jié)點(diǎn)9的條件概率分布見(jiàn)表4。
表4 中父節(jié)點(diǎn)X3(質(zhì)量)一欄對(duì)應(yīng)的是質(zhì)量這個(gè)屬性的具體取值,離散化的取值為一般和優(yōu)良兩類(lèi);父節(jié)點(diǎn)X10(消費(fèi)性格)一欄對(duì)應(yīng)的是消費(fèi)性格的具體類(lèi)型。以表4 中第2 行為例,該行表示若商品質(zhì)量為一般且消費(fèi)性格為經(jīng)濟(jì)型,則評(píng)價(jià)結(jié)果是差的概率為0.794,評(píng)價(jià)為好的概率為0.206。
表4 節(jié)點(diǎn)9的條件概率表Table 4 Conditional Probability Table of Node 9
(4)消費(fèi)性格類(lèi)型的學(xué)習(xí)。通過(guò)貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)得到甲的消費(fèi)性格概率分布,見(jiàn)表5。
表5 甲的消費(fèi)性格概率分布Table 5 Probability Distribution of the Consuming Personalities
表6 新商品推薦結(jié)果Table 6 Results of Recommendation of New Commodities
由表5 性格類(lèi)型的取值概率可知,消費(fèi)者甲的消費(fèi)性格并不單一,各種類(lèi)型所占比例各不相同。概率數(shù)值越大,表示對(duì)應(yīng)性格類(lèi)型在甲的性格中所占比例越大。甲的消費(fèi)性格表現(xiàn)出混合型的特點(diǎn),經(jīng)濟(jì)型和自由型所占的比例將近六成,可看做是“經(jīng)濟(jì)+ 自由”型是甲的主導(dǎo)消費(fèi)性格,這幾種消費(fèi)性格類(lèi)型表現(xiàn)為經(jīng)濟(jì)型>自由型>順應(yīng)型>保守型>怪僻型。
(5)消費(fèi)性格閾值確定。為了根據(jù)消費(fèi)性格判別某新商品是否值得向其推薦,需要設(shè)定判定新商品與消費(fèi)性格符合時(shí)的閾值。采用的方式為:把得到的性格類(lèi)型按照概率值降序排列,由于前兩個(gè)類(lèi)型已經(jīng)占到約六成,所以選取前兩個(gè)類(lèi)型的概率值作為閾值ε,可以得到ε1=0.337,ε2=0.249。
(6)新商品推薦。新商品推薦對(duì)應(yīng)的貝葉斯網(wǎng)絡(luò)的推理,推理的節(jié)點(diǎn)確定為消費(fèi)性格,選取的已知證據(jù)節(jié)點(diǎn)為X1、X2、X3、X4、X5、X6、X7、X8、X9。通過(guò)聯(lián)合樹(shù)推理引擎,得到消費(fèi)性格的后驗(yàn)概率。
選取該消費(fèi)者從未購(gòu)買(mǎi)過(guò)的10種商品,對(duì)其商品屬性進(jìn)行離散化處理,使用學(xué)習(xí)好的貝葉斯網(wǎng)絡(luò)進(jìn)行推理,得到其推薦結(jié)果,見(jiàn)表6。
表6 中每一個(gè)新商品對(duì)應(yīng)的行都是在已學(xué)習(xí)好的貝葉斯網(wǎng)絡(luò)中輸入該新商品屬性時(shí)得到的消費(fèi)性格分布,如果這個(gè)分布與從甲真實(shí)消費(fèi)的商品中得到的消費(fèi)性格一致,則為其推薦該商品。具體做法是若得到的消費(fèi)性格類(lèi)型大于設(shè)定閾值ε 時(shí),則用(* )標(biāo)示出來(lái),當(dāng)前兩個(gè)消費(fèi)性格類(lèi)型都大于設(shè)定閾值時(shí),表明該商品符合甲的主導(dǎo)消費(fèi)性格,則向消費(fèi)者甲進(jìn)行推薦,否則就不予推薦。
以商品A 為例,性格類(lèi)型為經(jīng)濟(jì)型的概率取值為0.469,大于ε1;自由型的概率取值為0.530,大于ε2。兩者同時(shí)大于設(shè)定的閾值,表示商品A 所反映的性格類(lèi)型水平大于甲的主導(dǎo)消費(fèi)性格,滿(mǎn)足其個(gè)性心理需求,所以把商品A 推薦給用戶(hù)甲。
根據(jù)表6 標(biāo)示情況選擇這10種商品中的A、F、I 向甲進(jìn)行推薦,其他商品則不作為被推薦的對(duì)象。
(7)推薦結(jié)果的驗(yàn)證分析。為了驗(yàn)證推薦算法的有效性和合理性,讓該消費(fèi)者對(duì)這10種商品進(jìn)行判斷,希望購(gòu)買(mǎi)的是其中哪些商品。把調(diào)查結(jié)果與推薦結(jié)果進(jìn)行綜合,得到的結(jié)果見(jiàn)表7。
表7 推薦結(jié)果的混淆矩陣Table 7 Confusion Matirx of Recommendation
為了驗(yàn)證該方法是否具有一般性,需要對(duì)該方法進(jìn)行假設(shè)檢驗(yàn)。由于這種方法是以消費(fèi)性格為基礎(chǔ)進(jìn)行推薦的,需要做兩個(gè)方面驗(yàn)證:一是消費(fèi)性格的穩(wěn)定性驗(yàn)證,二是推薦結(jié)果合理性驗(yàn)證。前者是確定把消費(fèi)性格作為推薦基礎(chǔ)可行,后者是分析推薦結(jié)果有效。
為此,選擇MBA 學(xué)員、高校教師和高校學(xué)生作為分析對(duì)象,共40 人,獲得他們近1年的購(gòu)物記錄,并進(jìn)行與甲相同的分析,得到結(jié)果如下。
(1)消費(fèi)性格穩(wěn)定性分析。對(duì)每個(gè)人的購(gòu)物記錄采用4 折交叉驗(yàn)證,把購(gòu)物記錄按月份分為4 組數(shù)據(jù),選擇3 組作為訓(xùn)練集,剩余1 組作為測(cè)試集,每個(gè)訓(xùn)練集的分析方法和步驟與甲相同。對(duì)4 次分析的結(jié)果做方差分析,若無(wú)明顯差別則證明所分析出的消費(fèi)性格基本一致,是穩(wěn)定的。如果證明某個(gè)人的消費(fèi)性格穩(wěn)定,則認(rèn)為該次分析通過(guò)檢驗(yàn)。
統(tǒng)計(jì)40 名實(shí)驗(yàn)者通過(guò)檢驗(yàn)的情況,有39 人通過(guò)檢驗(yàn),1個(gè)人未通過(guò)檢驗(yàn)。把通過(guò)與否看作二項(xiàng)實(shí)驗(yàn),根據(jù)二項(xiàng)分布期望值為np(試驗(yàn)次數(shù)與單次發(fā)生概率之積)可近似估計(jì)出每次實(shí)驗(yàn)通過(guò)概率為0.975,可見(jiàn)消費(fèi)性格穩(wěn)定且可知。同時(shí)也意味著,消費(fèi)性格獨(dú)立于其所購(gòu)商品,這與消費(fèi)心理學(xué)的理論吻合。
對(duì)未通過(guò)檢驗(yàn)者訪(fǎng)談得知,他主要為家人購(gòu)買(mǎi)了一些商品,故購(gòu)物記錄所反映的消費(fèi)性格不是他自身的,也不是某1個(gè)人的。
(2)推薦結(jié)果合理性分析。與向甲推薦新商品的過(guò)程和方法一樣,對(duì)樣本中其他消費(fèi)者做同樣的分析處理。統(tǒng)計(jì)40 名實(shí)驗(yàn)用戶(hù)的推薦結(jié)果和調(diào)查結(jié)果,當(dāng)推薦符合率達(dá)到85%以上時(shí),認(rèn)為通過(guò)檢驗(yàn),否則未通過(guò)檢驗(yàn)。
統(tǒng)計(jì)40 名實(shí)驗(yàn)者通過(guò)檢驗(yàn)的情況,有38 人通過(guò)檢驗(yàn),2 人未通過(guò)檢驗(yàn)。把檢驗(yàn)結(jié)果看成是二項(xiàng)試驗(yàn),根據(jù)二項(xiàng)分布期望值為np 可近似估計(jì)出每次試驗(yàn)通過(guò)概率為0.950。雖然測(cè)試是否購(gòu)買(mǎi)新商品與真實(shí)購(gòu)買(mǎi)存在差別,但推薦符合率和通過(guò)檢驗(yàn)比率說(shuō)明推薦結(jié)果比較符合用戶(hù)偏好,基于消費(fèi)性格的推薦基本可行。
總之,通過(guò)對(duì)樣本的消費(fèi)性格穩(wěn)定性分析和推薦結(jié)果合理性分析,說(shuō)明該方法能夠推廣到樣本之外的消費(fèi)者,即所提出的消費(fèi)性格分析以及基于消費(fèi)性格的推薦方法具有一定的普適性。
管理活動(dòng)所涉及的因素及其類(lèi)型越來(lái)越復(fù)雜,將研究視野放大到更多、更廣的學(xué)科領(lǐng)域是大勢(shì)所趨[30]。本研究把消費(fèi)性格理論與貝葉斯網(wǎng)絡(luò)相結(jié)合解決新商品推薦問(wèn)題,提出并驗(yàn)證基于消費(fèi)性格的新商品推薦方法,得到如下研究結(jié)論。
(1)通過(guò)定量分析明確消費(fèi)者的消費(fèi)性格。目前消費(fèi)心理理論多是描述性的,在應(yīng)用方面主要以定性分析為主。本研究在消費(fèi)性格理論指導(dǎo)下,采用貝葉斯網(wǎng)絡(luò)從消費(fèi)者的實(shí)際購(gòu)物記錄中分析出其消費(fèi)性格,且定量分析結(jié)果與消費(fèi)性格理論能夠相互印證,如消費(fèi)者選擇的多樣性只是其消費(fèi)性格的外在反映,內(nèi)在的消費(fèi)性格具有穩(wěn)定性等。這說(shuō)明個(gè)體的消費(fèi)心理能通過(guò)定量分析加以認(rèn)識(shí),也就意味著消費(fèi)心理學(xué)理論能夠與其他方法進(jìn)行有機(jī)結(jié)合。
(2)基于消費(fèi)性格進(jìn)行新商品推薦的思路是可行的。傳統(tǒng)推薦思路如協(xié)同過(guò)濾、基于內(nèi)容等推薦是基于相關(guān)關(guān)系進(jìn)行推薦,但由于新商品問(wèn)題日益突出,使這種基于事后型分析得到的“關(guān)系”在應(yīng)用到新商品情形時(shí)很難奏效。由于消費(fèi)性格與消費(fèi)行為之間是因果關(guān)系,故本研究提出的方法是一種基于因果關(guān)系的推薦,與傳統(tǒng)推薦方法有本質(zhì)不同。通過(guò)判定某一新商品與消費(fèi)者的消費(fèi)性格符合的程度進(jìn)行推薦,使即使面對(duì)新商品和消費(fèi)者選擇多樣性的情況,仍能給出合理的推薦,且結(jié)果的可解釋性也增強(qiáng)。
本研究?jī)H探討基于消費(fèi)性格的新商品推薦方法,還有些問(wèn)題有待進(jìn)一步研究。①消費(fèi)心理是多方面的,如果能對(duì)消費(fèi)心理做全面、綜合的分析,并在此基礎(chǔ)上推薦,可以預(yù)期推薦結(jié)果會(huì)更理想、更有說(shuō)服力;②在做推薦時(shí)采用閾值判斷的方式,而沒(méi)有采用傳統(tǒng)的距離和相似度等判定方式,可以考慮與現(xiàn)有推薦方法結(jié)合,衍生出更好的推薦方法;③商品屬性劃分是根據(jù)消費(fèi)性格方面的論述做出的,偏重于經(jīng)濟(jì)方面的屬性,屬性劃分粒度顯得稍粗,但好處是即使面對(duì)新商品也沒(méi)有不能涵蓋的新屬性,在實(shí)際推薦系統(tǒng)中可以通過(guò)試驗(yàn)的方式確定合適的屬性粒度;④與現(xiàn)有推薦方法進(jìn)行全面細(xì)致的對(duì)比分析,以期進(jìn)一步明了該方法的優(yōu)缺點(diǎn)。
[1]Xiao B,Benbasat I.E-commerce product recommendation agents:Use,characteristics,and impact[J].MIS Quarterly,2007,31(1):137-209.
[2]Linden G,Smith B,York J.Amazon.com recommendations:Item-to-item collaborative filtering [J].IEEE Internet Computing,2003,7(1):76-80.
[3]Fleder D M,Hosanagar K.Blockbuster culture′s next rise or fall:The impact of recommender systems on sales diversity[J].Management Science,2009,55(5):697-712.
[4]Kelly J P,Bridge D.Enhancing the diversity of conversational collaborative recommendations:A comparison[J].Artificial Intelligence Review,2006,25(1/2):79-95.
[5]劉平峰,聶規(guī)劃,陳冬林.電子商務(wù)推薦系統(tǒng)研究綜述[J].情報(bào)雜志,2007,26(9):46-50.Liu Pingfeng,Nie Guihua,Chen Donglin.A survey:Electronic commerce recommender systems[J].Journal of Intelligence,2007,26(9):46-50.(in Chinese)
[6]Pu P,Chen L,Hu R.Evaluating recommender systems from the user′s perspective:Survey of the state of the art[J].User Modeling and User-Adapted In-teraction,2012,22(4/5):317-355.
[7]Zhang Y,Callan J,Minka T.Novelty and redundancy detection in adaptive filtering[C]∥Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.New York,NY:ACM Press,2002:81-88.
[8]Murakami T,Mori K,Orihara R.Metrics for evaluating the serendipity of recommendation lists[J].New Frontiers in Artificial Intelligence,2008,4914:40-46.
[9]Zhang M,Hurley N.Avoiding monotony:Improving the diversity of recommendation lists[C]∥Proceedings of the 2008 ACM Conference on Recommender Systems.New York,NY:ACM Press,2008:123-130.
[10]劉魯蓉,孫順根.消費(fèi)心理學(xué)[M].北京:科學(xué)出版社,2008:5-9.Liu Lurong,Sun Shungen.Consumer psychology[M].Beijing:Science Press,2008:5-9.(in Chinese)
[11]Solomon M R,Russell-Bennett B,Previte J.Consumer behaviour:Buying,having,being[M].3 rd ed.Austialia:Pearson Higher Education AU,2012:106-112.
[12]Biswas A,Bhowmick S,Guha A,Grewal D.Consumer evaluations of sale prices:Role of the subtraction principle[J].Journal of Marketing,2013,77(4):49-66.
[13]王海忠,王晶雪,何云.品牌名、原產(chǎn)國(guó)、價(jià)格對(duì)感知質(zhì)量與購(gòu)買(mǎi)意向的暗示作用[J].南開(kāi)管理評(píng)論,2007,10(6):19-25,32.Wang Haizhong,Wang Jingxue,He Yun.The suggestive effects of brand naming,county-of-origin,price on quality perception and purchase willingness:An empirical study in China[J].Nankai Business Review,2007,10(6):19-25,32.(in Chinese)
[14]Yao S,Mela C F,Chiang J,Chen Y.Determining consumers′ discount rates with field studies[J].Journal of Marketing Research,2012,49(6):822-841.
[15]Weatherly J N,Terrell H K,Derenne A.Delay discounting of different commodities[J].The Journal of General Psychology,2010,137(3):273-286.
[16]Golder P N,Mitra D,Moorman C.What is quality?An integrative framework of processes and states[J].Journal of Marketing,2012,76(4):1-23.
[17]Kianpour K,Jusoh A,Asghari M.Environmentally friendly as a new dimension of product quality[J].International Journal of Quality & Reliability Management,2014,31(5):547-565.
[18]Park H S.Culture,need for uniqueness,and the false consensus effect[J].Journal of Social,Evolutionary,and Cultural Psychology,2012,6(1):82-92.
[19]Chan C,Berger J,Van Boven L.Identifiable but not identical:Combining social identity and uniqueness motives in choice[J].Journal of Consumer Research,2012,39(3):561-573.
[20]Lee H J,Kang M S.The effect of brand personality on brand relationship,attitude and purchase intention with a focus on brand community[J].Academy of Marketing Studies Journal,2013,17(2):85-97.
[21]Lee H J,Kang M S.The effect of brand experience on brand relationship quality[J].Academy of Marketing Studies Journal,2012,16(1):87-98.
[22]Oestreicher-Singer G,Sundararajan A.Recommendation networks and the long tail of electronic commerce[J].MIS Quarterly,2012,36(1):65-83.
[23]Hultink E J,Atuahene-Gima K,Lebbink I.Determinants of new product selling performance:An empirical examination in the Netherlands[J].European Journal of Innovation Management,2000,3(1):27-36.
[24]Neganova V,Neganova I.Development of innovation products based on the consumers′ preferences[J].International Journal of Management Cases,2011,13(4):261-266.
[25]Lovett M J,Peres R,Shachar R.On brands and word of mouth[J].Journal of Marketing Research,2013,50(4):427-444.
[26]de Matos C A,Rossi C A V.Word-of-mouth communications in marketing:A meta-analytic review of the antecedents and moderators[J].Journal of the Academy of Marketing Science,2008,36(4):578-596.
[27]Baybars M,Ustundagli E.Attitudes toward online shopping from the aspects of personal characteristics and shopping motive through a developing concept:Private shopping[J].International Journal of Business and Management Studies,2011,3(2):201-210.
[28]Cooper G F,Herskovits E.A Bayesian method for the induction of probabilistic networks from data[J].Machine Learning,1992,9(4):309-347.
[29]Sokolova M,Lapalme G.A systematic analysis of performance measures for classification tasks[J].Information Processing & Management,2009,45(4):427-437.
[30]國(guó)家自然科學(xué)基金委,中國(guó)科學(xué)院.未來(lái)10年中國(guó)學(xué)科發(fā)展戰(zhàn)略:管理科學(xué)[M].北京:科學(xué)出版社,2012:1-12.The National Natural Science Foundation of China,Chinese Academy of Sciences.Disipline development strategy of China in the next decade:Management Science[M].Beijing:Science Press,2012:1-12.(in Chinese)