国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進的K-means聚類算法的汽車市場競爭情報分析

2019-02-20 02:02:42,,,,
關鍵詞:網(wǎng)絡分析聚類競爭

,,,,

(1.山東科技大學 計算機科學與工程學院,山東 青島 266590;2.山東科技大學 信息工程系,山東 泰安 271019)

在激烈的市場競爭中,企業(yè)只有找準自己的定位及競爭優(yōu)勢,才能實時地制定產(chǎn)品戰(zhàn)略,以期更好地發(fā)展。社會網(wǎng)絡分析(social network analysis,SNA)對社會個體進行網(wǎng)絡化的分析,建立聯(lián)系、比較差異,是目前將數(shù)據(jù)挖掘技術(shù)與社會生活密切聯(lián)系起來的最優(yōu)方法之一,同時也給競爭情報工作帶來了新的方向[1-2]。近年來,社會網(wǎng)絡在競爭情報獲取和分析上的應用逐步推廣,張玥等[3]以圖書館、情報學專業(yè)領域博客交流網(wǎng)絡為例,進行中心度、凝聚子群以及小世界效應分析,對促進科研人員之間的信息溝通與交流具有指導性。裴雷等[4]探討了社會網(wǎng)絡在情報學領域的研究現(xiàn)狀、典型應用以及計量分析理論,完善了社會網(wǎng)絡分析與競爭情報的理論性結(jié)合基礎。徐振宇[5]分析了社會網(wǎng)絡在經(jīng)濟學領域諸如在網(wǎng)絡結(jié)構(gòu)、網(wǎng)絡效應、網(wǎng)絡形成等方面的應用,客觀評價了社會網(wǎng)絡分析與經(jīng)濟學結(jié)合的優(yōu)勢與困境。唐曉波等[6]則將社會網(wǎng)絡分析應用于企業(yè)競爭市場,以手機市場為例構(gòu)建競爭網(wǎng)絡,從宏觀和微觀角度得出企業(yè)競爭狀況,具有較強實踐意義。

選擇目前在中國轎車市場中最為廣泛使用的A級車為例,首先運用層次分析法(AHP)和熵權(quán)法(EWM)對車輛指標數(shù)據(jù)進行量化處理,提出競爭威脅概念并設計該數(shù)據(jù)指標,改進K-means聚類算法,應用該算法對其進行聚類分析,最后通過競爭矩陣和競爭網(wǎng)絡的建立對企業(yè)品牌以及車輛本身做中間中心度和凝聚子群分析,從而使得汽車企業(yè)了解其品牌在A級車市場中的競爭地位,同時為用戶選購車輛提供依據(jù)。

表1 判斷標度及其定義表Tab.1 The scale of judgment and its definition table

1 數(shù)據(jù)的標準化處理

1.1 數(shù)據(jù)采集與基于AHP的文本數(shù)據(jù)處理

樣本數(shù)據(jù)是通過Python從汽車之家、搜狐汽車和網(wǎng)上車市等網(wǎng)站爬取得到。選取了目前中國A級轎車市場的幾乎所有最新款車輛,由于同款汽車存在配置差異導致價格區(qū)間過大,同一車型高低版本太多,所以統(tǒng)一選取各樣本對象同款車型中的最高配作為衡量標準,以便進行比較分析。統(tǒng)計樣本數(shù)據(jù)包括88輛目前主流A級轎車,選取了最能代表汽車性能的16個指標:價格、最大馬力、最大扭矩、變速箱、百公里油耗、軸距等??紤]到在中國A級轎車市場中,國產(chǎn)制造與合資車輛存在明顯的品牌效應差異,對用戶選擇存在差異性影響,所以將汽車品牌也作為一項重要指標,并賦予不同權(quán)重值[7]。

汽車屬性指標中存在比如品牌、變速箱、座椅材質(zhì)等文本型指標,因此采用AHP方法來確定權(quán)重系數(shù)。將屬性中每一個指標值作為一個評估因素,建立評估因素集U={u1,u2,…,un},ui的取值選擇1-9標度方法[8],如表1所示。根據(jù)AHP方法定義表,文本屬性數(shù)據(jù)化后處理結(jié)果如表2所示。

表2 文本屬性數(shù)據(jù)化后處理結(jié)果(部分數(shù)據(jù))表Tab.2 Text attribute data post-processing result (partial data) table

1.2 基于熵權(quán)法EWM的數(shù)據(jù)歸一化處理

熵最先由香農(nóng)引入信息論,已經(jīng)在工程技術(shù)、社會經(jīng)濟等領域得到了廣泛應用。熵權(quán)法的基本思路是根據(jù)指標變異性的大小來確定客觀權(quán)重。在表示汽車性能屬性的指標中,各個指標對一輛車的影響程度是不同的,用戶選擇車輛時的指標側(cè)重點同樣存在差異。因此采用主觀性較小的熵權(quán)法對車輛數(shù)據(jù)進行歸一化處理并求出權(quán)重,最后對數(shù)據(jù)賦權(quán)求出標準化數(shù)據(jù)。

1) 數(shù)據(jù)歸一化處理

表3 指標數(shù)據(jù)歸一化后結(jié)果(部分數(shù)據(jù))表Tab.3 Normalized index data (partial data) table

2) 確定指標信息熵及權(quán)重

表4 信息熵和權(quán)重結(jié)果表Tab.4 Information entropy and weight result table

因此,在對指標歸一化后數(shù)據(jù)賦權(quán)重使之標準化的過程中,可以根據(jù)歸一化后車輛指標數(shù)據(jù)首先得到一個88×16的原始矩陣(1)。

(1)

其中:n為車輛個數(shù),值為88;m為性能指標,值為16。將權(quán)重代入,可得到矩陣表達式(2),詳細數(shù)據(jù)如表5所示。

(2)

表5 指標數(shù)據(jù)標準化后結(jié)果(部分數(shù)據(jù))表Tab.5 Normalized results of indicator data (partial data) table

2 改進K-means算法的聚類分析

K-means算法是典型的空間聚類方法,基于歐式距離作相似度測試,即認為兩個對象的距離越近,其相似度就越大。該算法認為簇是由距離靠近的對象組成的,把得到緊湊且獨立的簇作為最終目標[9]。本文樣本數(shù)據(jù)屬于多維的空間數(shù)據(jù),因此應用空間聚類的代表K-means算法可以得到更精確高效的數(shù)值。在典型的K-means算法中聚類數(shù)K必須是事先給定的確定值,但在實際中K很難被確定,因此會產(chǎn)生隨機誤差??紤]到如果能精確地選取K值和初始聚類中心,K-means算法就能更確切地劃分類簇[10-13],所以對典型的K-means算法進行了改進。

2.1 改進的K-means算法

1) 類間距離

令K={X,R}為空間聚類的聚類空間,其中,X={x11,x12,…,xij,xnm},i表示樣本,j表示樣本對象維數(shù)(1≤i≤n,1≤j≤m)。假設n個空間對象被聚類為K個簇,定義類間距離為所有聚類中心(簇內(nèi)樣本每一維的均值)到全域中心(全體樣本每一維的均值)的距離之和:

(3)

2) 類內(nèi)距離

類內(nèi)距離為所有聚類簇內(nèi)部距離的總和,即每個簇的內(nèi)部距離為簇內(nèi)樣本的每一維到簇內(nèi)樣本每一維的均值之和:

(4)

3) 距離代價函數(shù)

距離代價函數(shù)S(U,K)為類間距離與類內(nèi)距離之和,即

(5)

式中變量的含義與式(3)、(4)中相同。

此K-means聚類改進算法以距離代價最小為基準,即當距離代價函數(shù)的值達到最小時,空間聚類結(jié)果為最優(yōu),K的取值由下式給出:

(6)

表6 聚類類簇確定表Tab.6 Clustering class cluster determination table

2.2 聚類分析

根據(jù)改進的K-means算法,可得聚類K=3。將初始聚類簇值與標準化樣本數(shù)據(jù)導入SPSS建立聚類模型,具體步驟如下:

1) 對樣本元素集合(其中每個元素具有n個可觀察屬性)建立輸入數(shù)據(jù)矩陣;

2) 對數(shù)據(jù)進行歸一化處理,得到指標矩陣;

3) 將指標數(shù)據(jù)矩陣導入模型中,建立K-means模型,根據(jù)已確定的K值對數(shù)據(jù)進行聚類,得到最終聚類結(jié)果。

對于88個A級轎車,依據(jù)上面確定的聚類數(shù)以及在完整數(shù)據(jù)建模流程運算下得到的聚類結(jié)果如表7所示。

2.3 實驗對比和分析

將本文樣本數(shù)據(jù)分別代入楊善林等[14]構(gòu)造的距離代價函數(shù)與本文改進的新距離代價函數(shù)中,通過對比兩種算法聚類后樣本點到其所在類簇聚類中心的歐氏距離,比較兩種算法的優(yōu)劣。將樣本數(shù)據(jù)應用到改進后距離代價函數(shù)并進行聚類分析得到結(jié)果(表7),K值為3。將數(shù)據(jù)代入改進前的距離代價函數(shù)得到K值為4,其聚類結(jié)果如表8所示。

表7 最終聚類結(jié)果表Tab.7 Final cluster result table

表8 改進前算法的聚類結(jié)果表Tab.8 Clustering result table of the previous algorithm

對于樣本數(shù)據(jù)集S={X1,X2,…,Xi…,Xn},任意兩個樣本數(shù)據(jù)Xi和Xj間的歐式距離為:

圖1 算法模型改進前后樣本歐式距離分布圖Fig.1 Improved Euclidean distance distribution of sample before and after algorithm model

由圖1中的折線分布狀況,可知改進后算法聚類得到的各產(chǎn)品對象到其類簇聚類中心的歐式距離基本都小于產(chǎn)品對象使用改進前算法得到的歐式距離。因此根據(jù)K-means算法的定義屬性,類簇內(nèi)對象到其聚類中心的距離越小則相似度越高,類簇內(nèi)對象關系越緊密,聚類效果越好。因此改進后算法更適用于本文的樣本對象,得到更為準確的聚類效果。

3 SNA數(shù)值實驗結(jié)果與分析

3.1 社會網(wǎng)絡分析

將數(shù)據(jù)挖掘與社會網(wǎng)絡分析相結(jié)合,可以在海量數(shù)據(jù)中尋找到有價值的信息并加以整合處理。通過數(shù)據(jù)挖掘?qū)?shù)據(jù)規(guī)整聚類,使得類簇之間不相關性達到最大。根據(jù)簇內(nèi)樣本分布及類族個數(shù)K,對每一類族和整體分別完成品牌競爭威脅的量化并構(gòu)建競爭矩陣,對企業(yè)競爭力完成量化并構(gòu)建競爭矩陣,然后通過社會網(wǎng)絡分析軟件進行中間中心度和凝聚子群等分析,形成數(shù)據(jù)挖掘在社會網(wǎng)絡分析中的社會和商業(yè)應用價值。

1) 單類簇內(nèi)品牌競爭威脅

2) 整體品牌競爭威脅

由表7中聚類結(jié)果,將同一類簇中相同品牌的產(chǎn)品規(guī)整為一體,根據(jù)上述競爭威脅數(shù)據(jù)指標定義,建立品牌間的競爭矩陣,如表9所示。

表9 品牌間競爭矩陣數(shù)據(jù)(部分)表Tab.9 Brand competition matrix data (partial data) table

將競爭矩陣與指標數(shù)據(jù)標準化后,導入社會網(wǎng)絡分析軟件UCINET(主要用于網(wǎng)絡分析集成)生成企業(yè)競爭圖,進行社會網(wǎng)絡分析。首先分析產(chǎn)品性能數(shù)據(jù),用UCINET可得到各個產(chǎn)品對于16個屬性指標的側(cè)重程度,如圖2所示。

圖2 企業(yè)產(chǎn)品對于屬性指標的偏重程度圖Fig.2 The degree of weight of enterprise product to attribute index

根據(jù)圖2的鏈接路線及相關系數(shù)分析可得:

1) 以產(chǎn)品8、9、11…為代表的日系車在價格方面稍貴,馬力、變速箱偏重較高,但是其扭矩和升功率都不高,因此動力性能一般,但其油耗低,內(nèi)飾及安全性高于平均水平;

2) 以產(chǎn)品1、2、22…為代表的德系車價格相對要高,其性能側(cè)重在變速箱、扭矩與升功率,因此動力較強,加速體驗與駕駛樂趣較好,但其油耗稍微偏高;

3) 14、39、40…為代表的美系車,動力性能側(cè)重較強,但油耗和價格都高于平均水平,內(nèi)飾與安全性系數(shù)較為一般;

4) 以4、5、7…為代表的國產(chǎn)車在動力性能、內(nèi)飾及安全方面的系數(shù)都要低于平均值,但價格相對較低,且加速性能不錯,由圖2可以看出國產(chǎn)品牌現(xiàn)已占據(jù)我國A級車市場的半壁江山;

5) 以3、45、48…為代表的韓系車動力方面?zhèn)戎夭蛔悖瑑?nèi)飾及安全系數(shù)略顯一般,且毫無價格優(yōu)勢。

據(jù)此,用戶可根據(jù)自己的偏重喜好選擇適合自己的產(chǎn)品。

根據(jù)定義的企業(yè)競爭關系,導入品牌競爭矩陣生成品牌競爭關系1模網(wǎng)絡圖(顯示品牌之間競爭力強弱),如圖3所示。

根據(jù)結(jié)點中心度、緊密中心度,從圖中分析可得:東風日產(chǎn)、上汽大眾、上汽集團和吉利汽車等處于該圖中心位置,與其他品牌聯(lián)系緊密,因此這幾個品牌目前在中國A級車市場中競爭力較強,對其他品牌造成有力威脅及沖擊。邊緣位置的力帆、北京汽車和廣汽菲亞特等競爭力較差,對其他品牌威脅較小。綜合之前聚類結(jié)果發(fā)現(xiàn),同一品牌在三個類簇中分布的廣泛程度與其品牌競爭力成正相關,表明品牌效應與企業(yè)底蘊在汽車市場同樣影響巨大,因此汽車行業(yè)往往容易出現(xiàn)大魚吃小魚的企業(yè)兼并行為。

3.2 中間中心度分析

圖3 品牌競爭關系1模網(wǎng)絡圖Fig.3 Brand competition relationship 1 model network diagram

品牌標號品牌1 Betweenness2 nBetweenness13上汽大眾27.8552.80812上汽集團27.8552.80811吉利20.6322.0802比亞迪20.6322.0801北京現(xiàn)代20.6322.0806東風悅達起亞20.6322.0804東風日產(chǎn)20.6322.08010海馬20.6322.08014神龍汽車20.6322.08025上汽通用10.2991.03820東風雪鐵龍10.2991.038

由表10可知,上汽大眾和上汽集團具有較高中間中心度,表明這兩個品牌處于行業(yè)領先位置,是大多數(shù)品牌的競爭目標,同時也證實了在聚類類別中這兩個品牌產(chǎn)品的高性能。緊隨其后的是國產(chǎn)車代表吉利和比亞迪,表明中國國產(chǎn)車雖然產(chǎn)品性能還需加強,但因其低廉的價格優(yōu)勢在中國小型轎車市場中所占份額及市場競爭力越來越大。其他中心度為零的品牌說明在市場競爭中處于十分劣勢地位,品牌所屬企業(yè)需要制定措施積極整改,增強技術(shù)投入與產(chǎn)品營銷水平,以免被市場淘汰。

3.3 凝聚子群分析

凝聚子群分析是社會網(wǎng)絡分析學科對社會結(jié)構(gòu)的網(wǎng)絡研究,是對社會行動者之間實際存在的或者潛在關系的研究,簡單來說“凝聚子群是滿足如下條件的一個行動者子集合,即在此集合中的行動者之間具有相對較強的、直接的、緊密的、經(jīng)常的或積極的關系?!迸上凳墙⒃诨セ菪曰A上的凝聚子群,是指一個圖中至少包含三個節(jié)點的最大完備子圖,顯示小團體之間的競爭關系,如圖4所示。

圖4 派系分析圖Fig.4 Factional analysis chart

通過派系分析圖可知,東風裕隆、觀致和廣汽本田等處于第一個小團體,東風、華晨金杯和奇瑞等處于第二個小團體。以此類推,表明處于同一小團體中的品牌具有更為緊密的聯(lián)系和直接競爭力,之間具有較強的競爭關系。上汽與上汽大眾聯(lián)系緊密,表明其同處于上海汽車集團旗下,只不過一個是合資品牌一個是國產(chǎn)品牌,在密切聯(lián)系下二者也具有直接競爭關系。孤點的菲亞特則說明其競爭力不強,在中國市場處于淘汰邊緣。

4 結(jié)論

應用AHP(層次分析法)和EWM(熵權(quán)法),對中國A級轎車市場數(shù)據(jù)進行了分析量化處理,設計了競爭威脅數(shù)據(jù)指標,基于改進的K-means聚類算法對該市場進行了社會網(wǎng)絡分析;通過品牌間競爭矩陣構(gòu)建了中間中心度及凝聚子群,分析了產(chǎn)品性能指標偏重程度和品牌所在市場的競爭地位,對用戶選擇合適的產(chǎn)品以及為品牌所屬企業(yè)提供精準的市場競爭優(yōu)勢具有重要意義。數(shù)值實驗表明:改進的K-means聚類算法對于文中樣本對象,得到了更為精確的聚類效果。對中國A級轎車市場的社會網(wǎng)絡分析準確有效。

猜你喜歡
網(wǎng)絡分析聚類競爭
基于ISM模型的EPC項目風險網(wǎng)絡分析
鐵路有線調(diào)度通信的網(wǎng)絡分析
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
感謝競爭
2016年社交網(wǎng)絡分析
基于改進的遺傳算法的模糊聚類算法
兒時不競爭,長大才勝出
競爭
小說月刊(2015年9期)2015-04-23 08:48:17
一種層次初始的聚類個數(shù)自適應的聚類方法研究
大班幼兒同伴交往的社會網(wǎng)絡分析
临清市| 庄河市| 饶平县| 姚安县| 郓城县| 古交市| 灵山县| 阿拉善盟| 顺义区| 玉溪市| 福鼎市| 紫金县| 日土县| 大兴区| 万载县| 色达县| 民勤县| 南通市| 榆树市| 灵丘县| 湾仔区| 乃东县| 华亭县| 平罗县| 南川市| 夏津县| 辽阳县| 通州区| 沁阳市| 晋中市| 宾阳县| 宝清县| 雅江县| 文水县| 长葛市| 广平县| 樟树市| 牟定县| 普兰县| 饶平县| 平顶山市|