劉征宏,潘偉杰,呂 健,林 麗
(貴州大學(xué) a.現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室;b.機(jī)械工程學(xué)院,貴陽(yáng) 550025)
?
基于因子分析和聚類分析的情感維度提取*
劉征宏a,潘偉杰a,呂健a,林麗b
(貴州大學(xué) a.現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室;b.機(jī)械工程學(xué)院,貴陽(yáng)550025)
摘要:為從大量用戶情感維度(感性詞對(duì))中提取少量具有代表性情感維度(感性詞對(duì)),文章提出結(jié)合因子分析(factor analysis, FA)和聚類分析(cluster analysis, CA)的情感維度提取方法。首先通過(guò)語(yǔ)義差分(semantic differential, SD)實(shí)驗(yàn)獲取用戶對(duì)少量具有代表性樣品的情感認(rèn)知;然后使用FA對(duì)SD結(jié)果進(jìn)行分析,獲得初始情感維度的潛在因子及因子載荷矩陣;最后根據(jù)FA結(jié)果進(jìn)行聚類分析,對(duì)初始情感維度到每個(gè)聚類幾何中心的距離進(jìn)行排序,距離最近的感性詞對(duì)即為所提取的情感維度。以數(shù)控機(jī)床造型設(shè)計(jì)為研究案例,對(duì)該方法進(jìn)行描述,結(jié)果表明,該方法能有效提取情感維度,并保留了初始情感維度的整體結(jié)構(gòu)。
關(guān)鍵詞:因子分析;聚類分析;情感維度;感性詞對(duì)
0引言
產(chǎn)品造型是決定消費(fèi)者購(gòu)買的最重要因素之一,因此對(duì)消費(fèi)者主觀認(rèn)知也就是用戶感性需求的研究是產(chǎn)品設(shè)計(jì)領(lǐng)域研究的熱點(diǎn)與重點(diǎn)。只有獲取用戶真實(shí)的情感意象,設(shè)計(jì)師才能將其賦予在產(chǎn)品的結(jié)構(gòu)、形態(tài)、材質(zhì)、色彩上,從而滿足用戶的感性需求。
感性工學(xué)(kansei engineering, KE)將用戶感性需求進(jìn)行定量化描述,通過(guò)構(gòu)建用戶感性需求和產(chǎn)品造型的關(guān)系指導(dǎo)設(shè)計(jì)師進(jìn)行產(chǎn)品設(shè)計(jì),日本著名學(xué)者Nagamachi[1]將感性工學(xué)分為以下幾個(gè)主要步驟:①選擇樣品;②收集初始情感維度;③提取代表性情感維度;④對(duì)產(chǎn)品進(jìn)行形態(tài)分析;⑤用戶感性評(píng)估;⑥利用智能計(jì)算技術(shù)(如神經(jīng)網(wǎng)絡(luò)、遺傳算法、模糊邏輯等)探索用戶偏好與設(shè)計(jì)元素之間的關(guān)系;⑦構(gòu)建感性工學(xué)推論模型或?qū)<蚁到y(tǒng),進(jìn)行新產(chǎn)品設(shè)計(jì)或開發(fā)。無(wú)論是國(guó)外還是國(guó)內(nèi)的研究都是集中在步驟⑥、⑦[2-5],而在步驟③提取代表性情感維度的研究非常少,其中具有代表性的有:Huang等人[6]結(jié)合設(shè)計(jì)結(jié)構(gòu)矩陣對(duì)感性詞進(jìn)行聚類分析,首先將初始情感維度分成少量子集,然后計(jì)算子集之間的相關(guān)系數(shù),再合并完全相關(guān)的子集,最終得到聚類結(jié)果;Wang等人[7]結(jié)合模糊層次分析法和模糊kano模型對(duì)用戶感性需求進(jìn)行了分析;Shi等人[8]運(yùn)用粗糙集、關(guān)聯(lián)規(guī)則對(duì)感性需求知識(shí)進(jìn)行了挖掘。這些方法雖然都具有創(chuàng)新性,但沒(méi)有對(duì)用戶情感維度進(jìn)行篩選,因此在處理用戶情感維度時(shí)會(huì)造型信息冗余,從而導(dǎo)致計(jì)算量過(guò)大且結(jié)果不準(zhǔn)確。
KE中的每一步都至關(guān)重要,而前期用戶感性需求的獲取更是整個(gè)KE模型構(gòu)建成功的關(guān)鍵。FA作為特征提取工具是最常用的分析SD數(shù)據(jù)的方法,然而,F(xiàn)A并沒(méi)有提供選擇代表性感性維度的直接標(biāo)準(zhǔn)。因此本文通過(guò)FA結(jié)合CA對(duì)用戶初始情感維度進(jìn)行定量化處理,首先通過(guò)SD實(shí)驗(yàn)獲得SD數(shù)據(jù),然后對(duì)SD數(shù)據(jù)進(jìn)行因子分析獲得因子載荷矩陣,最后通過(guò)聚類分析獲得代表性情感維度。實(shí)驗(yàn)結(jié)果表明該方法能很好地保留初始情感維度的完整性,即本方法所提取的情感維度包含了初始情感維度的所有信息。
1SD數(shù)據(jù)獲取
1.1具有代表性的設(shè)計(jì)樣品提取
從市場(chǎng)上選擇不同款式的產(chǎn)品或者三維模型作為樣品,然后排除那些特定用途或造型奇特的產(chǎn)品。為了減少受測(cè)者的心理負(fù)荷和簡(jiǎn)化實(shí)驗(yàn)過(guò)程,邀請(qǐng)?jiān)O(shè)計(jì)專家組對(duì)剩下的樣品使用KJ方法[9]進(jìn)行分組。為了方便,使用樣品照片進(jìn)行操作,照片須表現(xiàn)產(chǎn)品的三維造型特征,每個(gè)測(cè)試者須具有從照片識(shí)別產(chǎn)品三維造型特征的能力。使用KJ法使所有的樣品被分成合適的聚類群組。然后根據(jù)獲得的分組結(jié)果構(gòu)建相似度矩陣,再進(jìn)行多維尺度分析(multidimensional scaling, MDS),通過(guò)應(yīng)力系數(shù)確定維數(shù),應(yīng)力系數(shù)越小,擬合越好(一般小于0.05)。然后對(duì)MDS結(jié)果進(jìn)行聚類分析,獲得聚類樹圖。最后使用k-均值聚類法從分別從每個(gè)群組中選擇一個(gè)代表性樣品,本方法計(jì)算每個(gè)樣品到其所屬組幾何中心的距離,距離最小的樣品為這組的代表樣品。
1.2準(zhǔn)備最初的情感維度
在KE中,通常使用SD進(jìn)行情感評(píng)估實(shí)驗(yàn)從而得到用戶對(duì)產(chǎn)品的心理情感[10]。在人體工程學(xué)和心理學(xué)評(píng)估中通常使用意象或感性詞匯對(duì)來(lái)描述用戶對(duì)產(chǎn)品的情感[11]。因此,為了描述用戶對(duì)產(chǎn)品的情感,需要收集大量的感性詞,其步驟如下:
Step1:從雜志、產(chǎn)品目錄、報(bào)紙等收集大量的感性詞對(duì),首先收集了超過(guò)100個(gè)感性詞對(duì)來(lái)描述該產(chǎn)品。
Step2:通過(guò)專家組兩輪的討論,合并相近的感性詞對(duì)選擇其中更合適的,然后得到30組左右的感性詞對(duì)。
1.3SD評(píng)估實(shí)驗(yàn)
為了獲得關(guān)于產(chǎn)品造型設(shè)計(jì)的SD數(shù)據(jù),讓受測(cè)者對(duì)所提取的樣品在5分量表下使用初始感性詞進(jìn)行評(píng)估。然后計(jì)算所有人對(duì)每個(gè)樣品的感性評(píng)價(jià)平均值獲得最終評(píng)價(jià)值。為了更有效收集評(píng)估數(shù)據(jù),設(shè)計(jì)了一個(gè)友好的評(píng)估交互界面,如圖1所示,使調(diào)查者的評(píng)估數(shù)據(jù)直接記錄下來(lái),簡(jiǎn)化了后續(xù)的處理過(guò)程。
圖1 感性評(píng)估界面
2對(duì)初始情感維度進(jìn)行因子分析
在傳統(tǒng)SD研究中,根據(jù)個(gè)人、概念、尺度三種模式對(duì)用戶響應(yīng)進(jìn)行分類。相似地,在KE研究中,SD實(shí)驗(yàn)結(jié)果可表示為三維數(shù)據(jù)矩陣m×n×r,其中m表示消費(fèi)者數(shù)量(個(gè)人),n表示評(píng)估的產(chǎn)品樣品數(shù)量(概念),r表示形容詞數(shù)量(規(guī)模)。因?yàn)槊總€(gè)消費(fèi)者評(píng)估相同的產(chǎn)品樣品,所以本文只考慮n×r的二維數(shù)據(jù)矩陣,這個(gè)二維數(shù)據(jù)矩陣表示m個(gè)消費(fèi)者的n×r矩陣的平均值。Coxhead等[12]指出為了對(duì)SD數(shù)據(jù)進(jìn)行因子分析,概念和尺度必須盡可能數(shù)量多且種類多,因此,產(chǎn)品樣品和最初情感維度的選擇應(yīng)該遵循這個(gè)原則。FA在SD數(shù)據(jù)中的應(yīng)用是為了獲取輸入情感維度的潛在因子和因子載荷。因子載荷用于確定情感維度對(duì)潛在因子的影響程度。為了構(gòu)建新的意象認(rèn)知系統(tǒng),須對(duì)提取的因子進(jìn)行命名,并指定合適的意義。比如,Osgood[10]提出了三個(gè)著名的內(nèi)涵維度,即評(píng)價(jià)(Evaluation)、潛在(Potency)、活動(dòng)(Activity)(EPA),能解釋廣泛的尺度和概念,并且被頻繁使用。Hsiao等[13]根據(jù)三個(gè)不同的目錄從SD實(shí)驗(yàn)中提取了四個(gè)基本的情感維度,即趨勢(shì)、情感、復(fù)雜、效能。
每一個(gè)情感維度可用少數(shù)潛在因子的線性組合加上每個(gè)情感維度的特殊因子表示。因子分析模型描述如下:
y1=λ11X1+…+λ1nXn+θ1
y2=λ21X1+…+λ2nXn+θ2
……………
ym=λm1X1+…+λmnXn+θm
(1)
在公式(1)中,n為潛在因子數(shù)量,通常小于m。X1,…,Xp為潛在因子。λij為Xj的相關(guān)系數(shù),也就是第i個(gè)潛在因子的載荷,因子載荷用于解釋情感維度對(duì)潛在因子的依賴程度。θ1,…,θp為每個(gè)相關(guān)情感維度的特殊因子。因子載荷結(jié)果λij構(gòu)成因子載荷矩陣L如下:
(2)
在SPSS中使用FA對(duì)實(shí)驗(yàn)獲得的SD數(shù)據(jù)進(jìn)行分析。FA使用的一個(gè)關(guān)鍵問(wèn)題是必須確定因子數(shù)量。載荷因子數(shù)量不同對(duì)所選擇的情感維度影響也不同。選擇主成分分析(principal components analysis, PCA)中的最大方差正交旋轉(zhuǎn)法來(lái)測(cè)試因子數(shù)量從3到7的變化。通常根據(jù)所提因子的特征值和方差百分比確定因子數(shù)量,首先保留特征值大于1的提取因子,然后,根據(jù)所有因子的累積方差百分比選擇合適的因子數(shù)。一般來(lái)說(shuō),所選因子數(shù)應(yīng)該包括總方差的60%以上[14]。
在同一個(gè)因子下正載荷因子和負(fù)因子載荷的混合可能會(huì)造成主成分分析的解釋問(wèn)題并影響潛在因子的命名。為了簡(jiǎn)化感性詞選擇過(guò)程,必須對(duì)FA結(jié)果進(jìn)行調(diào)整,因此,如果感性詞主成分中具有負(fù)載荷因子,那么將其方向改變,不改變其因子載荷值。感性詞主成分是指所有因子中載荷絕對(duì)值最高的。這種調(diào)整既保證了感性詞方向的一致性,使它更符合人們的認(rèn)知,又減少了感性詞在因子空間分布的復(fù)雜性。
3對(duì)因子載荷進(jìn)行聚類分析
通過(guò)FA獲得了因子載荷矩陣,但FA并沒(méi)有提供選擇代表性感性維度的直接標(biāo)準(zhǔn),一個(gè)簡(jiǎn)單直觀的提取具有代表性感性詞的方法是選擇每個(gè)因子中因子載荷絕對(duì)值較高的,然而這個(gè)方法既忽略了感性詞的全局結(jié)構(gòu),又忽略了其局部關(guān)系,因?yàn)楸贿x中的感性詞都是位于每個(gè)因子軸的極端。因此,為了提取代表性感性詞對(duì)并盡可能保證其結(jié)構(gòu)完整,須對(duì)FA結(jié)果進(jìn)行聚類分析。
使用結(jié)合層次和非層次聚類方法的兩階段聚類分析FA結(jié)果。盡管聚類分析可使用很多算法如k-均值聚類、自組織地圖、模糊聚類等,但都沒(méi)有提供直接確定聚類數(shù)量的方法。為了確定合適的聚類數(shù)量,使用層次聚類和離差平方和法(ward法)。然后根據(jù)情感維度的因子載荷,使用標(biāo)準(zhǔn)k-均值聚類法構(gòu)建同質(zhì)群組。選擇每個(gè)聚類中最接近中心位置的感性詞對(duì)作為具有代表性的情感維度,因此,具有代表性的感性詞對(duì)數(shù)量等于聚類數(shù)量,且由層次聚類決定。
4實(shí)例研究
以某企業(yè)某類型數(shù)控機(jī)床造型設(shè)計(jì)為研究實(shí)例,對(duì)本文所提方法進(jìn)行驗(yàn)證。
4.1選擇代表性樣品
首先收集100多個(gè)數(shù)控機(jī)床樣品,通過(guò)初步評(píng)估刪除相似的和不適合的樣本,然后邀請(qǐng)5個(gè)具有5年以上設(shè)計(jì)經(jīng)驗(yàn)的專業(yè)設(shè)計(jì)師進(jìn)行KJ方法實(shí)驗(yàn),最終剩下40個(gè)設(shè)計(jì)樣品被分成6組。為了確定最合適的維數(shù),使用MDS將維數(shù)設(shè)置2-10,分別求其應(yīng)力系數(shù),當(dāng)維數(shù)=6時(shí),應(yīng)力系數(shù)=0.03572為最小,故確定維數(shù)為6?;贛DS結(jié)果的40個(gè)數(shù)控機(jī)床產(chǎn)品Ward聚類樹圖如圖2所示。為了選擇每個(gè)聚類中最具代表性樣品,進(jìn)行K-means聚類,結(jié)果如表1所示。表1顯示樣品26 、23、38、27、5、6分別為每群組中最具代表性樣品(加粗行)。
圖2 40個(gè)數(shù)控機(jī)床產(chǎn)品的聚類樹圖
聚類樣品距離聚類樣品距離1260.9454270.943361.136251.032291.155301.109311.533331.150371.572550.844402.04180.9912231.015131.059161.03131.313171.054101.330351.62041.6063380.885111.690280.88991.794191.047660.793341.15020.795……71.449
4.2準(zhǔn)備初始情感維度
經(jīng)過(guò)初步篩選獲得如表2所示的初始情感維度。
表2 初始情感維度
4.3因子分析結(jié)果
首先通過(guò)圖1所示界面進(jìn)行SD實(shí)驗(yàn),然后根據(jù)前文所描述方法對(duì)SD結(jié)果進(jìn)行因子分析,使用三個(gè)因子的因子載荷結(jié)果如表4所示。結(jié)果顯示,提取的三個(gè)因子解釋方差分別為72.4%、13.42%、7.6%,因子1的方差百分比超過(guò)了50%,總的累計(jì)方差百分比為93.76%,表明使用三個(gè)因子的FA結(jié)果是非??尚诺摹?/p>
使用Osgood提出的EPA三因子結(jié)構(gòu)[14],根據(jù)感性詞的解釋能力對(duì)FA結(jié)果進(jìn)行檢驗(yàn)。日本學(xué)者在相關(guān)研究中,確定了一系列色彩意象詞匯如色彩的美/丑、雅/俗等屬于色彩的評(píng)價(jià)因子;色彩的動(dòng)/靜、明/暗、引人注目/不引人注目等屬于色彩的活動(dòng)因子;而色的強(qiáng)/弱、輕/重、男性化/女性化等則是色彩的潛在因子。借助此方法獲得如表3所示的結(jié)果,因子1中有7個(gè)評(píng)價(jià)因子、2個(gè)潛在因子,其中感性詞1既屬于評(píng)價(jià)因子又屬于潛在因子;因子2中2個(gè)評(píng)價(jià)因子、2個(gè)潛在因子、3個(gè)活動(dòng)因子;因子3中有2個(gè)潛在因子。因此,總的來(lái)說(shuō),本文提取的三個(gè)因子具有典型的EPA三因子結(jié)構(gòu),使用這三個(gè)因子的因子載荷提取具有代表性感性詞是可靠的。
表3 22組感性詞對(duì)的因子分析結(jié)果
4.4聚類分析結(jié)果
對(duì)初始情感維度因子載荷進(jìn)行聚類分析,首先使用層次聚類的Ward連接方法確定聚類數(shù)量為4,然后使用K-means聚類把感性詞分成4個(gè)聚類,使用平方歐式距離計(jì)算每個(gè)聚類的幾何中心,并獲得感性詞與聚類中心的距離,結(jié)果如表4所示,結(jié)果顯示,與每個(gè)聚類幾何中心距離最小的分別是感性詞22、19、17、4。圖3更加直觀地顯示聚類分析結(jié)果,圖3a為因子1-因子2空間的感性詞聚類,圖3b為因子2-因子3空間的感性詞聚類,其中,○代表感性詞,實(shí)心○為離聚類幾何中心最近感性詞,+代表每個(gè)聚類的幾何中心。最終提取的四個(gè)情感維度分別為獨(dú)特-大眾(A)、簡(jiǎn)潔-復(fù)雜(E)、人性-機(jī)械(N/A)、硬朗-柔軟(P),包含了EPA三因子的完整結(jié)構(gòu),為感性工學(xué)的下一步操作提供了可靠的基礎(chǔ)。
表4 感性詞對(duì)到每個(gè)聚類幾何中心的距離
圖3 Factor1-Factor2空間及Factor2-Factor3空間的
5結(jié)論
實(shí)驗(yàn)表明此方法能有效提取代表性情感維度,并保證了初始情感維度的完整性,為感性工學(xué)的下一步處理提供了可靠的基礎(chǔ)。然而,如果聚類結(jié)果中同時(shí)存在兩個(gè)或兩個(gè)以上感性詞到聚類中心距離相同或相近時(shí),就很難確定此聚類的代表性感性詞,因此,如何解決此問(wèn)題是下一步研究的方向之一。另外,擴(kuò)展本方法的應(yīng)用對(duì)象也是下一步研究的重要方向。
[參考文獻(xiàn)]
[1] Nagamachi M. Kansei engineering as a powerful consumer-oriented technology for product development[J]. Applied Ergonomics, 2002, 33 (3): 289-294.
[2] 石夫乾, 孫守遷, 徐江. 產(chǎn)品感性評(píng)價(jià)系統(tǒng)的模糊D-S推理建模方法與應(yīng)用[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2008, 20(3): 361-365.
[3] 傅業(yè)燾, 羅仕鑒. 面向風(fēng)格意象的產(chǎn)品族外形基因設(shè)計(jì)[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2012, 18(3): 449-457.
[4] 蘇建寧, 范躍飛, 張書濤,等. 基于感性工學(xué)和神經(jīng)網(wǎng)絡(luò)的產(chǎn)品造型設(shè)計(jì)[J]. 蘭州理工大學(xué)學(xué)報(bào), 2011, 37(4): 47-50.
[5] 蘇建寧,王瑞紅,趙慧娟,等. 基于感性意象的產(chǎn)品造型優(yōu)化設(shè)計(jì)[J]. 工程設(shè)計(jì)學(xué)報(bào),2015,22(1):35-41.
[6] Huang Y, C Chen,L P Khoo. Kansei clustering for emotional design using a combined design structure matrix[J]. International Journal of Industrial Ergonomics, 2012, 42(5): 416-427.
[7] Wang C,J Wang. Combining fuzzy AHP and fuzzy Kano to optimize product varieties for smart cameras: A zero-one integer programming perspective[J]. Applied Soft Computing, 2014, 22: 410-416.
[8] Shi F, S Sun,J Xu. Employing rough sets and association rule mining in KANSEI knowledge extraction[J]. Information Sciences, 2012,196: 118-128.
[9] Kawakita J. KJ Method[M]. Tokyo:Chuokoron-Sha, 1986.
[10] Osgood C E,SuciCJ. The measurement of meaning[M]. Urbana: University of Illinois Press, 1957.
[11] Nagamachi M. Kansei Engineering: a new ergonomics consumeroriented technology for product development[J].International Journal of Industrial Ergonomics, 1995, 15: 3-10.
[12] Coxhead P, Bynner J M. Factor analysis of semantic differential data[J]. Quality & Quantity, 1981,15: 553-567.
[13] Hsiao K A, Chen L L .Fundamental dimensions of affective responses to product shapes[J]. International Journal of Industrial Ergonomics, 2006, 36: 553-564.
[14] Kim J O, Mueller C W . Factor Analysis: Statistical Methods and Practical Issues[M]. Sage Publication, Newbury Park, 1978.
(編輯李秀敏)
Affective Dimensions Selection Based on Factor Analysis and Cluster Analysis
LIU Zheng-honga, PAN Wei-jiea, LV Jiana, LIN Lib
(a. Key Laboratory of Advanced Manufacturing Technology, Ministry of Education; b.School of Mechanical Engineering, Guizhou University, Guiyang 550025, China)
Abstract:To extract the representative affective dimensions from a wide range of affective dimensions, an approach for selecting the representative image word pairs based on factor analysis (FA) and cluster analysis (CA) was proposed. Firstly, consumer’s perceptions toward a small number of representative product samples were obtained using semantic differential (SD) method. Secondly, the latent factors and the factor loading matrix of the initial affective dimensions were extracted using FA according the SD results. At last, ranking the distance of the initial affective dimensions to the center of gravity of each cluster group based on the results of CA. The image word pair with the shortest distance to the centroid was selected as the representative of the cluster. Application process and procedure of the proposed method were described by a case of CNC machine tools design. The case study results revealed that the representative affective dimensions were selected effectively and the overall structure was preserved using the proposed approach.
Key words:factor analysis; cluster analysis; affective dimensions; image word pair
中圖分類號(hào):TH166 ;TG506
文獻(xiàn)標(biāo)識(shí)碼:A
作者簡(jiǎn)介:劉征宏(1987—),男,湖南邵陽(yáng)人,貴州大學(xué)博士研究生,研究方向?yàn)橄冗M(jìn)制造模式及制造信息系統(tǒng)、數(shù)字化設(shè)計(jì)與制造,(E-mail) zehoo_liu@163.com。
*基金項(xiàng)目:國(guó)家自然科學(xué)基金(51475097);國(guó)家自然科學(xué)基金(51465007);國(guó)家科技支撐計(jì)劃(2014BAH05F01);貴州省科技計(jì)劃(黔科合Z字[2013]4005,黔科合J字[2013]2108,黔科合LH字[2014]7644);黔發(fā)改投資([2012]2484);貴州大學(xué)基金項(xiàng)目(貴大人基合字[2012]009)
收稿日期:2015-12-03;修回日期:2015-12-08
文章編號(hào):1001-2265(2016)03-0004-05
DOI:10.13462/j.cnki.mmtamt.2016.03.002