蔡皎潔
[摘要]本文從對多結(jié)構(gòu)化客戶數(shù)據(jù)集成和預(yù)處理的成效不足、挖掘過程缺乏語義情景和上下文的支撐,從而所獲取的客戶知識(shí)模式質(zhì)量不高等問題出發(fā),提出了一種基于語義集成的客戶知識(shí)挖掘模型。該模型充分利用了本體、語義集成等方法和技術(shù),提高對數(shù)據(jù)語義分析和處理的能力,實(shí)現(xiàn)智能化客戶知識(shí)挖掘過程,從而獲取高質(zhì)量的客戶知識(shí)模式。
[關(guān)鍵詞]語義集成;客戶知識(shí);知識(shí)挖掘;領(lǐng)域本體
[中圖分類號(hào)]TP311 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821(2014)11-0039-05
網(wǎng)絡(luò)經(jīng)濟(jì)時(shí)代以“客戶服務(wù)為中心”的經(jīng)營理念表現(xiàn)得尤為突出,客戶不再是傳統(tǒng)經(jīng)濟(jì)模式中企業(yè)產(chǎn)品的被動(dòng)接受者,而是廣泛參與企業(yè)經(jīng)營流程的主導(dǎo)者,客戶需求精確化的個(gè)性化服務(wù),渴望企業(yè)能夠理解、關(guān)懷甚至是激發(fā)其潛在的興趣,因此從客戶數(shù)據(jù)中深度挖掘客戶興趣模式已成為企業(yè)成功開展電子商務(wù)的重要戰(zhàn)略思想和技術(shù)手段。然而,電子商務(wù)環(huán)境中,企業(yè)與客戶交互中所產(chǎn)生的數(shù)據(jù)量不斷攀升、數(shù)據(jù)結(jié)構(gòu)也不斷地復(fù)雜化,常用的數(shù)據(jù)挖掘工具已不能滿足企業(yè)發(fā)現(xiàn)有趣的客戶興趣模式的需求,提升客戶知識(shí)挖掘流程的質(zhì)量已勢在必行。本文引用領(lǐng)域本體技術(shù),在異構(gòu)客戶數(shù)據(jù)上重新建立一個(gè)“層”,用于對客戶數(shù)據(jù)的組織和梳理,實(shí)施基于語義的數(shù)據(jù)挖掘流程,提升所獲取的客戶知識(shí)模式的質(zhì)量。
1、語義集成與客戶知識(shí)挖掘的研究綜述
上世紀(jì)90年代中期到現(xiàn)在,數(shù)據(jù)集成研究的焦點(diǎn)已從解決系統(tǒng)異構(gòu)、結(jié)構(gòu)異構(gòu)逐漸發(fā)展到解決語義異構(gòu)問題上。國內(nèi)外有關(guān)基于本體的異構(gòu)數(shù)據(jù)語義集成的研究,從策略上主要有:基于領(lǐng)域本體的方法和基于本體映射的方法兩種。Arens Y.等人提出SIMS系統(tǒng),該系統(tǒng)構(gòu)建了一個(gè)全局本體來描述信息資源的內(nèi)容、數(shù)據(jù)模型和查詢語言等。斯丹福大學(xué)的SKC項(xiàng)目,通過在多個(gè)數(shù)據(jù)源上建立不同本體,然后在這些本體之上建立一個(gè)代數(shù)系統(tǒng),用這個(gè)代數(shù)系統(tǒng)來實(shí)現(xiàn)各本體之間的操作,從而達(dá)到異構(gòu)數(shù)據(jù)源之間的互操作。厲浩提出基于本體的數(shù)據(jù)集成框架模型,為所有的數(shù)據(jù)源建立全局本體,再為每個(gè)數(shù)據(jù)源建立局部本體,定義本體與本體、本體與數(shù)據(jù)源之間的映射。
目前,國內(nèi)外有關(guān)客戶知識(shí)挖掘的研究已充分考慮到了客戶情景和客戶隱性知識(shí)的重要作用。美國加州大學(xué)ISI研究所開發(fā)的EXPECT系統(tǒng)。其核心思想是基于本體來輔助獲取知識(shí),用于建立領(lǐng)域知識(shí)的知識(shí)獲取環(huán)境。德國Karlsruhe大學(xué)MFB研究所開發(fā)的一個(gè)建立在本體基礎(chǔ)上的知識(shí)管理原型系統(tǒng)OKMS,它側(cè)重于3個(gè)方面的研究:采用本體映射建立分布式異構(gòu)本體間的集成機(jī)制;設(shè)計(jì)和開發(fā)管理本體演化的方法論;采用封裝機(jī)制將企業(yè)已有的大量知識(shí)源提升到本體級(jí)。Bloehdom等提出了OTYO框架,該框架集成了領(lǐng)域本體的構(gòu)建和基于領(lǐng)域本體的文本挖掘兩大部分,當(dāng)領(lǐng)域本體構(gòu)建好之后,其中部件會(huì)對文檔進(jìn)行概念分析,提取概念特征,然后在此基礎(chǔ)上進(jìn)行相應(yīng)的文本挖掘,從而發(fā)現(xiàn)蘊(yùn)含其中的文本間、或文本中概念間的語義關(guān)系。Yufeng Li和Ning Zhong構(gòu)建了一種基于本體的Web挖掘框架,它是一個(gè)包含4個(gè)部分的循環(huán)框架,分別是:數(shù)據(jù)挖掘、知識(shí)表示、知識(shí)推理和知識(shí)進(jìn)化,主要是基于用戶約束和元數(shù)據(jù)實(shí)施數(shù)據(jù)挖掘,然后基于本體把那些語義模糊、重復(fù)、歧義的規(guī)則模式進(jìn)行改正。
總結(jié)上述國內(nèi)外研究成果可知,知識(shí)挖掘研究領(lǐng)域與本體技術(shù)研究領(lǐng)域充分結(jié)合起來,充分利用本體技術(shù)來進(jìn)行知識(shí)組織,解決多個(gè)數(shù)據(jù)源之間的語義異構(gòu)問題,實(shí)現(xiàn)語義集成,即在知識(shí)挖掘的數(shù)據(jù)預(yù)處理階段起到了公共語義描述的作用。但是,如何實(shí)現(xiàn)對多結(jié)構(gòu)化的數(shù)據(jù)的低成本、高效率的語義集成,仍是知識(shí)挖掘領(lǐng)域研究的重點(diǎn)問題。
2、基于語義集成的客戶知識(shí)挖掘模型
按照系統(tǒng)論的觀點(diǎn),模型是將真實(shí)系統(tǒng)(原型)的本質(zhì)屬性,用適當(dāng)?shù)谋憩F(xiàn)形式(例如文字、符號(hào)、圖表、實(shí)物、數(shù)據(jù)公式等)描述出來的結(jié)果,一般不是真實(shí)系統(tǒng)的本身,而是對真實(shí)系統(tǒng)的描述、模仿或抽象。客戶知識(shí)挖掘是一個(gè)復(fù)雜的過程,涉及了挖掘任務(wù)的復(fù)雜性、客戶數(shù)據(jù)的海量異構(gòu)性、知識(shí)挖掘方法和技術(shù)多重選擇性、客戶知識(shí)模式的可理解性、重用性和共享性以及客戶知識(shí)挖掘系統(tǒng)的更新性等多個(gè)方面。采用模型構(gòu)建的方法,可以將研究問題抽象化、簡明化,有助于我們研究的系統(tǒng)化、模塊化、定量化。
2.1 企業(yè)對客戶知識(shí)獲取的需求分析
電子商務(wù)環(huán)境中,隨著客戶個(gè)性化需求趨勢的增長,網(wǎng)絡(luò)信息技術(shù)的發(fā)展也促使企業(yè)與客戶交互渠道日益網(wǎng)絡(luò)化和多元化,普通的以日??蛻魯?shù)據(jù)操作管理為目標(biāo)的客戶關(guān)系維護(hù)策略已不再適應(yīng)該環(huán)境,難以獲得良好的客戶忠誠度和滿意度,因此企業(yè)需要全面、有效、內(nèi)涵表達(dá)準(zhǔn)確的客戶知識(shí)來維系高質(zhì)量的客戶關(guān)系。另外,客戶數(shù)據(jù)每日都會(huì)成幾何級(jí)數(shù)的倍數(shù)不斷上升,而且這些客戶數(shù)據(jù)結(jié)構(gòu)多樣化、語義異構(gòu)化,為客戶知識(shí)的有效獲取設(shè)置了多重障礙。雖然數(shù)據(jù)挖掘理念和技術(shù)的出現(xiàn)可從一定程度上解決該問題,但多數(shù)數(shù)據(jù)挖掘工具和數(shù)據(jù)倉庫技術(shù)等在客戶數(shù)據(jù)預(yù)處理部分,由于缺少一個(gè)領(lǐng)域共享概念模型的形式化規(guī)范說明體系的支持,對客戶數(shù)據(jù)語義異構(gòu)的處理并不理想,這就造成了在低質(zhì)量客戶數(shù)據(jù)基礎(chǔ)上所生成的客戶知識(shí)模式有效性降低的問題。
因此,在基于語義集成的客戶知識(shí)挖掘模型構(gòu)建中,引入企業(yè)本體對異構(gòu)客戶數(shù)據(jù)進(jìn)行語義集成,在此基礎(chǔ)上實(shí)施客戶知識(shí)挖掘過程,優(yōu)點(diǎn)有:一是由于在基于企業(yè)本體對客戶數(shù)據(jù)語義集成過程中已完成了對數(shù)據(jù)的清洗工作,因此基于語義集成的客戶知識(shí)挖掘過程可以省略該階段,進(jìn)而提高了整體客戶知識(shí)挖掘過程運(yùn)行的效率;二是基于企業(yè)本體語義集成處理后的客戶數(shù)據(jù)語義表達(dá)一致,并在一定概念層次上具備了語義關(guān)系,因此客戶知識(shí)挖掘的目的是運(yùn)用挖掘方法和算法獲取更廣或更深概念層次數(shù)據(jù)間的語義關(guān)系,進(jìn)一步澄清客戶數(shù)據(jù)所描述事物之間的本質(zhì)聯(lián)系,提高所獲取的客戶知識(shí)模式的質(zhì)量。
2.2 基于語義集成的客戶知識(shí)挖掘模型分析endprint
基于語義集成的客戶知識(shí)挖掘模型如圖1所示,該模型是一個(gè)循環(huán)的體系,目標(biāo)是對基于企業(yè)本體的客戶數(shù)據(jù)語義集成結(jié)果上,依據(jù)客戶知識(shí)挖掘任務(wù),運(yùn)用相關(guān)知識(shí)挖掘方法和算法進(jìn)一步澄清語義集成后的客戶數(shù)據(jù)中或已獲取的客戶知識(shí)模式中所描述的對象及對象關(guān)系間的本質(zhì),挖掘具有潛藏語義關(guān)系的、更符合決策者需求的客戶知識(shí)模式。其中包括了有價(jià)值客戶數(shù)據(jù)收集與語義集成模塊、異構(gòu)客戶數(shù)據(jù)語義集成結(jié)果分析模塊、基于語義集成的客戶知識(shí)挖掘模塊、客戶知識(shí)處理模塊、客戶知識(shí)存儲(chǔ)模塊和客戶知識(shí)應(yīng)用模塊六大循環(huán)模塊。各模塊的作用和模塊之間的關(guān)系介紹如下:
2.2.1 有價(jià)值客戶數(shù)據(jù)收集與語義集成模塊
該模塊是整個(gè)模型構(gòu)建的核心和基礎(chǔ),目的是為客戶知識(shí)挖掘過程提供實(shí)施語義異構(gòu)集成后的客戶數(shù)據(jù),以提高知識(shí)挖掘技術(shù)等對客戶數(shù)據(jù)分析、挖掘的質(zhì)量,減少數(shù)據(jù)清洗工作,提高知識(shí)挖掘過程的效率。
(1)有價(jià)值客戶數(shù)據(jù)收集
有效甄別客戶價(jià)值,有利于企業(yè)更好地實(shí)施“一對一”的個(gè)性化服務(wù)策略,降低客戶數(shù)據(jù)語義集成的工作量和復(fù)雜度。本文采用從客戶和企業(yè)的雙重視角。按兩次甄別的程序展開,其主要內(nèi)容如下:
①從客戶角度實(shí)施初次甄別
初次甄別主要從客戶人口統(tǒng)計(jì)特征、客戶需求與購買動(dòng)機(jī)以及客戶購買行為3個(gè)方面展開。客戶的人口統(tǒng)計(jì)特征包括客戶的年齡、婚姻、職業(yè)、性別、收入、教育程度、家庭生命周期、國籍、民族、宗教、社會(huì)階層等,不同年齡、受教育程度不同的客戶在價(jià)值觀念、生活情趣、審美觀念和消費(fèi)方式等方面會(huì)有很大的差異,而家庭人口和收入差異,也同樣會(huì)導(dǎo)致消費(fèi)的觀念不同。企業(yè)在設(shè)計(jì)產(chǎn)品之初就決定了它的有價(jià)值客戶人口統(tǒng)計(jì)特征,如產(chǎn)品的價(jià)格、品牌價(jià)值等因素會(huì)自然帶動(dòng)與其匹配的客戶的消費(fèi)意識(shí),而那些人口統(tǒng)計(jì)特征與企業(yè)產(chǎn)品營銷戰(zhàn)略匹配程度差異較大,但卻發(fā)生偶爾購買行為的客戶價(jià)值較低。
消費(fèi)者需求是指消費(fèi)者生理和心理上的匱乏狀態(tài),即感到缺少些什么,從而想獲得它們的狀態(tài)。動(dòng)機(jī)是“引起個(gè)體活動(dòng),維持已引起的活動(dòng),并促使活動(dòng)朝向某一有價(jià)值進(jìn)行的內(nèi)在作用”。在人口統(tǒng)計(jì)特征類似、消費(fèi)環(huán)境類似的條件下,客戶所產(chǎn)生購買行為的差異證明隱藏在其背后動(dòng)機(jī)的強(qiáng)弱,而動(dòng)機(jī)較弱的客戶應(yīng)該在主導(dǎo)動(dòng)機(jī)和非主導(dǎo)動(dòng)機(jī)之外,這些客戶價(jià)值較低。
不同的客戶人口統(tǒng)計(jì)特征及消費(fèi)動(dòng)機(jī)都會(huì)產(chǎn)生不同的購買行為。我們可從客戶購買行為變量中簡單地對客戶進(jìn)行歸類,如從企業(yè)CRM系統(tǒng)記錄中查詢客戶購買產(chǎn)品的頻次、頻次累積最高的時(shí)間長度、一次購買產(chǎn)品的數(shù)量、一次支付產(chǎn)品的價(jià)格等變量,還可通過瀏覽Web使用記錄等方式查閱客戶網(wǎng)購行為變量,如客戶登錄站點(diǎn)的方式、客戶停留某頁面的時(shí)間、客戶停留站點(diǎn)的時(shí)間、客戶是否有添加收藏夾、客戶是否有復(fù)制、粘貼、客戶是否有放入購物車及客戶是否有電子支付等行為變量。這些客戶行為變量都與客戶購買行為密切相關(guān),而行為變量值較低的客戶價(jià)值就較低。
②從企業(yè)角度實(shí)施二次甄別
若僅從客戶角度來劃分客戶價(jià)值,則忽略了企業(yè)成本,二次甄別的方法主要采用考察客戶生命周期價(jià)值的高低,即從企業(yè)盈利的角度出發(fā)來研究企業(yè)從客戶身上所獲得的價(jià)值。關(guān)于客戶生命周期價(jià)值(CLV)的計(jì)算模型,這里引用Paul D.Berger和Nada I.Nasr(1998)和陳明亮(2001)定義的計(jì)算模型,公式為:
其中,在第t年客戶的凈利潤函數(shù)是P(t),客戶保持率是r,客戶生命周期時(shí)間長度為n,折現(xiàn)率為d。其中,客戶保持率的大小直接代表了客戶滿意度,而客戶的高滿意度產(chǎn)生客戶對產(chǎn)品的高感知價(jià)值,即從客戶角度出發(fā)的客戶讓渡價(jià)值直接相關(guān)。
由此可見,在制定有價(jià)值客戶甄別方案時(shí),應(yīng)從客戶和企業(yè)兩個(gè)角度出發(fā),并兼顧彼此,不斷細(xì)化高、中低和無價(jià)值客戶群體,分別將相對應(yīng)的客戶數(shù)據(jù)進(jìn)行歸類整理,為以后客戶知識(shí)挖掘應(yīng)用做好客戶數(shù)據(jù)準(zhǔn)備。
(2)有價(jià)值客戶數(shù)據(jù)語義集成
主要對兩種比較常見的客戶關(guān)系型數(shù)據(jù)庫數(shù)據(jù)和Web文本數(shù)據(jù),在參照領(lǐng)域本體全局概念體系的基礎(chǔ)上,實(shí)施了語義集成過程。其主要內(nèi)容如下:
①參照企業(yè)本體全局概念體系構(gòu)建基于語義的數(shù)據(jù)倉庫元數(shù)據(jù),指導(dǎo)數(shù)據(jù)倉庫ETL過程,實(shí)現(xiàn)客戶關(guān)系數(shù)據(jù)庫的語義集成。即通過本體學(xué)習(xí)的方法為每個(gè)語義異構(gòu)的客戶關(guān)系數(shù)據(jù)庫構(gòu)建子領(lǐng)域本體,通過本體映射方法對這些子領(lǐng)域本體與企業(yè)本體的映射過程轉(zhuǎn)換生成基于語義的元數(shù)據(jù)。
②參照企業(yè)本體全局概念體系構(gòu)建Web文本語義分析和標(biāo)注策略,實(shí)現(xiàn)Web文本的語義集成。即基于企業(yè)本體的概念體系對每個(gè)Web文本進(jìn)行語義分析和標(biāo)注,從中學(xué)習(xí)Web文本中的概念和概念間的關(guān)系。
2.2.2 客戶數(shù)據(jù)語義集成結(jié)果分析模塊
基于企業(yè)本體對異構(gòu)客戶數(shù)據(jù)語義集成的過程,即是發(fā)現(xiàn)客戶數(shù)據(jù)所描述事物之間語義關(guān)系的過程,因此該集成結(jié)果中包含了一定概念層次上的客戶知識(shí)模式。該模塊主要功能是針對具體的客戶知識(shí)挖掘任務(wù),完成對異構(gòu)客戶數(shù)據(jù)語義集成結(jié)果中已形成的客戶知識(shí)模式的整理、分析和獲取。主要由人工方式(如領(lǐng)域?qū)<业龋{經(jīng)驗(yàn)從中獲取與客戶知識(shí)挖掘任務(wù)相關(guān)的、語義關(guān)系清晰的、有價(jià)值的客戶知識(shí)模式。采用的主要方法通常有概念描述、歸納總結(jié)及統(tǒng)計(jì)等。由人工方式對客戶數(shù)據(jù)語義集成結(jié)果中所形成的客戶知識(shí)模式進(jìn)行刪選和總結(jié),這樣做可以避免客戶知識(shí)挖掘過程的重復(fù)工作。而針對具體客戶知識(shí)挖掘任務(wù),無法用人工方式從帶有語義標(biāo)簽的客戶數(shù)據(jù)中發(fā)現(xiàn)的客戶知識(shí)模式,將交給基于語義集成的客戶知識(shí)挖掘模塊使用更為復(fù)雜的方法和算法來發(fā)現(xiàn)具有潛藏語義關(guān)系的客戶知識(shí)模式。該模塊的處理結(jié)果可直接輸入到客戶知識(shí)存儲(chǔ)模塊中。
2.2.3 基于語義集成的客戶知識(shí)挖掘模塊
該模塊主要功能是基于異構(gòu)客戶數(shù)據(jù)語義集成基礎(chǔ)上,并在具體的客戶知識(shí)挖掘任務(wù)的約束下,從客戶數(shù)據(jù)語義集成結(jié)果分析模塊中,提取相關(guān)的、帶有語義標(biāo)簽的客戶數(shù)據(jù),進(jìn)而選擇相關(guān)的知識(shí)挖掘方法和算法,將這些客戶數(shù)據(jù)轉(zhuǎn)換成有利于知識(shí)挖掘方法和算法實(shí)施的格式,從中挖掘潛藏的、有價(jià)值的、語義關(guān)系更符合挖掘任務(wù)需求的客戶知識(shí)模式。另外,該模塊還可以完成針對具體的客戶知識(shí)挖掘任務(wù)和決策者的要求,提取客戶知識(shí)存儲(chǔ)模塊中的相關(guān)客戶知識(shí)源再次進(jìn)行挖掘,以發(fā)現(xiàn)這些客戶知識(shí)源中具有更廣或更深概念層次和關(guān)系的、潛藏的和有價(jià)值的客戶知識(shí)模式。該模塊的處理結(jié)果直接輸入到客戶知識(shí)處理模塊中,有待進(jìn)一步的調(diào)整和優(yōu)化。endprint
2.2.4 客戶知識(shí)處理模塊
該模塊主要功能是針對具體客戶知識(shí)挖掘任務(wù)和決策者的需求,對基于語義集成的客戶知識(shí)挖掘模塊中所輸出的初始客戶知識(shí)模式進(jìn)行調(diào)整和優(yōu)化,以進(jìn)一步提高其質(zhì)量和有效性,主要包括客戶知識(shí)模式的調(diào)整和優(yōu)化兩個(gè)階段。該模塊的處理結(jié)果如果能讓決策者滿意,就直接輸入到客戶知識(shí)存儲(chǔ)模塊中;若結(jié)果并不能讓決策者滿意,則作為客戶數(shù)據(jù)語義和數(shù)據(jù)間語義關(guān)系的澄清結(jié)果輸入到客戶數(shù)據(jù)語義集成結(jié)果分析模塊中,針對具體的客戶知識(shí)挖掘任務(wù)再次進(jìn)行新一輪的分析或挖掘,一是讓領(lǐng)域?qū)<腋玫匕l(fā)現(xiàn)客戶數(shù)據(jù)間的語義關(guān)系,以便發(fā)現(xiàn)更有價(jià)值的客戶知識(shí)模式;二是若人工手段無法完成,則進(jìn)入下一輪的客戶知識(shí)挖掘過程中。
2.2.5 客戶知識(shí)存儲(chǔ)模塊
該模塊主要功能是存儲(chǔ)由客戶數(shù)據(jù)語義集成結(jié)果分析模塊中由人工方式可以直接獲取的客戶知識(shí)模式、由客戶知識(shí)處理模塊提交的已經(jīng)調(diào)整和優(yōu)化良好的、更加具有實(shí)用價(jià)值的客戶知識(shí)模式、以及來自于對客戶知識(shí)存儲(chǔ)模塊中客戶知識(shí)源的二次挖掘所生成的、具有更廣或更深概念邏輯關(guān)系的、更符合決策者需求的客戶知識(shí)模式。
2.2.6 客戶知識(shí)應(yīng)用模塊
該模塊主要完成對來自于客戶知識(shí)存儲(chǔ)模塊中的客戶知識(shí)模式的共享、重用和創(chuàng)新,前提是對這些客戶知識(shí)模式要有良好的解釋。本文提出以語義網(wǎng)絡(luò)為載體表示本體形式化內(nèi)容的方式來解釋客戶知識(shí)模式,并從客戶主觀認(rèn)知的角度,對客戶知識(shí)模式中所描述的概念及概念間關(guān)系賦予興趣度權(quán)值。在這個(gè)過程中企業(yè)會(huì)利用原有客戶知識(shí)模式產(chǎn)生新的客戶信息或知識(shí),那么依據(jù)企業(yè)市場營銷目標(biāo),這些有關(guān)客戶信息或知識(shí)可作為新的客戶數(shù)據(jù)來源直接輸入到有價(jià)值客戶數(shù)據(jù)收集和語義集成模塊中;另外,這些客戶信息或知識(shí)也會(huì)涉及最新企業(yè)信息中包含的概念語義和語義關(guān)系,可補(bǔ)充或更新企業(yè)本體,進(jìn)而達(dá)到對整個(gè)基于語義集成的客戶知識(shí)挖掘模型的更新。
3、總結(jié)與展望
本文從電子商務(wù)環(huán)境中,客戶知識(shí)挖掘領(lǐng)域所面臨的主要問題出發(fā):一是客戶知識(shí)挖掘過程中所面對的數(shù)據(jù)量不斷增大、數(shù)據(jù)結(jié)構(gòu)日益復(fù)雜化,單靠目前市面上常用的數(shù)據(jù)挖掘工具已不能滿足企業(yè)對高質(zhì)量客戶知識(shí)模式的需求;二是支撐客戶知識(shí)挖掘過程的情景及上下文中缺乏語義環(huán)境,如實(shí)施基于數(shù)據(jù)倉庫的關(guān)系型數(shù)據(jù)庫數(shù)據(jù)挖掘,E1L過程缺乏基于語義的元數(shù)據(jù)支撐;實(shí)施文本數(shù)據(jù)挖掘,在關(guān)鍵詞的抽取過程中,缺乏考慮關(guān)鍵詞之間的語義關(guān)系等,這些因素均會(huì)導(dǎo)致所獲取的客戶知識(shí)模式質(zhì)量低下的原因。因此,本文構(gòu)建了基于語義集成的客戶知識(shí)挖掘模型,利用基于領(lǐng)域本體的異構(gòu)數(shù)據(jù)語義集成的策略和方法,融合到客戶知識(shí)挖掘過程中,在客戶數(shù)據(jù)語義標(biāo)注的前提下,實(shí)施精準(zhǔn)化的客戶知識(shí)挖掘過程,提高所獲取的客戶知識(shí)模式的質(zhì)量。有關(guān)基于語義集成的客戶知識(shí)挖掘過程、異構(gòu)客戶數(shù)據(jù)語義集成方法和流程、領(lǐng)域本體構(gòu)建和學(xué)習(xí)等內(nèi)容將在后期不斷做出研究。endprint