崔微
摘要:隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)廣告逐漸成為企業(yè)產(chǎn)品推廣的新途徑。通過在其網(wǎng)絡(luò)廣告中靈活的應用數(shù)據(jù)挖掘技術(shù),對不斷完善網(wǎng)絡(luò)廣告有積極的促進作用。因此,網(wǎng)站在其開發(fā)建設(shè)中要合理應用數(shù)據(jù)挖掘技術(shù),從而完善網(wǎng)絡(luò)廣告功能,進而獲得更大的經(jīng)濟效益。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)廣告;應用
網(wǎng)絡(luò)廣告是企業(yè)產(chǎn)品推廣的新途徑,在網(wǎng)絡(luò)廣告中靈活應用數(shù)據(jù)挖掘技術(shù),能實現(xiàn)網(wǎng)絡(luò)廣告的跨越式發(fā)展,使廣告效果更加突出。從事網(wǎng)站廣告設(shè)計的企業(yè)要根據(jù)客戶的需求,不斷分析研究數(shù)據(jù)挖掘技術(shù),并將其有效應用于具體的廣告設(shè)計開發(fā)中,使其真正為網(wǎng)絡(luò)廣告的發(fā)展提供技術(shù)性的支撐。
一、Web挖掘與網(wǎng)絡(luò)廣告概述
(一)Web挖掘技術(shù)及類型
1.Web挖掘技術(shù)
簡單來說,數(shù)據(jù)挖掘(Data Mining,DM)指的就是,通過應用算法來對關(guān)鍵信息和模型進行抽取(Knowledge discovery in database,KDD)的過程。數(shù)據(jù)挖掘技術(shù)對多種學科知識與技術(shù)的優(yōu)化,其中包含了數(shù)據(jù)庫、機器學習、可視化、等多種知識與技術(shù)。
Web挖掘技術(shù),通過對大型的數(shù)據(jù)庫中提取其隱藏的信息和知識,從而發(fā)現(xiàn)在數(shù)據(jù)庫中的數(shù)據(jù)之間潛在的模式,可以對其中最具價值的信息進行提?。徊椭到y(tǒng)處理大量的數(shù)據(jù),實現(xiàn)數(shù)據(jù)模型化。通過合理的應用數(shù)據(jù)挖掘技術(shù)可以幫助決策者對其系統(tǒng)中的數(shù)據(jù)之間潛在的關(guān)聯(lián)進行分析,從而為其對數(shù)據(jù)運行趨勢預測和決策提供幫助[1]。
從技術(shù)角度來看,數(shù)據(jù)挖掘就是要求技術(shù)人員能夠在海量的隨機數(shù)據(jù)中,發(fā)現(xiàn)具有有效的潛在價值信息的模式。
2.Web數(shù)據(jù)類型
常見的數(shù)據(jù)挖掘技術(shù)進行分類,根據(jù)不同的分類方法對其進行分類,通??梢赃M行如下的分類。根據(jù)數(shù)據(jù)挖掘任務之間差別,可以將其劃分為:分類或預測模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、序列模式發(fā)現(xiàn)以及異?;蜈厔莅l(fā)現(xiàn)等不同的Web數(shù)據(jù)類型;根據(jù)其數(shù)據(jù)挖掘?qū)ο蟛煌M行劃分,可以分為:關(guān)系數(shù)據(jù)庫、空間數(shù)據(jù)庫、文本數(shù)據(jù)庫以及多媒體數(shù)據(jù)等類型;也可以根據(jù)其挖掘的方法之間的差別,將其分為:統(tǒng)計方法、神經(jīng)網(wǎng)絡(luò)方法、機器學習方法和數(shù)據(jù)庫方法網(wǎng)。但是,就其數(shù)據(jù)挖掘模型的本質(zhì)來看,可以劃分為:預測性模型與描述性模型兩大類,在每一個大類下包含了該類模型一些常用的數(shù)據(jù)挖掘任務。
(二)網(wǎng)絡(luò)廣告
簡單來說,網(wǎng)絡(luò)廣告是在網(wǎng)絡(luò)上放廣告。廣告主可以通過網(wǎng)站,對其網(wǎng)頁上的文本鏈接、廣告條幅、多媒體等進行廣告投放,并進行多種方式的開發(fā)與利用。在該網(wǎng)頁中發(fā)布本企業(yè)的相關(guān)廣告,通過互聯(lián)網(wǎng)技術(shù)就可以將該廣告信息傳達到用戶方。在當前的經(jīng)濟發(fā)展中,與傳統(tǒng)的報紙、電視、雜志等廣告媒介相比,因為網(wǎng)絡(luò)廣告不受時間、空間的限制,只要能夠連接網(wǎng)絡(luò)就可以進行傳播,所以其更具有明顯的發(fā)展優(yōu)勢[2]。
隨著近年來,企業(yè)的產(chǎn)業(yè)升級與優(yōu)化,網(wǎng)絡(luò)廣告逐漸成為企業(yè)現(xiàn)代化經(jīng)營的重要戰(zhàn)略手段之一。很大一部分企業(yè),其進入網(wǎng)絡(luò)廣告領(lǐng)域的第一步,就是建立自己的企業(yè)網(wǎng)站。
二、Web 挖掘在網(wǎng)絡(luò)廣告定制中的應用
(一)Web 挖掘應用的必要性分析
不管是何種機構(gòu)和組成的網(wǎng)站,在其構(gòu)建之初就應該認識到,成功的網(wǎng)絡(luò)廣告,不僅是需要找到合適的業(yè)主,并構(gòu)建與之匹配的鏈接。僅僅這樣是不能吸引業(yè)主的,其還需要讓業(yè)主能夠看到網(wǎng)絡(luò)廣告的成效,并能根據(jù)廣告學的效果增加宣傳費。因此,這就需要網(wǎng)站在加強其自身建設(shè),擴展用戶群的時候,還能主動積極進行銷策略的調(diào)整,從而制定更加具有針對性的營銷策略,這樣才能牢牢的抓住廣告主。
在一些網(wǎng)絡(luò)廣告的設(shè)計中,客戶在點擊廣告后就可以進入廣告主頁,能夠?qū)V告信息進行更加詳細的了解。而點擊廣告進行瀏覽的客戶,往往是對該產(chǎn)品有潛在的興趣的,這也就使得廣告主愿意支付高額的網(wǎng)絡(luò)廣告費用。根據(jù)相關(guān)的數(shù)據(jù)顯示,日本著名的汽車公司豐田汽車公司,在其網(wǎng)絡(luò)廣告中,對于其每次廣告的曝光只愿意支付幾美分,但是對于該廣告每點擊一次,愿意付超出曝光數(shù)倍的價錢。一些具有較高的經(jīng)營眼光的廣告主已經(jīng)逐漸認識到,當前的網(wǎng)絡(luò)廣告只能增加曝光的次數(shù),其點擊數(shù)量的增長是很有限的。因此,網(wǎng)站要想獲得廣告主長期的投資,就要合理應用數(shù)據(jù)挖掘技術(shù),研究廣告主的廣告需求,從而為其提供周到的服務。對于一些自建網(wǎng)站的企業(yè)與商家,要通過合理的應用數(shù)據(jù)挖掘技術(shù),對其營銷和生產(chǎn)策略進行合理的調(diào)整,從而使企業(yè)獲得更多的經(jīng)濟效益[3]。
(二)Web 挖掘應用在網(wǎng)絡(luò)廣告定制中的注意事項
在網(wǎng)絡(luò)廣告設(shè)計的過程中,有人評價其就像散文,是可以實現(xiàn)將上下五千年,縱橫八萬里的管理、規(guī)范內(nèi)容都包括在內(nèi)的。優(yōu)質(zhì)的廣告和一篇成功的散文是一樣的,要具備散文“形散神不散”的特點。在當前的市場中,網(wǎng)絡(luò)廣告行業(yè)之間的競爭較為激烈,要想在競爭中取得的較好的成果。首先,就要比競爭對手更加了解客戶的心理與需求。通過應用現(xiàn)代信息技術(shù)和數(shù)據(jù)挖掘技術(shù),廣告主可以根據(jù)其經(jīng)營理念與經(jīng)營需求提供特定的信息,并能通過網(wǎng)站,有指向性的呈現(xiàn)給客戶,在不引起客戶的反感情緒的同時,還能就激發(fā)其好奇心理,使其進行詳細的了解。其次,還要求網(wǎng)絡(luò)公司能夠在現(xiàn)有的數(shù)據(jù)挖掘的基礎(chǔ)上,不斷加大數(shù)據(jù)分析力度,從而促進其自身發(fā)展,并能較好的滿足廣告主的經(jīng)營策略,實現(xiàn)雙贏。最后,要想真正實現(xiàn)數(shù)據(jù)挖掘工作的效用,還要不斷加強對企業(yè)、商業(yè)業(yè)務的深入了解,并能在實踐中總結(jié)數(shù)據(jù)分析經(jīng)驗。在企業(yè)中要優(yōu)勢專業(yè)的數(shù)據(jù)挖掘方面的專家,能夠?qū)iT負責數(shù)據(jù)分析和數(shù)據(jù)挖掘工作。
三、數(shù)據(jù)挖掘技術(shù)應用于網(wǎng)絡(luò)廣告的問題及解決辦法
(一)web使用現(xiàn)狀
通過在網(wǎng)絡(luò)廣告中應用數(shù)據(jù)挖掘技術(shù),可以使網(wǎng)站中的網(wǎng)絡(luò)廣告的互動性更強,更加婦幼創(chuàng)意,且可以有效地節(jié)約與控制成本,并能夠?qū)V告的實際效果進行準確的統(tǒng)計。這不僅可以保證廣告業(yè)主利益,也可以使網(wǎng)站和業(yè)主之間形成更加良好的合作關(guān)系,但是在其運行的過程中也存在一些問題,對網(wǎng)絡(luò)廣告的良性發(fā)展造成了一定的困擾與阻礙。
首先,在對數(shù)據(jù)挖掘技術(shù)的應用中,相關(guān)的技術(shù)工作人員對數(shù)據(jù)挖掘的認識還不夠全面,有部分技術(shù)人員認為,數(shù)據(jù)挖掘?qū)W(wǎng)絡(luò)廣告開發(fā)布不具實際意義,且其計算結(jié)果往往不夠準確與可靠;也有部分技術(shù)人員認為,通過應用數(shù)據(jù)挖掘技術(shù),可以獲得所有信息與知識。這兩種認識都比較極端。且數(shù)據(jù)技術(shù)挖掘需要大量的時間操作實施,并會產(chǎn)生大量的費用。如果不能考慮實際需求,就盲目地運用數(shù)據(jù)挖掘,也會給廣告主造成一定的經(jīng)濟負擔與壓力。
其次,網(wǎng)絡(luò)廣告的數(shù)據(jù)質(zhì)量存在一定的問題。因為數(shù)據(jù)挖掘中涉及到的數(shù)據(jù)信息數(shù)量龐大,因此就容易出現(xiàn)一些錯誤的或者是冗余的數(shù)據(jù),影像數(shù)據(jù)挖掘技術(shù)的正常開展。例如,在數(shù)據(jù)挖掘中存在數(shù)據(jù)缺值的現(xiàn)象,就不能準確的反映數(shù)據(jù)的屬性和特征。
再次,在其選取技術(shù)方法時也存在一定的問題。在進行技術(shù)挖掘的過程中,因為應用不同的挖掘技術(shù),其所針對的主題也是存在一定的差異。因此,選取合適的技術(shù)方就有重要的意義。但是在其實際的數(shù)據(jù)挖掘的過程中,一些技術(shù)人員在處理一些比較復雜的數(shù)據(jù)對象時,使用決策樹的方法,往往效果不夠理想,可以采取同神經(jīng)網(wǎng)絡(luò)和遺傳算法則相結(jié)合的方法,從而獲得較為滿意的結(jié)果[4]。
最后,對客戶的個人隱私泄漏問題。在當前的社會市場經(jīng)濟發(fā)展過程中,市場中還出現(xiàn)了一批商業(yè)信息供應商,因此,就很容易獲得用戶所需的地理信息、人口統(tǒng)計和家庭背景等數(shù)據(jù)信息。尤其是在一些客戶使用信用卡、醫(yī)療卡等過程中,該客戶的職業(yè)、年齡以及工資等相關(guān)信息,都可能被泄漏。而且網(wǎng)絡(luò)中可以通過多種渠道獲得個人隱私,也可能被一些不法分子利用,進行違法的活動。數(shù)據(jù)安全問題,也是當前人們在數(shù)據(jù)網(wǎng)絡(luò)中最為關(guān)注的問題,這也是在進行數(shù)據(jù)挖掘中需要注意的問題。
(二)解決對策
1.解決問題的具體方法
首先,采取數(shù)據(jù)集預處理的方法
因為在其原始的數(shù)據(jù)庫中的數(shù)據(jù)信息存在一定的問題,因此,就很有必要在其實施數(shù)據(jù)挖掘算法之前,把原始數(shù)據(jù)集進行一定的處理,這個處理數(shù)據(jù)的過程就是數(shù)據(jù)預處理。通過采取數(shù)據(jù)預處理的方法,不僅可以保證挖掘數(shù)據(jù)的正確性和有效性,還能在數(shù)據(jù)挖掘前,就對其數(shù)據(jù)格式和內(nèi)容進行調(diào)整,從而能夠使其數(shù)據(jù)庫內(nèi)的數(shù)據(jù)信息,更加符合數(shù)據(jù)挖掘需求。
在數(shù)據(jù)挖掘的過程中,往往存在數(shù)據(jù)庫中的數(shù)據(jù)受到噪聲數(shù)據(jù)、不一致數(shù)據(jù)以及丟失數(shù)據(jù)的阻礙,而不能直接滿足數(shù)據(jù)挖掘的需求。且在數(shù)據(jù)挖掘時,需要處理海量的數(shù)據(jù)信息,對其運行效率也會產(chǎn)生一定的影響,且其中的噪聲干擾還會影響挖掘結(jié)果,使之存在一定偏差。
其次,構(gòu)建欺詐點擊檢測模型。有部分客戶在點擊網(wǎng)絡(luò)廣告時,不可避免的會遇到一些虛假廣告與欺詐信息,從而對該網(wǎng)絡(luò)廣告產(chǎn)生反感與厭惡之情。因此,就很有必要構(gòu)建欺詐點擊檢測模式。通過在網(wǎng)站系統(tǒng)中建立起數(shù)據(jù)采集→初步
評估→評估修正→數(shù)據(jù)存儲→信息反饋的欺詐點擊檢測模塊,對廣告信息進行及時的存儲、評估,并能及時對該點擊數(shù)據(jù)進行分析,看其是否具備欺詐性質(zhì),進而進行進一步的分析,對初步評估信息進行修正,最后將數(shù)據(jù)進行收集與存儲,從而形成完整的反饋信息,并將該信息告知廣告聯(lián)盟,并能根據(jù)相關(guān)的數(shù)據(jù)分析結(jié)果,向廣告主退還相應對的廣告費用[5]。
2.解決策略的有效作用
通過應用構(gòu)建欺詐點擊檢測模型,以及數(shù)據(jù)預處理的方法,可以有效的減少數(shù)據(jù)挖掘的障礙,提高數(shù)據(jù)額挖掘結(jié)果的準確性,并能保證網(wǎng)絡(luò)廣告的質(zhì)量,從而吸引更多的廣告主。
結(jié)束語
綜上所述,僅僅通過數(shù)據(jù)挖掘技術(shù)就想獲得較好的網(wǎng)絡(luò)廣告效果,就目前的技術(shù)水平來看,仍舊是不能實現(xiàn)的,還需要網(wǎng)站企業(yè)不斷加強對數(shù)據(jù)挖掘技術(shù)的開發(fā)與發(fā)展,根據(jù)企業(yè)與用戶的需求對其進行合理的設(shè)計,同時,還要加強企業(yè)的各個部門之間的互相協(xié)作,進一步提高網(wǎng)絡(luò)廣告的質(zhì)量。(作者單位:百度時代網(wǎng)絡(luò)科技有限公司)
參考文獻:
[1]李凱,嚴建援,林漳希.信息系統(tǒng)領(lǐng)域網(wǎng)絡(luò)精準廣告研究綜述[J].南開管理評論,2015(2)
[2]吳九雄.Web挖掘在電子商務中的應用研究[J],信息系統(tǒng)工程.2010(01)
[3]王海清,楊英飛.淺談Web挖掘在電子商務中的應用[J].東方企業(yè)文化,2012(06)
[4]李愛春,滕少華.Web挖掘在網(wǎng)絡(luò)廣告點擊欺詐檢測中的應用[J].計算機工程與設(shè)計,2012(3)
[5]褚麗莉.基于Java的搜索引擎技術(shù)在Web信息挖掘中的應用[J].遼寧工程技術(shù)大學學報(自然科學版),2010(5)