国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)廣告點擊率預(yù)估的特征學(xué)習(xí)及技術(shù)研究進展

2019-10-16 01:11:46劉華玲惲文婧林蓓丁宇杰
關(guān)鍵詞:點擊率預(yù)估特征

劉華玲,惲文婧,林蓓,丁宇杰

(1.上海對外經(jīng)貿(mào)大學(xué)統(tǒng)計與信息學(xué)院,上海201620;2.上海財經(jīng)大學(xué)信息管理與工程學(xué)院,上海200433)

隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,廣告形式趨于多樣化,從線下發(fā)展到線上,網(wǎng)絡(luò)廣告作為互聯(lián)網(wǎng)商業(yè)模式中的主流盈利模式,市場規(guī)模超過3 000億。其中,搜索廣告和電商廣告在互聯(lián)網(wǎng)廣告中占比最高,以其巨大的商業(yè)和研究價值成為計算廣告學(xué)備受關(guān)注的研究對象。

據(jù)艾瑞咨詢發(fā)布的《2017年Q3中國網(wǎng)絡(luò)廣告及細分媒體市場數(shù)據(jù)發(fā)布研究報告》,搜索廣告,包括關(guān)鍵字廣告及聯(lián)盟廣告;電商廣告,包括垂直搜索類廣告和展示類廣告[1]。搜索廣告,根據(jù)用戶主動輸入的查詢關(guān)鍵詞獲取用戶意圖和興趣點,而展示類廣告僅依據(jù)用戶歷史行為得到興趣標(biāo)簽。谷歌在售賣關(guān)鍵詞競價廣告產(chǎn)品AdWords時,通過給用戶投放點擊率高和出價高的廣告來獲得營收。淘寶直通車采用同樣的eCPM排序方式,投放點擊率較高的廣告,提升賣家產(chǎn)品轉(zhuǎn)化率,從而提高收益[2]。因此,點擊率(click through tate,CTR)是衡量廣告變現(xiàn)能力的一個重要指標(biāo)。

如今,海量用戶數(shù)據(jù)給網(wǎng)絡(luò)廣告的精準(zhǔn)投放提供了可能,隨著工業(yè)界和學(xué)術(shù)界對廣告點擊率轉(zhuǎn)化問題的進一步研究,有必要對相關(guān)文獻進行系統(tǒng)梳理,通過分析總結(jié)國內(nèi)外廣告點擊率轉(zhuǎn)化的研究現(xiàn)狀,探討針對提高廣告投放中投資回報率(ROI)的研究展望。目前可見的關(guān)于廣告點擊率預(yù)估的文獻綜述有紀(jì)文迪等[3]的研究。筆者在“中國知網(wǎng)”以“點擊率預(yù)估”“特征工程+廣告”等作為主題和在arXiv電子預(yù)印本文獻庫以“CTR”為主題進行檢索,對檢索結(jié)果進行篩選,發(fā)現(xiàn)該領(lǐng)域文獻的研究內(nèi)容大致可分為4類:原始數(shù)據(jù)特點及解決方法、點擊率預(yù)估的特征學(xué)習(xí)、點擊率預(yù)估模型的構(gòu)建、評價指標(biāo)的選?。ㄒ妶D1)。

圖1 網(wǎng)絡(luò)廣告點擊率預(yù)估綜述框架圖Fig.1 The framework of online advertising click rate estimation review

1 關(guān)于網(wǎng)絡(luò)廣告原始數(shù)據(jù)特點的研究

網(wǎng)絡(luò)廣告原始數(shù)據(jù)具有高維稀疏性,且類別分布不均衡(正負比例相差較大)。下文將對此兩特點進行分類綜述。

1.1 特征數(shù)據(jù)高維稀疏

目前,主流的解決數(shù)據(jù)稀疏問題的方法有矩陣分解、機器學(xué)習(xí)算法、潛語義模型等。

張志強等[4]提出基于張量分解的方法實現(xiàn)特征降維。而矩陣分解是張量分解的特殊形式。潘博等[5]和魏曉航等[6]利用因子分解機模型(factorization machine models)自動擬合特征間的交互,該模型是由RENDLE[7]提出的一種基于矩陣分解的機器學(xué)習(xí)算法,該算法結(jié)合支持向量機和因子分解模型的優(yōu)點,具有線性復(fù)雜度和普適性,再結(jié)合Bagging和Boosting的集成思想進行集成學(xué)習(xí),來處理高維稀疏問題。JUAN等[8]提出了改進的FFM(field-aware factorization machine)模型,即在FM(factorization machine)模型中引入field的概念,將相同特征歸為同一field。

巴麒龍[9]使用應(yīng)對廣告數(shù)據(jù)的稀疏特征學(xué)習(xí)方法(advertising data-oriented sparse feature learning method,ADoSFLM),以解決數(shù)據(jù)高維稀疏的特征學(xué)習(xí)問題。ADoSFLM方法包括數(shù)據(jù)降維、復(fù)雜特征學(xué)習(xí)和CTR預(yù)估模型3個環(huán)節(jié),本文只討論數(shù)據(jù)降維環(huán)節(jié)。該方法采用基于距離的K均值聚類算法對提供的大類數(shù)據(jù)(如搜搜某實驗數(shù)據(jù)集中的查詢和廣告就是兩大類數(shù)據(jù),而天池某比賽數(shù)據(jù)集中的基礎(chǔ)數(shù)據(jù)、廣告商品信息、用戶信息、上下文信息和店鋪信息就是五大類數(shù)據(jù))進行聚類,得到同一簇中對象相似度較高的初始聚合數(shù)據(jù),各大類的聚類過程相互獨立。張志強等[4]先對廣告數(shù)據(jù)中相似對象進行聚類,然后對于不同類型對象之間存在的復(fù)雜關(guān)聯(lián)關(guān)系,采用張量結(jié)構(gòu)對其建模,并運用張量分解法得到近似張量。AGARWAL等[10]針對廣告數(shù)據(jù)的高維多元可分層特性,提出了多層次Log線性模型。

朱志北等[11]提出LDA-FMs算法,首先對廣告文檔建立主題模型,使用該模型對訓(xùn)練集進行分割,得到的各子訓(xùn)練集中包含主題相似性較高的廣告;其次,對不同主題下的訓(xùn)練集采用因子分解機預(yù)估模型,以解決數(shù)據(jù)的稀疏問題。YAN等[12]介紹了阿里所采用的對偶群(coupled group lasso,CGL)模型,利用group lasso分別正則化用戶特征和廣告特征參數(shù),避免引入過大的關(guān)系矩陣。

1.2 不均衡分類

針對不平衡數(shù)據(jù),大多解決方案為從數(shù)據(jù)角度出發(fā),對原始數(shù)據(jù)集進行抽樣,從而得到相對均衡的數(shù)據(jù)集。

潘博等[5]對正負樣本分別進行采樣,即正例進行全采樣或過采樣,負例進行欠采樣,得到的多個數(shù)據(jù)集經(jīng)轉(zhuǎn)換后輸入訓(xùn)練模型。施夢圜等[13]通過平衡采樣刪除大量負樣本集,縮短訓(xùn)練時間,提升系統(tǒng)性能。劉冶等[14]通過二次采樣來減緩樣本不均衡帶來的誤差,具體做法是以遠小于1的比例從原負樣本集中選取部分負樣本,以提高正樣本在數(shù)據(jù)集中的比重。由于歷史數(shù)據(jù)足夠豐富,劉唐[15]直接從數(shù)據(jù)集中隨機抽取400 000條正例和400 000條負例,將其平均分成訓(xùn)練集和測試集。楊程遠[16]通過滑窗和下采樣等方式解決正負樣本極度不平衡的問題。

此外,百度的shooting算法[17]通過改進以往算法中迭代求解的方向和步長,來應(yīng)對數(shù)據(jù)特征分布不均衡問題,實驗結(jié)果比工業(yè)界常用的大規(guī)模優(yōu)化算法LBFGS快10倍。

1.3 其 他

互聯(lián)網(wǎng)數(shù)據(jù)中的廣告點擊或購買行為均呈現(xiàn)長尾分布,即只有少量商品被用戶多次購買,而大部分商品的銷量很少,甚至為0。巴麒龍[9]的實驗數(shù)據(jù)統(tǒng)計結(jié)果顯示,53.2%的廣告未能得到充分展示,其中31.5%的廣告的展示量為1次?;诖祟愡^去稀疏的廣告歷史數(shù)據(jù)預(yù)估得到的點擊率是不置信的,而廣告數(shù)據(jù)本身體量龐大,因此,多篇文獻中提到通過刪減數(shù)據(jù)來應(yīng)對該問題。

紀(jì)文迪[18]以天為單位,過濾掉購買任何商品的用戶、被點擊少于50次和購買次數(shù)少于10次的品牌。陳巧紅等[19]認(rèn)為,以device開頭的特征數(shù)過多,所以產(chǎn)生了很多長尾特征,為了提高模型學(xué)習(xí)的穩(wěn)定性,應(yīng)適當(dāng)過濾掉一些長尾特征值(如device_ip和device_id出現(xiàn)頻次低于10次的特征樣本)。巴麒龍[9]對用戶性別未知、廣告展示次數(shù)低于閾值的數(shù)據(jù)做了刪除。劉唐[15]將數(shù)據(jù)集中所有總展示數(shù)不足100的廣告記錄和廣告記錄數(shù)排名前10%的廣告商的所有記錄過濾掉,目的是避免過多總展示數(shù)不足的廣告影響結(jié)果,同時避免只考慮總展示數(shù)過多的廣告。

2 關(guān)于網(wǎng)絡(luò)廣告點擊率的特征研究

點擊率是衡量訪問網(wǎng)站、點擊廣告等事件次數(shù)占展示總次數(shù)(即看到廣告的總?cè)藬?shù))比例的指標(biāo),用百分比表示:

其中,hi表示第i次操作是否被點擊,若該事件被點擊則取值為1,否則取0。

大多文獻中使用的實驗數(shù)據(jù)集來自算法比賽,如:阿里移動推薦算法大賽、騰訊社交廣告算法大賽、國際知識發(fā)現(xiàn)和數(shù)據(jù)挖掘競賽(KDD-CUP)和kaggle競賽。

在廣告點擊率預(yù)估問題中,特征工程決定預(yù)估模型性能的上限[20]。一般可以分為廣告自身特征、用戶特征、上下文特征、店鋪特征等。特征處理,一般指特征提取及變換的過程,包括單特征提取、連續(xù)特征離散化、非線性變換、特征組合學(xué)習(xí)等[20]。

2.1 單特征處理

2.1.1 連續(xù)特征

如用戶年齡、注冊時長等,按照一定標(biāo)準(zhǔn)劃分區(qū)間,將連續(xù)型變量轉(zhuǎn)化為離散變量。

2.1.2 分類特征

通常情況下進行One-hot(獨熱)編碼。對于取值較多的類別特征,如用戶編號、商品編號等,直接對其進行One-hot編碼會造成特征矩陣過大,徐田[21]通過統(tǒng)計id的一些統(tǒng)計量(如歷史平均點擊率、歷史平均瀏覽率等)作為特征值代替id取值。

2.1.3 文本特征

如廣告標(biāo)題、產(chǎn)品描述等,用word2vec進行詞向量訓(xùn)練,對訓(xùn)練得到的廣告標(biāo)題進行聚類,對聚類結(jié)果進行One-hot編碼。付小飛[22]分析了大型門戶網(wǎng)站的廣告投放頁面數(shù)據(jù),其中廣告推送頁面為文本形式,用復(fù)雜最大匹配算法對廣告頁面進行分詞處理,依據(jù)處理結(jié)果生成特征項集。

對所有廣告而言,觸發(fā)關(guān)鍵字的數(shù)量遠遠多于廣告號的數(shù)量,因此,直接對關(guān)鍵字構(gòu)建特征向量很有可能會出現(xiàn)“維災(zāi)難”。劉唐[15]以廣告號建立特征向量,對廣告觸發(fā)關(guān)鍵字聚類,依據(jù)聚類結(jié)果對廣告進行分類。此外,針對廣告關(guān)鍵字這一特征,楊程遠[16]用TFIDF(term frequency-inverse document frequency)計算用戶檢索詞與廣告標(biāo)題、廣告描述、廣告購買關(guān)鍵字的相似性。HILLARD等[23]提出將搜索詞拆分成單詞和詞組,然后分別計算平均點擊率,進而得到搜索詞與候選廣告之間的關(guān)系。

2.1.4 多維統(tǒng)計特征

劉唐[15]從原始數(shù)據(jù)中提取出多維用戶行為特征,如:點擊主頁商品的次數(shù)、點擊商品詳情頁次數(shù)、收藏商品次數(shù)、瀏覽店鋪數(shù)量、收藏商品數(shù)量、搜索展現(xiàn)商品總點擊數(shù)、添加到購物車的商品數(shù)、下訂單數(shù)量和支付訂單數(shù)量等。

陳巧紅等[19]用人工神經(jīng)網(wǎng)絡(luò)算法選取對廣告點擊率影響較大的重要特征,如:用戶點擊的整體廣告排序,檢索詞長度,瀏覽器類型和廣告的知名度等。

2.1.5 時間特征

常見的原始特征分類有基本特征和用戶實時反饋特征,前述4類特征均屬于基本特征,而用戶實時反饋特征往往與時間有關(guān),如用戶距離上次點擊廣告的時間、距離上次見到廣告的時間、用戶在廣告頁的駐留時長等。

ZHOU等[24]認(rèn)為,內(nèi)外部環(huán)境的變化會影響用戶對廣告的興趣,其程度會隨時間的推移動態(tài)變化,在DIEN(deep interest evolution network)模型中通過加入時間-興趣特征的提取部分,來抓取用戶的實時偏好。

對于原始數(shù)據(jù)集中提供的時間戳屬性,通常需要分離成年、月、日、小時、分鐘、秒等多個維度,不同場景可選擇不同維度。還可以將時間與其他特征結(jié)合創(chuàng)造出新特征,如“時間+地理位置”可得到時區(qū)這一新特征,提高變量的可解釋性。

2.2 組合特征處理

特征之間存在高度非線性關(guān)聯(lián)關(guān)系,復(fù)雜度高,人工選擇特征方式由于組合特征耗時長、效率低而很少被人使用,目前較多選擇的是通過模型算法自動學(xué)習(xí)新特征。

Facebook在2014年提出用GBDT(梯度提升決策樹)模型挖掘具有區(qū)分性的特征并構(gòu)建特征組合[25]。魏曉航等[6]和CHENG等[20]均基于GBDT模型對輸入特征進行非線性轉(zhuǎn)化,得到了高維特征,有益于提高模型性能和預(yù)估準(zhǔn)確率。巴麒龍[9]使用的ADoSFLM方法中包含特征學(xué)習(xí)階段,借助深度學(xué)習(xí)——棧式自編碼網(wǎng)絡(luò)算法(stacked auto encoder network,SAEN)的多層結(jié)構(gòu),學(xué)習(xí)特征之間的高度非線性關(guān)聯(lián)關(guān)系。AGARWAL等[26]指出,LinkedIn的LASER系統(tǒng)中引入上下文信息,并利用笛卡爾積表示組合特征,可以有效解決推薦系統(tǒng)中的冷啟動問題。CHAN等[27]在使用基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的模型來預(yù)測點擊率時,考慮到特征學(xué)習(xí)得到的所有特征組合對可能對輸出結(jié)果產(chǎn)生不同的影響,即特征組合對具有不同的優(yōu)先性,因此通過貪心算法和隨機生成方法,在模型嵌入層中生成了多特征序列。SONG等[28]改進了自注意神經(jīng)網(wǎng)絡(luò)(selfattentive neural networks),將高維特征學(xué)習(xí)自動化,并提高了模型的可解釋性。

但是,自動化組合特征可能會造成過擬合和特征冗余,為了解決這一問題,謝桂林[29]基于待評估的單一特征對電商用戶進行分類,若各類用戶的召回率基本一致,則表明該特征對用戶的區(qū)分性很弱,為無效特征,否則,該特征的區(qū)分性強,可以保留為主特征。實驗證明:“最后一次購買的主類目”“最后一次購買時間在X天前”“注冊時間”是能影響用戶后續(xù)購買的區(qū)分性強的特征。而地域?qū)罄m(xù)的購買行為影響較小,屬于不重要的特征,可剔除。

2.3 CTR影響因素

楊誠[30]研究了用戶實時反饋對CTR的影響,即同一會話中用戶當(dāng)前的點擊率與其先前行為是否呈高度相關(guān)性,分析了4個用戶實時反饋因素與實時CTR的關(guān)系,見表1。

表1 用戶實時反饋因素與實時CTR的關(guān)系Table 1 The relationship between users'real-time feedback factors and real-time CTR

巴麒龍[9]研究了廣告位置對CTR的影響,認(rèn)為排序越靠前的廣告,點擊率越高。這與JOACHIMS等[31]的研究結(jié)論相符,即排名第一位的廣告占據(jù)絕對高可能性的點擊概率?;谠摻Y(jié)論,劉唐[15]將顯式特征中的廣告位置和廣告深度(一頁的展示廣告總數(shù))特征轉(zhuǎn)化為隱式的廣告相對位置,且相對位置與廣告位置成反比、與廣告深度成正比。

巴麒龍[9]還研究了用戶性別、年齡對CTR的影響,認(rèn)為不同性別的用戶傾向于點擊不同類型的廣告,這與日常現(xiàn)象相符;作者將用戶年齡離散化為6個年齡段,其中年齡為12~18歲的用戶,其廣告CTR值高于其他年齡段。

劉唐[15]對地域和時段2個特征進行研究,發(fā)現(xiàn)這2個因素對廣告點擊率的影響與用戶或者檢索詞是否變化無關(guān),地域?qū)TR的影響呈現(xiàn)規(guī)律性,而時段對CTR的影響無規(guī)律,但后者影響程度更大、波動更劇烈。

不同特征對模型準(zhǔn)確性的影響不同,去除冗余的無關(guān)特征通常會降低學(xué)習(xí)模型的難度,同時可避免因?qū)傩赃^多造成的“維災(zāi)難”。常見的特征選擇方法主要有:過濾式、包裹式和嵌入式。除此之外,巴麒龍[9]使用卡方檢驗、單特征AUC等方法檢驗各特征對廣告點擊率的影響,其做法是在原有特征中加入待驗證的特征,訓(xùn)練模型,判斷其有效性。

3 關(guān)于網(wǎng)絡(luò)廣告點擊率預(yù)估模型的研究

3.1 傳統(tǒng)預(yù)估模型

傳統(tǒng)的點擊率預(yù)估模型,如支持向量機(support vector machine,SVM)、貝葉斯和邏輯回歸模型,在歷史數(shù)據(jù)豐富的場景下表現(xiàn)良好。JOACHIMS[32]通過使用SVM從web搜索引擎日志中挖掘相關(guān)廣告數(shù)據(jù)來預(yù)估點擊率。GRAEPEL等[33]提出了一種基于在線貝葉斯概率回歸(online bayesian probability regression,OBPR)模型的點擊率預(yù)估方法,但該模型要求使用特定的廣告特征,這增加了個性化推薦難度。CHAPELLE等[34]基于動態(tài)貝葉斯網(wǎng)絡(luò)模型引入“滿意度”概念,目的在于模擬登錄頁面及搜索結(jié)果頁面可感知的相關(guān)性。

CHAPELLE等[12]提到Criteo公司選擇利用用戶特征、廣告特征及關(guān)系矩陣來修正LR模型,但關(guān)系矩陣的計算較為復(fù)雜,矩陣很大且稀疏。借助特征哈希來降維,又會導(dǎo)致沖突情況下無法判別組合特征信號的強弱。

3.2 深度學(xué)習(xí)模型

考慮到邏輯回歸模型的易用性,訓(xùn)練時易于并行化,以往工業(yè)界大多用該模型結(jié)合人工提取的特征來預(yù)估廣告點擊率,但隨著數(shù)據(jù)量的不斷擴大、廣告業(yè)務(wù)更加復(fù)雜、邏輯回歸模型無法處理大規(guī)模稀疏矩陣等問題的出現(xiàn),神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等非線性模型逐漸成為主流。

ZHANG等[35]提出了一種基于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的廣告點擊率預(yù)估方法,但這種反向傳播算法訓(xùn)練模型在使用梯度下降算法時會造成梯度消失或梯度爆發(fā)等問題。

GAI等[36]提出了一種混合邏輯回歸算法(mixed logistic regression,MLR),利用分片線性模式的分治思路來擬合高維空間的非線性分類面,創(chuàng)造性地實現(xiàn)了原始空間學(xué)習(xí)特征之間的非線性關(guān)系,效率較高。該算法應(yīng)用了結(jié)構(gòu)化先驗、增量訓(xùn)練、線性偏置等高級技巧,讓模型從數(shù)據(jù)中自動總結(jié)并擬合,此方法精度更高,在實際應(yīng)用中可迭代性更強。

郭子萱[37]提出采用一種基于門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(the gated recurrent unit neural networks,GRU)模型預(yù)估廣告點擊率,通過優(yōu)化改進門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)的步長控制方法,使得模型在更少的迭代輪次下,更好、更快地到達最優(yōu)點,從而提高模型的預(yù)估能力。

王孝舒[38]使用卡內(nèi)基梅隆大學(xué)開發(fā)的Petuum平臺提供的深層神經(jīng)網(wǎng)絡(luò)模型,分別選取Sigmoid和Relu 2種激活函數(shù)進行訓(xùn)練,結(jié)果表明,深度學(xué)習(xí)模型的預(yù)估效果優(yōu)于邏輯回歸模型。

4 關(guān)于網(wǎng)絡(luò)廣告點擊率預(yù)估模型評價指標(biāo)的研究

文獻中使用的評價指標(biāo)主要有:平均絕對誤差MAE(means absolute error)、F-measure、AUC值 、Log-loss、PR曲線、ROC曲線、RIG(relative information gain)、準(zhǔn)確率和召回率。表2為各指標(biāo)的使用情況,表3為混淆矩陣表。

各數(shù)值型指標(biāo)的計算公式如下:

(3)常用的損失函數(shù):

表2 模型評價指標(biāo)使用統(tǒng)計表Table 2 Model evaluation indicators

表3 混淆矩陣Table 3 Confusion matrix

5 研究展望

高點擊率并不一定意味著高收益,如果目標(biāo)網(wǎng)頁或產(chǎn)品對用戶無任何幫助,即投放的廣告未能精準(zhǔn)定位客戶群,那么付出的廣告費就不能得到對等的回報。因此,網(wǎng)站轉(zhuǎn)化比網(wǎng)站流量更加重要,由此提出了“轉(zhuǎn)化率(conversion rate,CVR)”概念,即點擊人數(shù)占購買人數(shù)的比例,此指標(biāo)比“點擊率”更能反映企業(yè)的投資回報率和盈利能力。

潘書敏等[40]指出,傳統(tǒng)的CVR模型通過訓(xùn)練點擊、展示的樣本,并利用所有展示樣本推斷空間,易導(dǎo)致樣本選擇偏差和產(chǎn)生極端的數(shù)據(jù)稀疏性問題。由此,提出了全空間多任務(wù)模型(entire space multitask model,ESMM),利用用戶操作的順序模式,即印象→點擊→轉(zhuǎn)換,來預(yù)估點擊后的轉(zhuǎn)化率。

YOSHIKAWA等[42]指出,廣告點擊與轉(zhuǎn)化之間通常存在時間上的延遲,而延遲的最佳分布取決于數(shù)據(jù),并提出了用于CVR預(yù)估的非參數(shù)延遲反饋模型(nonparametric delayed feedback model,NoDeF),該模型在擬合延遲分布方面優(yōu)于其他現(xiàn)有方法[42]。

FATTA等[43]用探索性回歸方法分析提高中小企業(yè)商品轉(zhuǎn)化率的因素或因素組合。研究表明,提高轉(zhuǎn)化率的關(guān)鍵性因素是質(zhì)量和促銷策略。

目前,國內(nèi)外對廣告轉(zhuǎn)化率研究的相關(guān)文獻較少,今后的研究重點:(1)挖掘有效提高廣告轉(zhuǎn)化率的因素;(2)從廣告轉(zhuǎn)化率角度定量分析ROI。

6 結(jié) 論

對計算廣告學(xué)的熱門研究領(lǐng)域之廣告點擊率預(yù)估中的特征學(xué)習(xí)及模型進行了綜述,預(yù)估過程通常由特征提取、特征選擇、預(yù)估模型、評價指標(biāo)4個步驟組成,本文從原始數(shù)據(jù)特點及解決方法、點擊率預(yù)估的特征學(xué)習(xí)、點擊率預(yù)估模型的構(gòu)建、評價指標(biāo)的選取四方面綜述了相關(guān)文獻。點擊率預(yù)估可應(yīng)用于互聯(lián)網(wǎng)廣告投放、推薦系統(tǒng)等領(lǐng)域,對提升企業(yè)的投資回報率有重要作用,具有較高的研究價值。雖然在廣告點擊率預(yù)估研究上已有一定成果,但因廣告投放效果常通過曝光、點擊和轉(zhuǎn)化3個環(huán)節(jié)來衡量,對最后一個環(huán)節(jié)的轉(zhuǎn)化率預(yù)估研究非常重要,對轉(zhuǎn)化率影響因素和分析模型等相關(guān)研究尚需加強。

猜你喜歡
點擊率預(yù)估特征
美國銀行下調(diào)今明兩年基本金屬價格預(yù)估
如何表達“特征”
不忠誠的四個特征
基于特征工程的視頻點擊率預(yù)測算法
抓住特征巧觀察
史密斯預(yù)估控制在排焦控制中的應(yīng)用
喜報!萌寶大賽參賽者660名,投票321657人次,點擊率超60萬!
海峽姐妹(2015年8期)2015-02-27 15:12:30
線性代數(shù)的應(yīng)用特征
河南科技(2014年23期)2014-02-27 14:19:15
徹底消失
興趣英語(2013年8期)2013-11-13 06:54:02
《江南STYLE》為何這么火
海外英語(2013年3期)2013-08-27 09:37:01
郎溪县| 古浪县| 侯马市| 长垣县| 商水县| 明星| 齐河县| 汾西县| 正阳县| 两当县| 全椒县| 崇州市| 嫩江县| 昭通市| 峨山| 治多县| 漠河县| 安吉县| 鄂托克旗| 孝义市| 呼伦贝尔市| 南乐县| 卓资县| 衡水市| 环江| 宁津县| 深泽县| 新化县| 安丘市| 泸水县| 沅陵县| 常州市| 渝中区| 菏泽市| 保山市| 鄂温| 宁乡县| 南充市| 福海县| 外汇| 淮安市|