左軍
摘 要:大數(shù)據(jù)的數(shù)據(jù)分析應(yīng)用改變了人們的生活,同時(shí)深入影響了企業(yè)商業(yè)模式的創(chuàng)新。本文闡述了大數(shù)據(jù)的概念和特征,分析了大數(shù)據(jù)對于網(wǎng)絡(luò)用戶行為的影響,并對基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶行為分析模式進(jìn)行了實(shí)證研究。
關(guān)鍵詞:大數(shù)據(jù);網(wǎng)絡(luò)用戶行為;數(shù)據(jù)分析
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A1 引言(Introduction)
互聯(lián)網(wǎng)和云計(jì)算技術(shù)的飛速發(fā)展,促使行業(yè)應(yīng)用產(chǎn)生的數(shù)據(jù)呈爆炸性增長,數(shù)據(jù)量的快速增長標(biāo)志著人類已經(jīng)從信息時(shí)代步入大數(shù)據(jù)時(shí)代。目前,百度的總數(shù)據(jù)量已超過1000PB,每天需要處理的網(wǎng)頁數(shù)據(jù)達(dá)到10PB—100PB;淘寶累計(jì)的交易數(shù)據(jù)量高達(dá)100PB;Twitter每天發(fā)布超過2億條消息;新浪微博每天發(fā)帖量達(dá)到8000萬條;中國移動(dòng)單獨(dú)省份的電話通聯(lián)記錄數(shù)據(jù)每月可達(dá)0.5PB—1PB;單獨(dú)省會(huì)城市公安局道路車輛監(jiān)控?cái)?shù)據(jù)三年可達(dá)200億條、總量120TB。據(jù)世界權(quán)威IT信息咨詢分析公司IDC研究報(bào)告預(yù)測:全世界數(shù)據(jù)量未來10年將從2009年的0.8ZB增長到2020年的35ZB(1ZB=1000EB=1000000PB),10年將增長44倍,年均增長40%[1]。大數(shù)據(jù)悄然地改變著我們的工作和生活方式,同時(shí)對于企業(yè)經(jīng)營運(yùn)作模式的創(chuàng)新更是一個(gè)機(jī)遇和挑戰(zhàn)。
2 大數(shù)據(jù)概述(Summary of Big Data)
2.1 大數(shù)據(jù)的定義
大數(shù)據(jù)的概念出現(xiàn)較早,2008年,美國《Nature》雜志在Google成立10周年時(shí)出版了“Big Data”專刊,該專刊主要探討未來大數(shù)據(jù)的處理技術(shù)和問題,并對大數(shù)據(jù)與一些行業(yè)可能存在的關(guān)系進(jìn)行了介紹[2]。2011年5月,麥肯錫咨詢公司發(fā)布了名為《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》報(bào)告,報(bào)告中表示大數(shù)據(jù)已經(jīng)成為現(xiàn)代社會(huì)必備的生產(chǎn)要素,數(shù)據(jù)與各個(gè)行業(yè)的密切相關(guān),大數(shù)據(jù)將促進(jìn)未來生產(chǎn)率的提升。
但是,對于大數(shù)據(jù)的具體概念,行業(yè)研究者和學(xué)者給出了不同的定義。維基百科對大數(shù)據(jù)的定義為:大數(shù)據(jù)是指無法使用傳統(tǒng)和常用的軟件技術(shù)和工具在一定時(shí)間內(nèi)完成獲取、管理和處理的數(shù)據(jù)集[3]。美國權(quán)威IT研究與咨詢顧問公司Gartner認(rèn)為大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)??梢?,大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。
2.2 大數(shù)據(jù)的特點(diǎn)
對于數(shù)據(jù)的特點(diǎn),IBM總結(jié)為3V,即Volume(海量性)、Variety(多樣性)和Velocity(高速性)。隨著對大數(shù)據(jù)的研究的深入,IDC將IBM提出的3V進(jìn)行了發(fā)展,提出4V特性,Volume(海量性)、Variety(多樣性)、Velocity(高速性)、Value(價(jià)值性)。
(1)海量性,就是數(shù)據(jù)體量巨大。從TB級別,躍升到PB級別。
(2)多樣性,就是數(shù)據(jù)類型繁多。如網(wǎng)絡(luò)日志、網(wǎng)絡(luò)新聞、網(wǎng)絡(luò)購物和地理位置服務(wù)等都可以產(chǎn)生大量的文字、視頻、圖片和地理位置等各種類型的數(shù)據(jù)信息。
(3)高速性,即處理速度快,大數(shù)據(jù)技術(shù)可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息,這一點(diǎn)也是大數(shù)據(jù)技術(shù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的本質(zhì)不同。
(4)價(jià)值性,只要合理利用大數(shù)據(jù),并對其進(jìn)行正確和準(zhǔn)確的分析,將會(huì)帶來很高的價(jià)值回報(bào)。
3 分析網(wǎng)絡(luò)用戶行為的必要性(Analysis of the
necessity of network user behaviors)
網(wǎng)絡(luò)用戶行為是指用戶在使用網(wǎng)絡(luò)資源時(shí)所呈現(xiàn)的規(guī)律性。這通常是通過對有關(guān)用戶使用網(wǎng)絡(luò)資源的數(shù)據(jù)進(jìn)行記錄、統(tǒng)計(jì)和分析所得出。用戶在使用網(wǎng)絡(luò)資源時(shí),用戶行為可以分為信息查詢行為、溝通交流行為、休閑娛樂行為、電子服務(wù)行為和電子商務(wù)服務(wù)行為等許多方面。互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)的發(fā)展,使用戶對網(wǎng)絡(luò)服務(wù)質(zhì)量的要求逐步提升,網(wǎng)絡(luò)服務(wù)提供者提供服務(wù)的方式也逐漸走向科學(xué),通過對網(wǎng)絡(luò)用戶行為的分析和規(guī)律總結(jié),可以將這些規(guī)律與產(chǎn)品或服務(wù)的經(jīng)營策略相結(jié)合,發(fā)現(xiàn)目前經(jīng)營服務(wù)中的問題,并為進(jìn)一步提高服務(wù)質(zhì)量和經(jīng)營策略的制定都有非常重要的意義。
4 大數(shù)據(jù)與網(wǎng)絡(luò)用戶行為分析(Big Data and the
analysis of the network user behaviors)
4.1 網(wǎng)絡(luò)用戶行為的界定
從大數(shù)據(jù)的視角進(jìn)行網(wǎng)絡(luò)用戶的行為分析,首先要重新界定網(wǎng)絡(luò)用戶行為的組成。
(1)用戶群特征分類。對網(wǎng)絡(luò)用戶群進(jìn)行分類,不同于以往的單一根據(jù)年齡或職業(yè)等進(jìn)行分類,要從不同維度,先測得用戶的行為數(shù)據(jù)之后,在進(jìn)行細(xì)化分類。
(2)用戶對產(chǎn)品的使用率。對于網(wǎng)站類產(chǎn)品,主要有網(wǎng)站的點(diǎn)擊率、訪問量、訪問率、點(diǎn)擊量、頁面停留時(shí)間、訪問模塊數(shù)等;對于網(wǎng)絡(luò)購物類產(chǎn)品,包括訪問量、訪問率、咨詢率、轉(zhuǎn)化率、二次購買率和推薦率等;對于移動(dòng)應(yīng)用類產(chǎn)品則體現(xiàn)在下載量、使用頻率和使用模塊數(shù)等。
(3)用戶使用產(chǎn)品的時(shí)間。就是用戶每天在什么時(shí)候會(huì)使用該產(chǎn)品,比如對于微信的公眾號信息推送模式,就必須了解大部分用戶會(huì)點(diǎn)擊打開該公眾號內(nèi)文章的時(shí)間,以避免對用戶的打擾,提高推送信息的到達(dá)率。
4.2 網(wǎng)絡(luò)用戶行為分析方式
收集到了網(wǎng)絡(luò)用戶行為的大數(shù)據(jù)之后,需要對用戶進(jìn)行分析,主要分析方式有以下幾種:
(1)以數(shù)據(jù)分析為導(dǎo)向。以數(shù)據(jù)分析為導(dǎo)向是指在大數(shù)據(jù)分析過程中,通過收集相關(guān)數(shù)據(jù)做出下一步用戶推薦服務(wù)等設(shè)計(jì)。如電子商務(wù)網(wǎng)站上的相關(guān)推薦和你可能喜歡等,這些數(shù)據(jù)可以微精準(zhǔn)營銷提供數(shù)據(jù)支撐。
(2)以產(chǎn)品設(shè)計(jì)反饋為導(dǎo)向。以產(chǎn)品設(shè)計(jì)反饋為導(dǎo)向是指通過數(shù)據(jù)監(jiān)測、挖掘、收集、整理和統(tǒng)計(jì)用戶數(shù)據(jù),為產(chǎn)品設(shè)計(jì)或改進(jìn)服務(wù)的大數(shù)據(jù)分析。如收集用戶屬性和用戶習(xí)慣數(shù)據(jù),用戶屬性是用戶的基本信息字段,包括性別、年齡、地域和網(wǎng)齡等傳統(tǒng)信息,傾向于用戶群體分類;用戶習(xí)慣包括用戶的訪問偏好、訪問時(shí)間、流量習(xí)慣等。endprint
(3)以用戶調(diào)查為導(dǎo)向。以用戶調(diào)查為導(dǎo)向,傾向于基礎(chǔ)數(shù)據(jù)的分析,如用戶基本動(dòng)作分析可以從用戶在網(wǎng)站或頁面的停留時(shí)間、訪問量和用戶活躍度等方面入手,通過對用戶的使用頻率進(jìn)行分析,可以得出為什么用戶喜歡使用該產(chǎn)品的這個(gè)功能。
4.3 實(shí)證研究
目前,對于網(wǎng)絡(luò)用戶行為分析應(yīng)用主要集中在電子商務(wù)領(lǐng)域,在電子商務(wù)領(lǐng)域用戶信息行為的數(shù)據(jù)量極大。據(jù)電子商務(wù)行業(yè)的用戶行為分析公司的不完全統(tǒng)計(jì)顯示,用戶在購買產(chǎn)品之前,平均要瀏覽與該產(chǎn)品相關(guān)的5個(gè)網(wǎng)站和36個(gè)頁面,同時(shí)產(chǎn)生在社會(huì)化媒體和搜索引擎上的交互行為也多達(dá)數(shù)十次。電子商務(wù)領(lǐng)域的基于大數(shù)據(jù)的用戶行為分析,可以幫助電子商務(wù)企業(yè)更好地為用戶開展售前、售中和售后服務(wù)。
本文以國內(nèi)的某團(tuán)購網(wǎng)站為例,分析該網(wǎng)站在網(wǎng)絡(luò)用戶行為分析中的大數(shù)據(jù)應(yīng)用。該團(tuán)購網(wǎng)站的移動(dòng)端APP主界面配置的服務(wù)主要有:搜索服務(wù)、LBS(基于位置的服務(wù))、產(chǎn)品服務(wù)分類和猜你喜歡等。其中的猜你喜歡屬于推薦服務(wù)類是根據(jù)用戶的以往購買行為和區(qū)域特點(diǎn)進(jìn)行的精準(zhǔn)推薦服務(wù)。下面以一名用戶的使用團(tuán)購APP為例,進(jìn)行用戶行為分析。
用戶的購買前行為信息,可以反映出用戶的購買心理和購買意向。用戶A在打開團(tuán)購APP的100次中有78次直接選擇了主界面的美食分類,10次選擇今日新單分類,9次選擇電影分類和3次選擇KTV分類。在進(jìn)入美食分類后,用戶A直接選擇了智能排序中“離我最近”選項(xiàng)有52次,人氣最高有10次,評價(jià)最高有10次,價(jià)格最低6次。用戶A在選擇“離我最近”的選項(xiàng)中,有40次在同一地點(diǎn),有8次在另一個(gè)地點(diǎn),有4次在其他不同位置。用戶A在選擇了“離我最近”之后篩選出附近的美食,在該頁面平均停留320秒,之后才會(huì)在美食下的菜系分類中進(jìn)行二次篩選。在菜系篩選中,用戶A選擇火鍋14次、川湘菜15次、西餐10次、京菜魯菜15次、烤肉烤魚11次和中式燒烤8次等。用戶A在點(diǎn)擊某款美食打開團(tuán)購詳情時(shí),在團(tuán)購詳情頁面平均停留20秒、在圖文詳情平均停留28秒,評價(jià)頁面平均停留90秒。用戶A在78次瀏覽美食分類中,有16次購買行為,在16次購買行為中,從打開團(tuán)購APP到下單購買時(shí)間為78秒。
通過對用戶A在團(tuán)購APP中的行為數(shù)據(jù)分析與其他用戶對比可知,用戶A使用團(tuán)購APP的主要目的為瀏覽美食和團(tuán)購美食,用戶A口味傾向傳統(tǒng)魯菜菜系和川菜菜系,在進(jìn)行選擇餐飲商家的時(shí)候,傾向于選擇距離自己位置近或者住宅附近的商家,用戶A對價(jià)格不是特別敏感,更加注重商家位置,其次是人氣和口碑,用戶A在具體進(jìn)行商家選擇時(shí),更加注重其他用戶的評價(jià),但是一旦決定購買,下單購買行為較快。所以,對于此類用戶,團(tuán)購APP在主界面中的“猜你喜歡”中展示的信息應(yīng)為美食類,且距離該用戶常用位置近的魯菜和川菜美食,這樣能提高用戶的體驗(yàn)和消費(fèi)次數(shù),同時(shí)在支付環(huán)節(jié)應(yīng)盡量選用成熟的第三方交易平臺(tái),能使該用戶支付行為更加果斷。
5 結(jié)論(Conclusion)
綜上所述,大數(shù)據(jù)技術(shù)和互聯(lián)網(wǎng)用戶行為分析日益密切融合,將傳統(tǒng)的產(chǎn)品設(shè)計(jì)、營銷和經(jīng)營管理徹底改變。大數(shù)據(jù)作用的日益凸顯更要求互聯(lián)網(wǎng)企業(yè)和傳統(tǒng)企業(yè)能夠正視大數(shù)據(jù)的作用,對大數(shù)據(jù)的應(yīng)用要結(jié)合自身情況,切不可盲目跟風(fēng)。
參考文獻(xiàn)(References)
[1] 黃宜華.深入理解大數(shù)據(jù):大數(shù)據(jù)處理與編程實(shí)踐[M].北京:
機(jī)械工業(yè)出版社,2014.
[2] Nature.Big Data [EB/OL].[2014-08-31].http://www.nature.
com/news/specials/bigdata/index.html.
[3] Big data [EB/OL].[2014-08-31].http://en.wikipedia.org/wiki/
Big data.
作者簡介:
左 軍(1958-),男,本科,講師.研究領(lǐng)域:計(jì)算機(jī)網(wǎng)絡(luò)安
全,數(shù)據(jù)庫及其應(yīng)用技術(shù),多媒體信息處理.endprint