国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

企業(yè)ERP基于數(shù)據(jù)挖掘技術(shù)對(duì)手機(jī)應(yīng)用市場(chǎng)情況的淺析

2019-04-25 17:15喬陽(yáng)
中國(guó)信息化 2019年4期
關(guān)鍵詞:種類評(píng)分數(shù)量

喬陽(yáng)

手機(jī)在數(shù)字化時(shí)代成為人們生活中必不可少的工具,而手機(jī)移動(dòng)設(shè)備的功能就體現(xiàn)在手機(jī)的各類應(yīng)用系統(tǒng)上。本文根據(jù)數(shù)據(jù)挖掘技術(shù)對(duì)手機(jī)應(yīng)用起到的作用進(jìn)行分析,為手機(jī)應(yīng)用市場(chǎng)的開(kāi)發(fā)提出了一些具體的建議,并且在綜合分析各類應(yīng)用的基礎(chǔ)上,設(shè)計(jì)手機(jī)應(yīng)用的推薦系統(tǒng),希望能夠?yàn)橛脩籼峁└哔|(zhì)量并且符合用戶需求的應(yīng)用。

一、當(dāng)今大數(shù)據(jù)技術(shù)發(fā)展?fàn)顩r

在數(shù)字化時(shí)代發(fā)展的今天,各種手機(jī)、iPad等互聯(lián)網(wǎng)應(yīng)用設(shè)備如雨后春筍,始終保持著快速發(fā)展的勢(shì)頭,使人們的生活走上“互聯(lián)網(wǎng)+”的時(shí)代。在手機(jī)數(shù)據(jù)決策和管理中,數(shù)據(jù)倉(cāng)庫(kù)主要是面向主題數(shù)據(jù)集合、集成數(shù)據(jù)集合和與時(shí)間相關(guān)的數(shù)據(jù)集合。相對(duì)于普通關(guān)系型數(shù)據(jù)庫(kù)來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)的重點(diǎn)不再是實(shí)時(shí)修改存儲(chǔ)數(shù)據(jù),而是能夠根據(jù)不同的主題和角度進(jìn)行查詢和分析。目前市場(chǎng)上很多公司不僅擁有自己的數(shù)據(jù)庫(kù)產(chǎn)品,而且還可以在已經(jīng)擁有的產(chǎn)品基礎(chǔ)上創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù),并進(jìn)行討論和研究。如有具備可視化操作的數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品,不僅降低了產(chǎn)品的使用難度,更是提升了產(chǎn)品的展示效果。

二、手機(jī)應(yīng)用市場(chǎng)情況淺析

(一)應(yīng)用屬性的相關(guān)度對(duì)比

手機(jī)應(yīng)用市場(chǎng)的一些普遍規(guī)律和重點(diǎn),可以通過(guò)分析應(yīng)用屬性的關(guān)聯(lián)程度獲得。這里主要強(qiáng)調(diào)四個(gè)數(shù)值屬性的關(guān)聯(lián)程度,它們是應(yīng)用評(píng)分、評(píng)論數(shù)量、應(yīng)用大小和安裝數(shù)量,可以利用Excel表格中的函數(shù)計(jì)算應(yīng)用,將其兩兩對(duì)比不難發(fā)現(xiàn),關(guān)聯(lián)程度最大的是評(píng)論數(shù)量和安裝數(shù)量,關(guān)聯(lián)程度較小的是應(yīng)用評(píng)分與其他三個(gè)屬性。大多數(shù)用戶在使用該應(yīng)用后,對(duì)關(guān)聯(lián)程度大的應(yīng)用進(jìn)行了及時(shí)的反饋,這就有利于我們?nèi)婵陀^分析各個(gè)應(yīng)用的綜合質(zhì)量。

(二)應(yīng)用評(píng)分與安裝數(shù)量

根據(jù)當(dāng)前市場(chǎng)的需求,我們將應(yīng)用進(jìn)行分門別類,主要有教育、活動(dòng)、藝術(shù)、圖書、育兒、游戲、美妝、健康等類別,根據(jù)不同的人群我們可以看出,應(yīng)用種類的不一樣,受歡迎的程度也不同。我們希望能夠安裝那種應(yīng)用人數(shù)比較多,但是平均分卻很低的應(yīng)用,這可以通過(guò)分析統(tǒng)計(jì)后獲得。這樣我們就可以提升有價(jià)值和市場(chǎng)潛力的安裝數(shù)高、評(píng)分值低的應(yīng)用了。

我們可以通過(guò)應(yīng)用Excel中的分類統(tǒng)計(jì)功能給應(yīng)用種類進(jìn)行排序,把應(yīng)用種類作為分類項(xiàng)目進(jìn)行統(tǒng)計(jì),然后得出不同種類應(yīng)用的平均評(píng)分和平均安裝數(shù)量。例如聊天類的應(yīng)用是安裝數(shù)量最高的應(yīng)用,但是聊天類的平均得分低于所有應(yīng)用的平均得分。聊天類的手機(jī)應(yīng)用由于其具備較高的商業(yè)價(jià)值,所以,在性能上還有很大的開(kāi)發(fā)潛力和提升空間。其他相類似的手機(jī)應(yīng)用還有視頻類和旅游類的,也具備開(kāi)發(fā)和提升的潛力。但是一些安裝數(shù)量極大,同時(shí)評(píng)分也高的手機(jī)應(yīng)用,比如游戲和社交類的,在市場(chǎng)中基本處于飽和狀態(tài),因此我們不建議繼續(xù)開(kāi)發(fā)此類應(yīng)用。

(三)應(yīng)用評(píng)分和版本更新情況

隨著時(shí)代的變化和人們需求的不斷增加,手機(jī)應(yīng)用也要根據(jù)市場(chǎng)需求做出相應(yīng)的調(diào)整。舊的手機(jī)應(yīng)用版本由于存在或多或少的問(wèn)題,用戶的需求不能得到滿足,所以很多用戶都喜歡用版本較新的手機(jī)應(yīng)用,可以有更好的使用體驗(yàn)。這種安裝數(shù)量多、更新時(shí)間早、版本較低類型的手機(jī)應(yīng)用由于存在較大的提升空間,所以開(kāi)發(fā)者可以根據(jù)市場(chǎng)需求進(jìn)行更新,提高手機(jī)應(yīng)用的綜合水平。我們可以使用Excel中種類分類進(jìn)行匯總,將同一種類的應(yīng)用個(gè)數(shù)進(jìn)行計(jì)數(shù),然后通過(guò)過(guò)濾的功能,保留應(yīng)用樣本中年份小于或者是等于2018年的應(yīng)用樣本,然后再進(jìn)行分類和匯總,就會(huì)計(jì)算出不同種類應(yīng)用的更新年份在2018年之前的個(gè)數(shù)總和,然后算出這個(gè)種類的應(yīng)用總數(shù)的百分比,如果這個(gè)百分比的數(shù)值大,說(shuō)明這個(gè)種類應(yīng)用版本就是有較低的占比,從而說(shuō)明這個(gè)手機(jī)應(yīng)用總體更新不到位。通過(guò)這種分析我們可以得出聊天類應(yīng)用和游戲類的應(yīng)用安裝數(shù)量極大,然而這兩種用戶的用戶群體數(shù)量龐大,所以說(shuō)綜合來(lái)看還是更新的不夠及時(shí),并且可以說(shuō)明這些應(yīng)用在開(kāi)發(fā)出來(lái)之后仍然可以保持較長(zhǎng)時(shí)間的熱度。經(jīng)過(guò)驗(yàn)證可以得出,這些應(yīng)用如果想達(dá)到最佳狀態(tài)就可以通過(guò)更新的方式,開(kāi)發(fā)者可以通過(guò)兩種形式,一是開(kāi)發(fā)全新的應(yīng)用,一是繼續(xù)更新原有的應(yīng)用。當(dāng)然也有一些應(yīng)用的實(shí)用性較強(qiáng),比如說(shuō)飲食類的應(yīng)用和娛樂(lè)類的應(yīng)用,安裝數(shù)量較少,但是更新的比較及時(shí)。這些類型的應(yīng)用需要根據(jù)客戶的需求不斷更新和變化,才能滿足客戶的需求。因此大量地投入和開(kāi)發(fā)新的應(yīng)用是我們不贊成的,我們應(yīng)該多注重平時(shí)應(yīng)用功能嗯更新和優(yōu)化。

三、手機(jī)應(yīng)用推薦系統(tǒng)

在眾多相同的手機(jī)應(yīng)用中,用戶一般會(huì)根據(jù)應(yīng)用市場(chǎng)給出的評(píng)分來(lái)進(jìn)行選擇,當(dāng)然也有一些雖然評(píng)分較高的應(yīng)用反而沒(méi)有較高的安裝數(shù)量,所以只是根據(jù)安裝數(shù)量還不能客觀反映這個(gè)手機(jī)應(yīng)用的綜合水平。這就需要我們尋找在同一類的手機(jī)應(yīng)用中,應(yīng)用版本比較新的就成為更多用戶的需求。所以我們?cè)谠O(shè)計(jì)手機(jī)應(yīng)用推薦系統(tǒng)的過(guò)程中,考慮的主要是以下幾種因素:所屬受眾人群來(lái)計(jì)算各應(yīng)用間的相似度、種類、應(yīng)用大小、是否付費(fèi)、受眾人群等。首先通過(guò)計(jì)算相似度篩選應(yīng)用,主要是根據(jù)用戶所給應(yīng)用的次種類、是否付費(fèi)、應(yīng)用大小和受眾人群來(lái)計(jì)算相似度。其次是計(jì)算應(yīng)用的綜合質(zhì)量,并對(duì)應(yīng)進(jìn)行排序,這主要是根據(jù)評(píng)分、安裝數(shù)量、評(píng)價(jià)情緒和客觀程度來(lái)計(jì)算出各應(yīng)用的綜合質(zhì)量,推薦給用戶綜合質(zhì)量排名前三名的應(yīng)用。

(一)手機(jī)應(yīng)用推薦系統(tǒng)的關(guān)鍵技術(shù)

1. Hadoop框架介紹

Hadoop分布式系統(tǒng)是一個(gè)可以用來(lái)處理海量數(shù)據(jù)的大數(shù)據(jù)平臺(tái)。它具備的優(yōu)點(diǎn)是,不需要通過(guò)識(shí)別系統(tǒng)底層細(xì)節(jié),就可以開(kāi)發(fā)出能夠處理大數(shù)據(jù)的程序。這個(gè)Hadoop包含兩個(gè)設(shè)計(jì)核心,一個(gè)是HDFS,是分布式文件系統(tǒng),特點(diǎn)是具有很高的容錯(cuò)功能,不需要額外購(gòu)買價(jià)格昂貴的硬件就可以直接建構(gòu)在服務(wù)器上,這樣就可以通過(guò)增加服務(wù)器數(shù)量的方式提升集群的處理能力;另外一個(gè)是Map Reduce是為大數(shù)據(jù)計(jì)算提供解決方案的,它的優(yōu)點(diǎn)是可以在不采用分布式編程的情況下,把程序運(yùn)行在分布式的系統(tǒng)上。

2. Spark計(jì)算框架

Spark計(jì)算框架也是以HDFS為文件存儲(chǔ)系統(tǒng)的底層來(lái)計(jì)算大數(shù)據(jù)的計(jì)算框架,但是它的計(jì)算速度比Hadoop和Map Reduce都快很多。它的計(jì)算核心內(nèi)存模型叫彈性分布式數(shù)據(jù)集,是處理大數(shù)據(jù)最底層的一個(gè)抽象概念。Spark計(jì)算框架在處理這些數(shù)據(jù)時(shí)會(huì)把這些數(shù)據(jù)先轉(zhuǎn)化為RDD。RDD轉(zhuǎn)換操作的種類更加多樣,既可以進(jìn)行transform的數(shù)據(jù)轉(zhuǎn)換,也可以進(jìn)行action操作,對(duì)轉(zhuǎn)換后的數(shù)據(jù)操作產(chǎn)生結(jié)果。

3. HBase 數(shù)據(jù)庫(kù)

HBase數(shù)據(jù)庫(kù)的底層仍然使用的是HDFS,是一個(gè)非關(guān)系型面向列存儲(chǔ)的數(shù)據(jù)庫(kù)。隨著大數(shù)據(jù)時(shí)代的到來(lái),人們更關(guān)心的焦點(diǎn)問(wèn)題是如何存儲(chǔ)如此龐大的不規(guī)范的、半結(jié)構(gòu)化或者是非結(jié)構(gòu)化的數(shù)據(jù)。雖然在HBase出現(xiàn)之前就已經(jīng)使用了一些策略和方法,但是還有些關(guān)鍵的問(wèn)題沒(méi)有得到解決,比如大數(shù)據(jù)。一些開(kāi)發(fā)商只是想擴(kuò)充數(shù)據(jù)庫(kù),但是只是通過(guò)簡(jiǎn)單復(fù)制和分區(qū)的方法還是存在很多問(wèn)題的,比如在安裝和維護(hù)的時(shí)候就會(huì)比較繁瑣。另外,這種傳統(tǒng)方法還無(wú)法實(shí)現(xiàn)在思路上解決大數(shù)據(jù)存儲(chǔ)問(wèn)題,也會(huì)影響到數(shù)據(jù)庫(kù)的一些功能,比如鏈接、視圖、外鍵約束等。傳統(tǒng)存儲(chǔ)數(shù)據(jù)的方法會(huì)給數(shù)據(jù)庫(kù)的升級(jí)帶來(lái)很多困難,甚至?xí)驗(yàn)榘嘿F的價(jià)格而無(wú)法實(shí)現(xiàn)。

4. 用戶標(biāo)簽系統(tǒng)簡(jiǎn)述

用戶標(biāo)簽是指為了獲取用戶的興趣愛(ài)好和使用傾向,通過(guò)記錄用戶的行為、操作、觀點(diǎn)等方式來(lái)統(tǒng)計(jì)、分析、挖掘、收集原始信息。然后根據(jù)不同的用戶群進(jìn)行標(biāo)注、區(qū)分。建立用戶標(biāo)簽的優(yōu)點(diǎn)是可以更好地表示或者還原用戶,這樣的用戶模型是建立在真實(shí)有效的數(shù)據(jù)基礎(chǔ)上和算法分析基礎(chǔ)上的,開(kāi)發(fā)者可以通過(guò)日常的行為積累,持續(xù)使用標(biāo)簽,就可以進(jìn)行更精準(zhǔn)化的市場(chǎng)營(yíng)銷,選取更符合特征的用戶群體。

四、結(jié)語(yǔ)

本文基于數(shù)據(jù)挖掘技術(shù)對(duì)手機(jī)應(yīng)用市場(chǎng)存在的問(wèn)題進(jìn)行了分析,并提出了一些建議和解決辦法。根據(jù)用戶使用記錄,也就是市場(chǎng)調(diào)查研究,對(duì)手機(jī)應(yīng)用進(jìn)行具體分析,完善手機(jī)應(yīng)用推薦系統(tǒng),為用戶提供更好的推薦內(nèi)容和質(zhì)量高的手機(jī)應(yīng)用。

猜你喜歡
種類評(píng)分數(shù)量
APACHEⅡ評(píng)分在制定ICU患者護(hù)理干預(yù)措施中的應(yīng)用研究
基于稀疏表示的寵物狗種類識(shí)別
基于稀疏表示的寵物狗種類識(shí)別
電影
雙周最佳陣容
雙周最佳陣容
角:開(kāi)啟位置與數(shù)量關(guān)系的探索
雙周最佳陣容
頭發(fā)的數(shù)量
消防車有哪些種類
宁晋县| 昌平区| 屯昌县| 怀化市| 仁寿县| 大冶市| 南和县| 石首市| 通河县| 简阳市| 房产| 贵阳市| 南投市| 苏尼特右旗| 景洪市| 察雅县| 秦安县| 江源县| 集贤县| 方城县| 永春县| 福鼎市| 扬州市| 德惠市| 盐津县| 苏州市| 拜城县| 枝江市| 阿巴嘎旗| 高邑县| 泌阳县| 离岛区| 广饶县| 偏关县| 济源市| 金阳县| 卓尼县| 双辽市| 明星| 洛南县| 循化|