国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在影院管理信息系統(tǒng)中的應用研究

2018-10-21 10:52孫夢璐
現(xiàn)代信息科技 2018年8期
關(guān)鍵詞:數(shù)據(jù)挖掘信息系統(tǒng)數(shù)據(jù)庫

摘 要:電影行業(yè)蒸蒸日上,看電影成為越來越多人的日常娛樂方式,與此同時,影院間的競爭更加激烈。在充滿機遇和威脅的市場中,提高自己的競爭優(yōu)勢成為影院必須面對的問題。隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,引入影院管理信息系統(tǒng)是一個有重要意義的課題。本文從影院管理信息系統(tǒng)出發(fā),首先闡述了數(shù)據(jù)挖掘的概念、算法和一般步驟,然后介紹了數(shù)據(jù)準備和數(shù)據(jù)預處理,最后重點分析了數(shù)據(jù)挖掘在影院系統(tǒng)中的具體應用。

關(guān)鍵詞:影院管理;數(shù)據(jù)挖掘;信息系統(tǒng);數(shù)據(jù)庫

中圖分類號:TP311.13 文獻標識碼:A 文章編號:2096-4706(2018)08-0082-03

Abstract:The movie industry is booming. Watching movies has become a daily entertainment mode for more and more people. At the same time,the competition between cinemas is fiercer. In a market full of opportunities and threats,to improve their competitive advantage becomes a problem that theaters must face. With the continuous development of data mining technology,introducing theater management information system is an important issue. This thesis starts with the theater management information system,first elaborates the concept,algorithm and general steps of data mining,then introduces data preparation and data preprocessing,and finally analyzes the specific application of data mining in the theater system.

Keywords:cinema management;data mining;information system;database

0 引 言

中國電影行業(yè)蓬勃發(fā)展。從票房規(guī)模上看,根據(jù)國家廣電總局電影局發(fā)布的數(shù)據(jù)可以看到,2017年全國電影總票房為559.11億元,同比增長13.45%(兩者均包括服務費)。從銀幕上看,全國新增銀幕9597塊,銀幕總數(shù)已達到50776塊,同比增長約23.3%;從觀影人次上看,2017年觀影人次為16.2億人次,較2016年同比增長18.1%,放映場次為9469萬場,較去年同比增長27.2%。相對應地,單場上座人數(shù)也有所下滑;從平均票價上看,2017年與2016年略有下滑。由此可見,在觀影人次不斷增長的同時,全國的銀幕數(shù)量也在不斷上升,影院市場競爭激烈,把握機遇和應對競爭成為了每個影院必須面對的挑戰(zhàn)。

近年來,數(shù)據(jù)思維及數(shù)據(jù)分析方法逐漸滲透到各行各業(yè)中,數(shù)據(jù)挖掘技術(shù)在商業(yè)領域已經(jīng)不是一個新名詞,它最早成功應用于高投入、高風險、高回報的金融領域,現(xiàn)在正在不斷地向電信、保險、零售等客戶資源信息密集的行業(yè)拓展。它在電影行業(yè)的應用也越來越廣、越來越深。本文將從影院管理信息系統(tǒng)出發(fā),研究數(shù)據(jù)挖掘技術(shù)在其中的用武之地,探求數(shù)據(jù)挖掘在提高影院競爭力方面的具體應用。

1 數(shù)據(jù)挖掘

隨著電影行業(yè)的高速發(fā)展,各影院都建立了自己的管理信息系統(tǒng),擁有較為完善的數(shù)據(jù)庫系統(tǒng)。經(jīng)過多年運營,影院內(nèi)部積累了大量的業(yè)務數(shù)據(jù),如售票數(shù)據(jù)、會員信息數(shù)據(jù)、影片放映數(shù)據(jù)等,這些數(shù)據(jù)一般都是海量的,要最大限度地利用這些數(shù)據(jù),從中分析挖掘出對影院運營有用的信息。傳統(tǒng)以MIS為代表的查詢、報表類工具已經(jīng)滿足不了人們對數(shù)據(jù)進行深層次分析的需求。在這種背景下,影院對數(shù)據(jù)挖掘技術(shù)在影院信息系統(tǒng)的深入應用有了急切的需求和更高的要求。

1.1 數(shù)據(jù)挖掘的概念

數(shù)據(jù)挖掘是從海量、不完全的、有噪聲的、模糊的、隨機的大型數(shù)據(jù)庫中發(fā)現(xiàn)隱含在其中有價值的、人們事先不知道的、潛在有用的信息和知識的過程,即“從數(shù)據(jù)中挖掘知識”的過程,也是一種決策支持過程。它主要基于人工智能、機器學習、模式學習和統(tǒng)計學等。通過對大數(shù)據(jù)進行高度自動化地分析,做出歸納性的推理,從中挖掘出潛在的模式,發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,把握行業(yè)結(jié)構(gòu)的進化,跟蹤正在出現(xiàn)的連續(xù)性和非連續(xù)性變化,以及分析現(xiàn)有和潛在競爭對手的能力和方向,幫助企業(yè)、商家和用戶調(diào)整市場營銷策略、改善企業(yè)管理、減少風險以及理性面對市場,并做出正確的決策,從而幫助企業(yè)獲得競爭優(yōu)勢。

1.2 數(shù)據(jù)挖掘的算法

大數(shù)據(jù)挖掘常用的方法有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡方法和Web數(shù)據(jù)挖掘等。這些方法從不同的角度對數(shù)據(jù)進行挖掘。下面主要對數(shù)據(jù)挖掘技術(shù)中的一些經(jīng)典算法進行了介紹。

(1)分類技術(shù)。分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點,并按照分類模式將其劃分為不同的類,目的是通過分類模型將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別中。它是數(shù)據(jù)挖掘技術(shù)中應用最廣泛的技術(shù)之一,目前在商業(yè)上應用得最多。其中分類模型也稱作分類器,其構(gòu)造方法主要有統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡方法和粗糙集方法等;

(2)回歸分析?;貧w分析通過函數(shù)表達數(shù)據(jù)映射的關(guān)系來發(fā)現(xiàn)屬性值之間的依賴關(guān)系。它可以應用到對數(shù)據(jù)序列的預測及相關(guān)關(guān)系的研究中。在市場營銷中,回歸分析可以被應用到各個方面;

(3)聚類技術(shù)。聚類類似于分類,但與分類的目的不同,是把一組個體按照相似性歸成若干類,即“物以類聚”。屬于同一類別的數(shù)據(jù)間的相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關(guān)聯(lián)性很低。常見聚類算法有K-Means、K-Medoids和DBSCAN等;

(4)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系,即可以根據(jù)一個數(shù)據(jù)項的出現(xiàn)推導出其他數(shù)據(jù)項的出現(xiàn)。其挖掘過程主要包括兩個階段:第一階段為從海量原始數(shù)據(jù)中找出所有的高頻項目組,第二階段為從這些高頻項目組產(chǎn)生關(guān)聯(lián)規(guī)則;

(5)人工神經(jīng)網(wǎng)絡。人工神經(jīng)網(wǎng)絡是一種通過訓練來學習的非線性預測模型,具有對非線性系統(tǒng)數(shù)據(jù)的快速擬合能力,可以完成分類、聚類和特征提取等多種數(shù)據(jù)挖掘任務。其最大的特點在于具有學習能力,可以通過學習大量樣本數(shù)據(jù)來獲取輸入、輸出之間的函數(shù)關(guān)系。

1.3 數(shù)據(jù)挖掘的步驟

數(shù)據(jù)挖掘完整的步驟為:

(1)理解數(shù)據(jù)和數(shù)據(jù)的來源;

(2)獲取相關(guān)知識與技術(shù);

(3)整合與檢查數(shù)據(jù);

(4)去除錯誤或不一致的數(shù)據(jù);

(5)建立模型和假設;

(6)實際數(shù)據(jù)挖掘工作;

(7)測試和驗證挖掘結(jié)果;

(8)解釋和應用。

2 數(shù)據(jù)挖掘準備過程

為了更好地挖掘影院的海量數(shù)據(jù),并從中獲得有效信息,數(shù)據(jù)分析人員需要獲取不同來源的數(shù)據(jù),并對數(shù)據(jù)進行清洗、集成、變換和歸約等。

2.1 數(shù)據(jù)準備

數(shù)據(jù)的來源主要分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。影院的日常經(jīng)營會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)會存儲在影院的數(shù)據(jù)庫中,由于數(shù)據(jù)挖掘?qū)?shù)據(jù)真實性、規(guī)范性和完整性的要求比較高,且存儲粒度低的細節(jié)數(shù)據(jù)有利于取得好的數(shù)據(jù)挖掘效果,因此對影院管理信息系統(tǒng)的設計和架構(gòu)有一定要求。此外,影院的管理信息系統(tǒng)還需獲取和存儲外部數(shù)據(jù),主要包括美團、豆瓣、貓眼等電影票售票平臺中的銷售、觀眾評論等數(shù)據(jù)。

2.2 數(shù)據(jù)預處理

沒有高質(zhì)量的數(shù)據(jù)就沒有高質(zhì)量的挖掘結(jié)果。實際應用系統(tǒng)中收集的數(shù)據(jù)通常是“臟”數(shù)據(jù),往往具有不完整、有噪聲和不一致的問題,需要填充空缺的值、識別孤立點、消除噪聲以及糾正數(shù)據(jù)中的不一致。數(shù)據(jù)清洗完后就開始數(shù)據(jù)集成、變換和歸約。數(shù)據(jù)歸約主要是降維,讓數(shù)據(jù)更突出以及更有代表性。

3 數(shù)據(jù)挖掘在影院信息系統(tǒng)的應用

2017年11月26日,國家新聞出版廣電總局電影局主辦的學習座談會上,電影局長張宏森表示:“到2020年,預計中國電影市場將成為世界第一大電影市場,銀幕數(shù)量預計超過6萬塊,年產(chǎn)影片800部左右,年票房預計達到700億元,總體實力會有一個更大的躍升?!泵鎸υ絹碓酱蟮氖袌?,影院信息化已成常態(tài),利用好影院日常經(jīng)營中產(chǎn)生的海量數(shù)據(jù)和市場上冗雜的相關(guān)數(shù)據(jù)來提升自身的競爭力是一大難題,值得思考。

3.1 數(shù)據(jù)挖掘在影院選擇電影方面的應用

電影數(shù)量不斷上升,很多情況下影院必須對放映的電影有所取舍。決策樹、邏輯回歸、人工神經(jīng)網(wǎng)絡都可以有效輔助影院選擇放映的影片,并對排片等進行決策。影響一部電影票房的因素不但有電影本身的先導因素,比如影片預算、導演、演員、口碑以及大量的主觀因素,包括影片排片、影片宣傳及發(fā)行。這里的先導因素可用作決策樹、邏輯回歸、人工神經(jīng)網(wǎng)絡等算法對電影票房進行預測時的變量,然后用大量歷史數(shù)據(jù)對電影票房預測模型進行訓練,得到較為準確的模型。通過該模型預測得到的票房可作為影院對該電影是否放映及其排片的決策依據(jù)。當然,預測票房模型在接下來仍需不斷加以訓練來提高精度。

3.2 數(shù)據(jù)挖掘在影院選擇合作售票平臺方面的應用

線上購票已經(jīng)成為主流觀影人群的習慣動作,2015年以來,通過大規(guī)模的票補,線上售票占比逐漸提升。2017年全國線上售票比例大約在81.7%,較2016年的76.1%提高了約6個百分點。目前觀眾常用的購票平臺有十多個,選擇適量、合適的售票平臺開展合作可以幫助影院實現(xiàn)更好的發(fā)展。

影院信息系統(tǒng)首先需要對一些常見售票平臺的數(shù)據(jù)進行收集存儲;然后統(tǒng)計分析觀影人群主要通過哪幾個平臺購買電影票以及滿意度如何等。其中滿意度的測量評價從平臺的售票數(shù)量、影院售票途徑中的占比和用戶評論等多個維度展開。用戶評論的分析會涉及到簡單自然語言的處理,部分評論需要用到TF-IDF進行進一步分析;最后管理層可通過OLAP技術(shù)來輔助決策。

3.3 數(shù)據(jù)挖掘在影院會員客戶保留和拓展方面的應用

影院的長期經(jīng)營發(fā)展需要客戶保留和客戶拓展兩方面的共同提高。對現(xiàn)有的會員客戶,影院將對其觀影次數(shù)、頻率、觀看影片類型等利用分類、預測的數(shù)據(jù)挖掘技術(shù)進行跟蹤分析,升級服務方案,提高客戶滿意度,從而提高其忠誠度,在其有流失預兆時能及時做出反應進行挽回。影院除收集會員的觀影信息外,也需要收集非會員客戶的觀影行為信息,有針對性地發(fā)現(xiàn)客戶的反應行為模式,將潛在的會員客戶列表排序,努力發(fā)展這些客戶成為會員。這部分主要用到數(shù)據(jù)挖掘技術(shù)中的分類、聚類和關(guān)聯(lián)分析。

影院也可通過關(guān)聯(lián)分析觀影人群在電影類型喜好上的潛在特點,對支持度、置信度高的幾部影片進行套餐化銷售,例如看了《脫單告急》的觀眾也喜歡看《21克拉》,或者看了《后來的我們》的觀眾,通常還會選擇觀看《戰(zhàn)神紀》,這些影片的電影票則可以開展同時購買優(yōu)惠或送飲料的活動。這不僅能提高影院銷售額,也便捷優(yōu)惠了客戶,提升他們對影院的滿意度。

3.4 數(shù)據(jù)挖掘在影院宣傳方面的應用

影響一部電影票房的因素除電影本身的先導因素外,還有大量的主觀因素,如影片排片、影片宣傳及發(fā)行。因此,影院在海報布置、等候區(qū)預告片播放、會員客戶短信推送方面大有可為。分析即將上映和正在上映的影片在網(wǎng)上的輿論、和度等數(shù)據(jù)可輔助決策該影片的海報大小、擺放位置和等候區(qū)大屏幕上預告片的播放頻率。

影院數(shù)據(jù)分析人員對會員的觀影行為進行因子分析,對其進行分類,然后根據(jù)每類會員的行為特征,可有針對性地推薦影片或推薦購買套餐,套餐會有不同影片搭配售票、同時購買同部影片的多張票或購買某時間段的電影票可享優(yōu)惠等多種類型。

4 結(jié) 論

電影院作為產(chǎn)業(yè)鏈的終端環(huán)節(jié),在整個電影產(chǎn)業(yè)格局中扮演著至關(guān)重要的角色,影院的運營也帶動與電影相關(guān)業(yè)態(tài)的發(fā)展,因而影院建設一直是電影產(chǎn)業(yè)發(fā)展的重點。當前全球電影銀幕市場趨于飽和,院線發(fā)展逐漸由新建影院模式向合并收購模式轉(zhuǎn)變。提高和保持自己的競爭優(yōu)勢對影院而言至關(guān)重要,將數(shù)據(jù)挖掘深入應用到影院管理信息系統(tǒng)中,將對影院的運營產(chǎn)生持續(xù)性的積極影響,并得到理想的效果。

參考文獻:

[1] 閆曉妍.基于數(shù)據(jù)挖掘技術(shù)的企業(yè)智能競爭情報系統(tǒng)研究 [J].現(xiàn)代情報,2007(11):187-189.

[2] 羅芳.數(shù)據(jù)挖掘技術(shù)在移動通信決策支持系統(tǒng)中的應用 [J].交通與計算機,2004(4):74-76.

[3] 張蓉.數(shù)據(jù)挖掘技術(shù)在房地產(chǎn)客戶關(guān)系管理系統(tǒng)中的應用 [J].現(xiàn)代情報,2006(6):185-187.

[4] 王玉帛.基于數(shù)據(jù)挖掘?qū)τ绊戨娪捌狈恳蛩氐臏\析 [J].通訊世界,2017(2):236-237.

[5] 鄭建智,段占祺,應桂英.數(shù)據(jù)倉庫和OLAP技術(shù)在衛(wèi)生統(tǒng)計決策支持系統(tǒng)中的應用 [J].中國衛(wèi)生信息管理雜志,2012,9(3):47-51.

作者簡介:孫夢璐(1996.12-),女,漢族,浙江慈溪人,本科。研究方向:信息管理與信息系統(tǒng)。

猜你喜歡
數(shù)據(jù)挖掘信息系統(tǒng)數(shù)據(jù)庫
基于信息系統(tǒng)的計量標準管理
基于項目化+翻轉(zhuǎn)的物流信息系統(tǒng)課堂教學設計與實踐
信息系統(tǒng)管理在社會中的應用
數(shù)據(jù)挖掘綜述
數(shù)據(jù)庫
軟件工程領域中的異常數(shù)據(jù)挖掘算法
基于R的醫(yī)學大數(shù)據(jù)挖掘系統(tǒng)研究
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
姚安县| 渑池县| 且末县| 凌海市| 康平县| 天津市| 扶余县| 清原| 黄平县| 烟台市| 措美县| 阜平县| 福海县| 汉沽区| 定远县| 汉源县| 临高县| 大新县| 荆门市| 如皋市| 体育| 八宿县| 博白县| 乐平市| 海盐县| 富蕴县| 儋州市| 延吉市| 敖汉旗| 民乐县| 湘阴县| 互助| 嘉荫县| 丰都县| 图片| 永泰县| 丹棱县| 余庆县| 江永县| 尚志市| 八宿县|