于司吉
互聯(lián)網(wǎng)金融的大數(shù)據(jù)分析處理研究
摘要:大數(shù)據(jù)采集與存儲是大數(shù)據(jù)研究領(lǐng)域的關(guān)鍵技術(shù),也是大數(shù)據(jù)分析挖掘的基礎(chǔ)。隨著移動互聯(lián)網(wǎng)、新型智能終端、新媒體、物聯(lián)網(wǎng)等技術(shù)和應(yīng)用的快速發(fā)展,傳統(tǒng)的數(shù)據(jù)采集與存儲已經(jīng)不能滿足海量、異構(gòu)、實施數(shù)據(jù)分析的需求,新的產(chǎn)品和技術(shù)方案應(yīng)運而生,并在實踐中不斷地完善和發(fā)展。本文將圍繞大數(shù)據(jù)采集、預(yù)處理、存儲與管理等方面展開討論,重點探討數(shù)據(jù)采集的策略、原則和技術(shù)。其次,結(jié)合數(shù)據(jù)預(yù)處理的研究,探討數(shù)據(jù)清理、集成、變換和規(guī)約的過程;最后,分析數(shù)據(jù)的存儲和管理技術(shù)、產(chǎn)品和解決方案,為互聯(lián)網(wǎng)金融領(lǐng)域的大數(shù)據(jù)分析奠定基礎(chǔ)。
關(guān)鍵詞:互聯(lián)網(wǎng)? 金融? 大數(shù)據(jù)? 分析? 處理? 研究
一、大數(shù)據(jù)應(yīng)用概述
(一)大數(shù)據(jù)應(yīng)簡介
隨著大數(shù)據(jù)技術(shù)的快速發(fā)展,大數(shù)據(jù)應(yīng)用已經(jīng)從探索階段進入了市場化應(yīng)用層面?;ヂ?lián)網(wǎng)行業(yè)作為大數(shù)據(jù)的主要生產(chǎn)者,已成為大數(shù)據(jù)應(yīng)用的重要領(lǐng)域之一?;ヂ?lián)網(wǎng)企業(yè)都在用大數(shù)據(jù)優(yōu)化自身的業(yè)務(wù)運營,在大數(shù)據(jù)開放和合作方面,形成線上線下數(shù)據(jù)的協(xié)同,并從中拓展新的商業(yè)模式。大數(shù)據(jù)除了應(yīng)用在互聯(lián)網(wǎng)行業(yè)之外,隨著互聯(lián)網(wǎng)、通信等技術(shù)不斷發(fā)展,在其他領(lǐng)域也得到了重視和應(yīng)用。下面以智能工業(yè)、醫(yī)療衛(wèi)生、智慧交通、公共安全等方面為例進行分析。
智能工業(yè),在制造業(yè)智能化過程中,定制數(shù)據(jù)達到一定的數(shù)量級后,醫(yī)療衛(wèi)生,能夠建立疾病診斷和市場需求預(yù)測模改進臨床實驗統(tǒng)計和分析方法,對海量的臨床實驗數(shù)據(jù)進行挖掘分析和疾病分型研究,以及基于基因數(shù)據(jù)分析的個性化診療研究等。一些醫(yī)療軟件廠商也在挖掘、分析醫(yī)療大數(shù)據(jù)的價值,實現(xiàn)其市場競爭核心從賣產(chǎn)品到賣服務(wù)的轉(zhuǎn)移,尤其是數(shù)據(jù)挖掘分析服務(wù)。智慧交通,大數(shù)據(jù)技術(shù)在智慧交通中的應(yīng)用主要通過在城市中部署監(jiān)控設(shè)施.
(二)互聯(lián)網(wǎng)金融大數(shù)據(jù)應(yīng)用研究
大數(shù)據(jù)應(yīng)用是金融業(yè)的主流方向,已經(jīng)開展了基于互聯(lián)網(wǎng)金融的新型業(yè)務(wù)拓展,積極發(fā)揮互聯(lián)網(wǎng)金融應(yīng)用。傅志華先生曾在他的“大數(shù)據(jù)在金融行業(yè)的應(yīng)用”中,針對對大數(shù)據(jù)的應(yīng)用進行了分析,具體分析如下。
1.保險大數(shù)據(jù)應(yīng)用,在如圖1所示。
客戶細分和精細化營銷:利用風險偏好、客戶職業(yè)、消費方式等數(shù)據(jù)的分析對客戶進行細分,以實現(xiàn)不同客戶之間的差異化服務(wù);利用大數(shù)據(jù)整合客戶線上線下的行為數(shù)據(jù),挖掘潛在客戶,細化銷售重點,預(yù)防客戶流失;在網(wǎng)絡(luò)營銷中,精細化運營:通過對自有數(shù)據(jù)和客戶的社交數(shù)據(jù)分析,可以解決現(xiàn)有的風險問題。
2.證券行業(yè)大數(shù)據(jù)應(yīng)用,進而指導投資者投資。客戶關(guān)系管理:通過分析客戶的賬戶狀態(tài)、賬戶價值、如圖2所示。
綜上所述,但大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用深度和廣度尚具有較大的擴展空間,大數(shù)據(jù)普惠互聯(lián)網(wǎng)金融,數(shù)據(jù)作為金融的命門,不斷驅(qū)使金融行業(yè)發(fā)展壯大?;ヂ?lián)網(wǎng)金融更是如此,它對數(shù)據(jù)的數(shù)量、質(zhì)量都有很高的要求,而大數(shù)據(jù)技術(shù)不僅可以提高數(shù)據(jù)的質(zhì)量和處理能力,更為其創(chuàng)造了新的商業(yè)機會和價值。因此,大數(shù)據(jù)被視為互聯(lián)網(wǎng)金融快速發(fā)展的重要驅(qū)動之一,在互聯(lián)網(wǎng)金融領(lǐng)域中具有非常重要的作用。
二、大數(shù)據(jù)采集與存儲
(一)大數(shù)據(jù)采集
傳統(tǒng)的數(shù)據(jù)采集又稱數(shù)據(jù)獲取,是指從傳感器和其他待測設(shè)備中自動采集非電量或者電量信號。在互聯(lián)網(wǎng)和大數(shù)據(jù)快速發(fā)展的今天,數(shù)據(jù)采集的內(nèi)涵、范圍和形式已經(jīng)發(fā)生了重要的變化。在大數(shù)據(jù)采集研究領(lǐng)域,數(shù)據(jù)采集的策略、采集原則及采集技術(shù)是研究的重點對象,數(shù)據(jù)采集策略,傳統(tǒng)數(shù)據(jù)采集的來源相對固定、數(shù)據(jù)類型較為單一,隨著企業(yè)信息化和大數(shù)據(jù)時代的到來,金融領(lǐng)域的數(shù)據(jù)采集正發(fā)生著本質(zhì)的改變,數(shù)據(jù)采集已經(jīng)從簡單的業(yè)務(wù)電子化,逐步向管理數(shù)據(jù)化和數(shù)據(jù)化企業(yè)的方向發(fā)展。業(yè)務(wù)電子化主要實現(xiàn)對于手工單證的電子化存儲,并實現(xiàn)流程的電子化,確保業(yè)務(wù)的過程被真實記錄。在管理數(shù)據(jù)化階段,數(shù)據(jù)采集主要實現(xiàn)了企業(yè)內(nèi)部信息、客戶信息、供應(yīng)鏈上下游信息等全面采集,并通過數(shù)據(jù)集市、數(shù)據(jù)倉庫等平臺的建立,實現(xiàn)數(shù)據(jù)的整合。數(shù)據(jù)化企業(yè)實現(xiàn)了數(shù)據(jù)采集向廣度和深度兩個方向發(fā)展:在廣度方面,企業(yè)不僅對每個流程的執(zhí)行結(jié)果進行采集,也對流程中每個節(jié)點執(zhí)行的過程信息進行采集。
對不同數(shù)據(jù)的采集層次分析可知,業(yè)務(wù)電子化主要關(guān)注數(shù)據(jù)采集的真實性和數(shù)據(jù)的質(zhì)量、管理數(shù)據(jù)化關(guān)注數(shù)據(jù)采集的全面性、數(shù)據(jù)化企業(yè)階段關(guān)注數(shù)據(jù)的價值。所以在互聯(lián)網(wǎng)金融領(lǐng)域,如何針對不同的數(shù)據(jù)采集層次,結(jié)合企業(yè)本身的戰(zhàn)略和業(yè)務(wù)目標,以及大數(shù)據(jù)采集對象、范圍、方法和技術(shù)的特點,制定大數(shù)據(jù)的采集策略,是數(shù)據(jù)采集研究的基礎(chǔ)。當前的數(shù)據(jù)采集策略一般有兩類。
(二)以數(shù)據(jù)為中心的采集策略
該策略的目標是盡量多地采集數(shù)據(jù),整合到統(tǒng)一平臺后分析使用。該策略一般需要兩個條件:較大的投入成本和較強的數(shù)據(jù)專家團隊。內(nèi)外部的數(shù)據(jù)采集、數(shù)據(jù)存儲和整合都需要較大的信息化基礎(chǔ)設(shè)施投入,快速有效地甄別數(shù)據(jù)并發(fā)現(xiàn)數(shù)據(jù)價值是可持續(xù)發(fā)展的有效支撐。
(三)以業(yè)務(wù)為導向的采集策略
當業(yè)務(wù)或管理提出數(shù)據(jù)需求時,再進行數(shù)據(jù)采集、分析和處理。該策略能夠有效避免投入成本過大的問題,但完全以需求為導向的數(shù)據(jù)采集,往往無法發(fā)現(xiàn)大數(shù)據(jù)的真正價值,在目標既定的情況下,數(shù)據(jù)的采集、分析都容易出現(xiàn)思維限制。因此,在互聯(lián)網(wǎng)金融領(lǐng)域,企業(yè)可以根據(jù)自身的定位和發(fā)展情況,制定不同的數(shù)據(jù)采集策略。對于完全數(shù)字化的互聯(lián)網(wǎng)金融企業(yè),建議采用第一種采集策略;對于尚處于數(shù)字化過程中、數(shù)據(jù)能力成熟度較低的企業(yè),建議采用第二種采集策略。
(四)大數(shù)據(jù)的預(yù)處理
現(xiàn)實世界中,一方面,數(shù)據(jù)常常因為“臟數(shù)據(jù)”、“雜數(shù)據(jù)”等原因,造成數(shù)據(jù)的不完整、不一致等問題,從而為數(shù)據(jù)的決策和預(yù)測提供支撐。因此,大數(shù)據(jù)的預(yù)處理作為大數(shù)據(jù)分析挖掘的基礎(chǔ),具有十分重要的意義和作用。
三、大數(shù)據(jù)的存儲與管理
(一)數(shù)據(jù)存儲的問題和挑戰(zhàn)
傳統(tǒng)的數(shù)據(jù)存儲解決方案能提供數(shù)據(jù)的可靠性和安全性保障,但是大數(shù)據(jù)時代,面對海量的數(shù)據(jù)及其各種不同的需求,傳統(tǒng)的解決方案日益面臨越來越多的問題,尤其當數(shù)據(jù)量呈現(xiàn)出指數(shù)級增長的情況下,對存儲空間的擴容、存儲計算能力等提出了更高的要求。如何在傳統(tǒng)存儲解決方案的基礎(chǔ)上,研究提出多級存儲技術(shù)來不斷適應(yīng)大數(shù)據(jù)存儲管理或研究提出全新的存儲解決方案,是大數(shù)據(jù)存儲與管理需要解決的問題。本節(jié)圍繞大數(shù)據(jù)的存儲技術(shù)展開,首先介紹大數(shù)據(jù)存儲的問題和挑戰(zhàn),然后介紹三種典型的大數(shù)據(jù)存儲方案分布式文件系統(tǒng)、分布式數(shù)據(jù)庫和云存儲。
隨著大數(shù)據(jù)及其應(yīng)用的爆發(fā)性增長,大數(shù)據(jù)已經(jīng)衍生出了自己獨特的技術(shù)方案,直接推動了存儲、網(wǎng)絡(luò)及計算技術(shù)的發(fā)展。數(shù)據(jù)存儲是大數(shù)據(jù)分析和處理的基礎(chǔ)。目前,數(shù)據(jù)存儲的問題和挑戰(zhàn)主要表現(xiàn)在數(shù)據(jù)存儲系統(tǒng)性能、數(shù)據(jù)存儲的擴容、數(shù)據(jù)存儲模式和數(shù)據(jù)兼容集成等方面。(1)數(shù)據(jù)存儲系統(tǒng)性能。數(shù)據(jù)存儲系統(tǒng)的性能主要從準確性、可用性、可靠性和可擴展性這幾個方面考慮。對于大數(shù)據(jù)的存儲來說,其準確性、可用性和可靠性主要通過較為簡單的多副本(即冗余備份)方式實現(xiàn)??蓴U性關(guān)注的是容量規(guī)劃,同時滿足現(xiàn)有的存儲空間和帶寬的需求,更重要的是考慮到系統(tǒng)擴張后的容量升級。
(二)數(shù)據(jù)存儲的擴容
數(shù)據(jù)存儲的擴容一般通過縱向擴容和橫向擴容兩種方式實現(xiàn)。縱向擴容是指當存儲容量不夠或者存儲磁盤帶寬不夠時,通過添加磁盤達到增加容量和帶寬的作用。在大數(shù)據(jù)環(huán)境下,縱向擴容方式無法滿足其需求,主要是因為海量的數(shù)據(jù)存儲規(guī)模是無法通過添加硬盤來實現(xiàn)的,即使通過縱向擴容達到更大數(shù)據(jù)規(guī)模的需求,其高額的硬件及管理軟件成本也是數(shù)據(jù)存儲管理中心無法承擔的。橫向擴容是指當存儲容量或者帶寬不足以滿足現(xiàn)有要求時,添加存儲節(jié)點來達到擴容的目的。橫向擴容意味著數(shù)據(jù)管理軟件將要統(tǒng)籌更多的節(jié)點,面對更大的壓力。例如,如果采用集中式的主節(jié)點管理,主節(jié)點的能力可能成為整個大數(shù)據(jù)存儲系統(tǒng)的性能瓶頸,尤其是當規(guī)模擴大到成千上萬個節(jié)點時,單管理節(jié)點的模式是不可靠的;如果采用分布式主節(jié)點群管理,軟件的開發(fā)成本和系統(tǒng)本身的復雜度也會相應(yīng)提高。
(三)數(shù)據(jù)存儲模式
傳統(tǒng)的存儲系統(tǒng)是依賴于SAN或者NAS的網(wǎng)絡(luò)存儲模式,在縱向擴容方面存在一定的瓶頸,更重要的是,SAN和NAS的計算節(jié)點與存儲節(jié)點是分開的,數(shù)據(jù)的存取速度被限制在網(wǎng)絡(luò)的瓶頸上,即使通過縱向擴容其存儲池容量,也受限于數(shù)據(jù)處理和存儲節(jié)點之間的網(wǎng)絡(luò)帶寬,無法滿足EB級別數(shù)據(jù)規(guī)模的需求。目前,大數(shù)據(jù)存儲系統(tǒng)普遍采用的是DAS的方式,將計算資源搬遷到存儲節(jié)點上。這種方式存儲管理系統(tǒng)的軟件層增加了許多的新問題,例如,通過網(wǎng)絡(luò)的跨節(jié)點數(shù)據(jù)訪問管理、存儲數(shù)據(jù)塊的管理等。
(四)數(shù)據(jù)兼容集成
大數(shù)據(jù)存儲系統(tǒng)的兼容集成特性涉及若干方面。大數(shù)據(jù)多樣性的特點決定了其存儲系統(tǒng)需要兼容各種種類的數(shù)據(jù),大數(shù)據(jù)存儲需要整合集成各種數(shù)據(jù)源和數(shù)據(jù)存儲系統(tǒng),數(shù)據(jù)交換接口需要兼容各種數(shù)據(jù)傳輸機制,大數(shù)據(jù)應(yīng)用和服務(wù)需要存儲系統(tǒng)支持各種上層應(yīng)用的需求、大數(shù)據(jù)存儲管理需要支持各種介質(zhì)的存儲設(shè)備來滿足上層各種應(yīng)用的需求。這些問題都為數(shù)據(jù)的兼容和集成提出了新的挑戰(zhàn)。
(五)分布式文件系統(tǒng)
只需要像使用本地文件系統(tǒng)一樣管理和存儲文件系統(tǒng)中的數(shù)據(jù)。分布式文件系統(tǒng)所管理的數(shù)據(jù),存儲在分散的設(shè)備或節(jié)點上,存儲資源通過網(wǎng)絡(luò)連接。分布式文件系統(tǒng)是解決當前大數(shù)據(jù)存儲與管理的有效手段之一,分布式數(shù)據(jù)庫必須及時響應(yīng)大規(guī)模用戶的讀/寫請求,
大數(shù)據(jù)分析與挖掘,大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進行分析。因此本節(jié)重點分析大數(shù)據(jù)挖掘。在本節(jié)中,我們首先深入研究傳統(tǒng)數(shù)據(jù)挖掘,然后結(jié)合大數(shù)據(jù)的特有特性,重點聚焦其復雜性,再進一步學習和研究大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘技術(shù)。最后,結(jié)合經(jīng)典數(shù)據(jù)分析挖掘算法的研究,探討其在互聯(lián)網(wǎng)金融中的典型應(yīng)用大數(shù)據(jù)分析和挖掘概述.大數(shù)據(jù)的分析技術(shù)也以前所未有的速度快速發(fā)展。
四、SaaS與互聯(lián)網(wǎng)金融大數(shù)據(jù)
(一)資產(chǎn)大多數(shù)是非標資產(chǎn)
金融大數(shù)據(jù),目前有4個階段。第一階段是基于數(shù)據(jù)存儲;第二階段是分布式計算;第三階段是大數(shù)據(jù)挖掘與分析;第四階段是數(shù)據(jù)服務(wù)。對于商業(yè)銀行,包括中、農(nóng)、工、建和交通這國有五大行來說,都處于第一階段。其中,建行處于平臺選型階段。農(nóng)業(yè)銀行已經(jīng)完成數(shù)據(jù)存儲方面的工作,但還未上線。光大銀行項目,在2013年10月上線,是國內(nèi)第一家真正意義上將金融大數(shù)據(jù)應(yīng)用到銀行核心業(yè)務(wù)系統(tǒng)的案例。
無論是傳統(tǒng)銀行還是新興的互聯(lián)網(wǎng)金融企業(yè)都需要對現(xiàn)有的數(shù)據(jù)進行增值挖掘。如果依靠傳統(tǒng)的挖掘方式,成本巨大。如果采用現(xiàn)有的大數(shù)據(jù)分析技術(shù)、采用分布式集成框架、采用開源框架,一方面可以降低成本,另外一方面運算性能也有所提升?;ヂ?lián)網(wǎng)金融環(huán)境的大數(shù)據(jù)處理之所以難,是因為互聯(lián)網(wǎng)金融企業(yè)的數(shù)據(jù)具有如下特點。
(二)數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)
大家都知道,結(jié)構(gòu)化數(shù)據(jù)可以依賴數(shù)據(jù)庫進行快速的分類統(tǒng)計和分析;如果是非結(jié)構(gòu)化的數(shù)據(jù),就很難利用傳統(tǒng)的數(shù)據(jù)庫來進行快速的分類統(tǒng)計了。另外一個挑戰(zhàn)就是金融大數(shù)據(jù)的安全性,需要提供實時的風險控制,這是很強的安全要求,如圖3所示。
圖3互聯(lián)網(wǎng)金融的實時風險控制SaaS即Software-as-a-Service(軟件即服務(wù)),是隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和應(yīng)用軟件的成熟,提供的基于互聯(lián)網(wǎng)的全新軟件服務(wù)模式。處于初創(chuàng)階段的互聯(lián)網(wǎng)金融企業(yè),很多都會選擇在云平臺(AWS,阿里云)上搭建自己的SaaS服務(wù),從而節(jié)省了不少人力物力。用戶按月或者按請求購買服務(wù)。當用戶量急劇上升的時候,很多服務(wù)響應(yīng)就會變慢,甚至宕機,往往會造成某些大客戶無法容忍。我們在搭建多租戶SaaS金融服務(wù)的時候,由于數(shù)據(jù)庫往往是SaaS系統(tǒng)的瓶頸所在,所以我們通常會根據(jù)用戶的級別,提供不同水平的服務(wù),一些微型的客戶就采用完全共享式的數(shù)據(jù)庫,一些高端的大客戶就采用完全隔離的數(shù)據(jù)模型。
多租戶SaaS平臺下的數(shù)據(jù)庫共享模式如圖4所示,在數(shù)據(jù)層中有三個級別的資源共享。完全隔離:每個租戶均使用單獨的數(shù)據(jù)庫。部分共享:共享數(shù)據(jù)庫,但是使用單獨的模式。完全共享:使用相同的數(shù)據(jù)庫和相同的模式。
多租戶平臺的SOA服務(wù)化及其功能當用戶急劇上升,每天的調(diào)用量成指數(shù)上升的時候,某些核心服務(wù)每天的調(diào)用量達到上億的級別,服務(wù)開始變得不可控。這個時候,僅僅靠增加硬件已經(jīng)不能解決問題了,從服務(wù)器到中間件,再到數(shù)據(jù)庫,任何一個環(huán)節(jié)都可能導致服務(wù)變慢甚至宕機。更有甚者,當某一款新的金融產(chǎn)品上線的時候,海量用戶蜂擁而來搶購的時候,瞬間就會有數(shù)十萬或者數(shù)百萬的用戶進來,頁面開始堵塞,已經(jīng)進去的用戶無法投資,新來的用戶無法登錄,開始不停地刷新頁面……噩夢開始了,數(shù)據(jù)庫開始死鎖,服務(wù)進一步僵化,新來的用戶越聚越多,雪崩開始了,互聯(lián)網(wǎng)金融下的服務(wù)治理互聯(lián)網(wǎng)金融的高速發(fā)展,為企業(yè)帶來了諸多的機遇,還是移動互聯(lián)網(wǎng)應(yīng)用帶來的惡意程序,都為互聯(lián)網(wǎng)金融應(yīng)用帶來了潛在的風險。另一方面,互聯(lián)網(wǎng)金融的監(jiān)管有待完善。
五、物聯(lián)網(wǎng)金融大數(shù)據(jù)
(一)物聯(lián)網(wǎng)金融的應(yīng)用分析
例如,可以利用豐富的傳感器系統(tǒng)與智能監(jiān)管分析系統(tǒng)相結(jié)合,對實物資產(chǎn)進行數(shù)字化分析與管理,解決傳統(tǒng)動產(chǎn)融資業(yè)務(wù)中雙方信息不對稱及誠信的問題,便于銀行對抵押物有更好、更全面的了解與監(jiān)控。在動產(chǎn)質(zhì)押業(yè)務(wù)上把原有的人工防范變?yōu)槿轿坏募夹g(shù)防范,從主觀評價變?yōu)榭陀^評價。從銀行的角度來看,物聯(lián)網(wǎng)技術(shù)可以幫助銀行更好地控制風險;從融資方的角度來看,數(shù)字化后可以
更容易量化實物本身的價值及安全監(jiān)管,變相提高了信用評價,可以更容易與銀行達成融資業(yè)務(wù)。
傳統(tǒng)互聯(lián)網(wǎng)對用戶信息的收集更多的是依賴于用戶自身在互聯(lián)網(wǎng)發(fā)布信息的收集,而物聯(lián)網(wǎng)則可以通過豐富的傳感器技術(shù)借用不同的實物載體對個體進行主動的全方位多元化的信息收集。保險行業(yè)應(yīng)該是最早享受到物聯(lián)網(wǎng)金融益處的行業(yè)之一,以當前流行的智能可穿戴設(shè)備為例,能夠做到全天候?qū)θ梭w的各項生理指標和行為模式進行全方位的監(jiān)控,獲取的大量數(shù)據(jù)可以為電子病歷及保險行業(yè)帶來非常大的價值,例如,可以提前獲知個體發(fā)生潛在疾病的風險從而提供指導意見,判斷投保人可能發(fā)生意外情況的概率而對保單進行調(diào)整等。同時,當前保險公司和個人的信息是完全不對等的(個人對自己身體狀況等信息的了解遠多于保險公司),基于分析數(shù)據(jù)對相關(guān)保險進行合理的定價,同時也更容易發(fā)現(xiàn)潛在的投保人,從而擴展相關(guān)業(yè)務(wù)。
(二)物聯(lián)網(wǎng)金融的主要創(chuàng)新模式
在汽車領(lǐng)域,通過對高智能化汽車芯片的數(shù)據(jù)進行分析并有效評估汽車的整體狀況,不僅可以為汽車廠商提供相應(yīng)的改進修改方案與市場營銷方案等,還能為保險公司車險價值評估提供有效的數(shù)據(jù)支持和指導意見。同時在對駕駛員駕駛行為習慣數(shù)據(jù)分析后,可以為駕駛員提供相應(yīng)的安全行車指導意見,從而有效降低道路事故發(fā)生率。
宏觀來講,物聯(lián)網(wǎng)技術(shù)帶給我們更豐富全方位立體化的,甚至傳統(tǒng)互聯(lián)網(wǎng)不能提供的海量數(shù)據(jù),基于這些大數(shù)據(jù),我們可以建立起更多的數(shù)據(jù)模型,實現(xiàn)更多的跨行業(yè)跨領(lǐng)域的交互與協(xié)作,從而在信息對等的基礎(chǔ)上建立起實體流、信息流、資金流三者合一的物聯(lián)網(wǎng)金融形態(tài)。
六、結(jié)論
大數(shù)據(jù)技術(shù)起源于互聯(lián)網(wǎng)行業(yè),目前最成功的應(yīng)用也在互聯(lián)網(wǎng)行業(yè),在其他行業(yè)的應(yīng)用還處于初級階段。我國的各級政府機關(guān)和各類傳統(tǒng)行業(yè),在日常管理和業(yè)務(wù)運行中也積累了大量的數(shù)據(jù)。大數(shù)據(jù)的真正價值所在是深度價值發(fā)現(xiàn)和行業(yè)應(yīng)用,如何推進大數(shù)據(jù)技術(shù)應(yīng)用,喚醒這些沉睡的大數(shù)據(jù)資源,實現(xiàn)管理上的科學決策,開創(chuàng)新的業(yè)務(wù)模式,是這些數(shù)據(jù)擁有者所關(guān)心的問題。
參考文獻:
[1]李珺.數(shù)據(jù)網(wǎng)格環(huán)境下的元數(shù)據(jù)管理技術(shù).武漢:華中科技大學,2017.
[2]尹文燕.元數(shù)據(jù)發(fā)展現(xiàn)狀及存在問題研究.中國科學技術(shù)信息研究所,2013.
[3]趙慶峰,鞠英杰.國內(nèi)元數(shù)據(jù)研究綜述.現(xiàn)代情報,2013(11):42-45.
[4]陳進.關(guān)于數(shù)據(jù)倉庫元數(shù)據(jù)管理系統(tǒng)的研究與建立.青島:中國海洋大學,2014.
[5]趙輝,張英杰,彭潔.CWM技術(shù)研發(fā)決策支持平臺的元數(shù)據(jù)管理模型研究.中國科技資源導刊,2014,46(4):14-19.
[6]靳麗娟.元數(shù)據(jù)及其在數(shù)字圖書館信息組織中的應(yīng)用.山西:山西大學,2014.
作者單位:南京理工大學紫金學院