国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)實(shí)踐客體的非傳統(tǒng)分析

2019-10-30 18:53:24張少初
科學(xué)與財(cái)富 2019年30期
關(guān)鍵詞:非傳統(tǒng)大數(shù)據(jù)實(shí)踐

張少初

摘 要:本文分析了大數(shù)據(jù)實(shí)踐客體的非傳統(tǒng),包括大數(shù)據(jù)的非確定性,大數(shù)據(jù)的非實(shí)在性,大數(shù)據(jù)的非統(tǒng)一性。

關(guān)鍵詞:大數(shù)據(jù);實(shí)踐;非傳統(tǒng)

如今大數(shù)據(jù)發(fā)展大體分為兩種類型,一是企業(yè)型大數(shù)據(jù),企業(yè)產(chǎn)品的研發(fā)和服務(wù)領(lǐng)域產(chǎn)生了大量的海量數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行整合與分析,完善企業(yè)業(yè)務(wù)吸引更多客戶群體從而正向循環(huán)式的產(chǎn)生了更多的超大規(guī)模的數(shù)據(jù)。二是網(wǎng)絡(luò)型大數(shù)據(jù),在互聯(lián)網(wǎng)上發(fā)生的、蘊(yùn)含極其豐富的可被發(fā)掘價(jià)值的大數(shù)據(jù)。如具有社會(huì)價(jià)值、科研價(jià)值等等的數(shù)據(jù)。大數(shù)據(jù)具有的4 V特性(Volume規(guī)模巨大,Velocity速度極快,Variety模態(tài)多樣,Veracity真?zhèn)坞y辨)導(dǎo)致其規(guī)模與復(fù)雜度顯而易見。帶來的技術(shù)挑戰(zhàn)集中表現(xiàn)在數(shù)據(jù)的異構(gòu)性和不完備性、數(shù)據(jù)處理的實(shí)效性、數(shù)據(jù)的隱私保護(hù)、大數(shù)據(jù)價(jià)值服務(wù)的有效性發(fā)掘、大數(shù)據(jù)的再分析處理等方面。企業(yè)在針對(duì)網(wǎng)絡(luò)型大數(shù)據(jù)方面的問題更為嚴(yán)峻,也一直努力去探討研發(fā)下一個(gè)階段的可行商業(yè)開發(fā)和應(yīng)用形態(tài)。

人們?cè)谶\(yùn)用大數(shù)據(jù)分析從而得到相關(guān)有用價(jià)值的知識(shí),因此大數(shù)據(jù)的價(jià)值更為顯著,在不斷的學(xué)習(xí)與管理大數(shù)據(jù)平臺(tái)期間也要對(duì)獲取的相關(guān)知識(shí)進(jìn)行整合,這樣才能更好的發(fā)展大數(shù)據(jù)的相關(guān)結(jié)構(gòu)。大數(shù)據(jù)技術(shù)的卓越發(fā)展促使了大數(shù)據(jù)引擎檢索與分析在航空、車載服務(wù)、科技資源、醫(yī)療等領(lǐng)域開展了示范應(yīng)用,同時(shí)也獲得了大眾好評(píng)。

1.大數(shù)據(jù)的非確定性

虛擬網(wǎng)絡(luò)數(shù)據(jù)的不確定性包括數(shù)據(jù)的不確定性、模型的不確定性和學(xué)習(xí)的不確定性。以上不同類型的不確定性讓網(wǎng)絡(luò)數(shù)據(jù)難以有效地利用其價(jià)值服務(wù)于人們的實(shí)踐活動(dòng)。

1.1數(shù)據(jù)的不確定性

網(wǎng)絡(luò)原始數(shù)據(jù)的不準(zhǔn)確性和數(shù)據(jù)采集處理粒度、應(yīng)用需求與數(shù)據(jù)集成和展示等因素迫使數(shù)據(jù)在不同尺度、不同維度上都有不同程度的不確定性。傳統(tǒng)數(shù)據(jù)側(cè)重于數(shù)據(jù)準(zhǔn)確性的處理方法,很難應(yīng)對(duì)海量數(shù)據(jù)、多類型數(shù)據(jù)、高維數(shù)據(jù)的不確定性數(shù)據(jù)??偠灾?,在數(shù)據(jù)的信息采集、信息查詢、信息建模、信息存儲(chǔ)、信息檢索和信息挖掘等方面都使用優(yōu)良的新方法來應(yīng)對(duì)數(shù)據(jù)不確定性的挑戰(zhàn)。大數(shù)據(jù)時(shí)代以來,概率統(tǒng)計(jì)論的方法廣泛應(yīng)用于不確定性數(shù)據(jù)的處理當(dāng)中。網(wǎng)絡(luò)時(shí)代使用不確定的方法早已難以應(yīng)付數(shù)據(jù)的不確定性對(duì)大數(shù)據(jù)的影響,高速計(jì)算機(jī)硬件的研發(fā)也為解決數(shù)據(jù)不確定性提供了有效的幫助。

1.2模型的不確定性

只有不斷創(chuàng)新研發(fā)出對(duì)數(shù)據(jù)處理的新的方式,合理的抱我模型表達(dá)與復(fù)雜度之間的平衡才能夠應(yīng)對(duì)在數(shù)據(jù)不確定性的環(huán)境下提出新的模型方法?!翱赡苁澜缒P汀笔轻槍?duì)不確定數(shù)據(jù)的建模系統(tǒng)設(shè)計(jì)上最為樸實(shí)的觀點(diǎn)。只有數(shù)據(jù)的各種狀態(tài)都加以刻畫才能解決各類結(jié)構(gòu)范疇下數(shù)據(jù)的不確定性。模型刻畫模式由于具有較強(qiáng)的表達(dá)能力而且可對(duì)數(shù)據(jù)相關(guān)性進(jìn)行建模,因此被廣泛的應(yīng)用于不確定數(shù)據(jù)的建模領(lǐng)域。此外,不確定性模型的建構(gòu)對(duì)數(shù)據(jù)管理和挖掘信息的查詢、信息的檢索、信息的傳輸、信息的展示等各個(gè)方面都有深有影響。

1.3學(xué)習(xí)的不確定性

數(shù)據(jù)模型需要對(duì)數(shù)據(jù)模型參數(shù)有著深入的了解與學(xué)習(xí)。在眾多偶遇情況中一個(gè)局部有界的查詢都尤為吃力,通過不確定的學(xué)習(xí)方法來解決最優(yōu)解NP問題是現(xiàn)今廣泛運(yùn)用的一種方式?,F(xiàn)今大數(shù)據(jù)時(shí)代背景下,傳統(tǒng)近視的不確定學(xué)習(xí)法應(yīng)對(duì)大數(shù)據(jù)模型的龐大規(guī)模承載著巨大的責(zé)任與挑戰(zhàn)。隨著計(jì)算機(jī)多核CPU/GPU的普及與研究在解決近似的不確定性學(xué)習(xí)數(shù)據(jù)模型方面成為了重要手段。

2.大數(shù)據(jù)的非實(shí)在性

非實(shí)在性是網(wǎng)絡(luò)數(shù)據(jù)有別于其它數(shù)據(jù)的關(guān)鍵特性。網(wǎng)絡(luò)數(shù)據(jù)的非實(shí)在性在數(shù)據(jù)模式的非實(shí)在性、數(shù)據(jù)產(chǎn)生的行為的非實(shí)在性和數(shù)據(jù)智慧的非實(shí)在性在度量和預(yù)判上顯得難以駕馭。

2.1模式的非實(shí)在性

網(wǎng)絡(luò)大數(shù)據(jù)對(duì)數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)功能等方面展現(xiàn)出了局部結(jié)構(gòu)特點(diǎn)所不具備的特定模式特征。在多領(lǐng)域的網(wǎng)絡(luò)數(shù)據(jù)里由于數(shù)據(jù)的屬性不同、功能不同等層面不僅存在著參差不齊的差異而且油相互彼此關(guān)聯(lián)著。數(shù)據(jù)模式在結(jié)構(gòu)方面由于不同的關(guān)聯(lián)程度讓網(wǎng)絡(luò)數(shù)據(jù)構(gòu)成顯現(xiàn)出模塊結(jié)構(gòu),網(wǎng)絡(luò)數(shù)據(jù)自動(dòng)地相互分離涌現(xiàn)成眾多小塊的演變過程促成了網(wǎng)絡(luò)功能結(jié)構(gòu)。這些模式的非實(shí)在性特征對(duì)于社會(huì)網(wǎng)絡(luò)模型的發(fā)展有著重大的科研意義。

2.2行為的非實(shí)在性

大數(shù)據(jù)網(wǎng)絡(luò)有著許多相似的個(gè)體并建立著相關(guān)的社會(huì)關(guān)系。大數(shù)據(jù)采集技術(shù)日新月異的發(fā)展讓人們所獲得的數(shù)據(jù)都具有時(shí)序性,而且虛擬網(wǎng)絡(luò)個(gè)人行為數(shù)據(jù)的暴漲就是其分布統(tǒng)計(jì)的結(jié)果。資深專家Schelling在虛擬社會(huì)網(wǎng)絡(luò)模型演變過程中數(shù)據(jù)自主的相互分離成連通塊這一現(xiàn)象對(duì)于研究虛擬網(wǎng)絡(luò)模型規(guī)律影響盛大。虛擬網(wǎng)絡(luò)個(gè)體發(fā)送郵件的數(shù)量日益劇增,個(gè)體與個(gè)體使用社交網(wǎng)絡(luò)媒介頻率涌現(xiàn)的特征也證明了自然界和社會(huì)中個(gè)體與個(gè)體之間的互相競(jìng)爭(zhēng)模式能顯現(xiàn)出一種不同的同步狀態(tài)的非實(shí)在性。

2.3智慧的非實(shí)在性

網(wǎng)絡(luò)數(shù)據(jù)無法預(yù)測(cè)與掌控,個(gè)體與個(gè)體大量的相互轉(zhuǎn)換、融合和連接所持續(xù)變化演進(jìn)形成各式各樣的語義簡(jiǎn)稱為智慧的非實(shí)在性。這種別具匠心的智慧顯現(xiàn)方式在互聯(lián)網(wǎng)和虛擬網(wǎng)絡(luò)平臺(tái)的火速發(fā)展中建立了全新的數(shù)據(jù)生產(chǎn)模式、大數(shù)據(jù)處理協(xié)作模式和全新的商業(yè)群體模式。

綜上所述,網(wǎng)絡(luò)社交媒介對(duì)大數(shù)據(jù)的研究領(lǐng)域包含了信息數(shù)據(jù)庫、信息數(shù)據(jù)挖掘和信息機(jī)器化學(xué)習(xí)等模式,由于海量大數(shù)據(jù)規(guī)模龐大關(guān)系復(fù)雜且深入研究領(lǐng)域眾多,使得部分研究成果無法直接借鑒于虛擬網(wǎng)絡(luò)大數(shù)據(jù)引擎,至今為止就連大數(shù)據(jù)科學(xué)與技術(shù)的內(nèi)涵與延伸都缺乏權(quán)威的界定與論證,因此大數(shù)據(jù)技術(shù)在理論和方法研究領(lǐng)域發(fā)展空問廣闊,擬定全新的“數(shù)據(jù)”到“數(shù)據(jù)”的研究方案需要更加完備的理論體系的支撐。

3.大數(shù)據(jù)的非統(tǒng)一性

大數(shù)據(jù)的非統(tǒng)一性包含信息數(shù)據(jù)類型的非統(tǒng)一性、信息數(shù)據(jù)內(nèi)在模式的非統(tǒng)一性和信息數(shù)據(jù)結(jié)構(gòu)的非統(tǒng)一性。它使得網(wǎng)絡(luò)大數(shù)據(jù)信息存儲(chǔ)、信息挖掘、信息分析等眾多發(fā)面遭受了前所未有的挑戰(zhàn)。

3.1數(shù)據(jù)類型非統(tǒng)一性

網(wǎng)絡(luò)數(shù)據(jù)日新月異的增長(zhǎng)包括其信息技術(shù)數(shù)據(jù)途徑多樣化的演變與發(fā)展、信息數(shù)據(jù)類型豐富多彩的涌現(xiàn)與擴(kuò)張,網(wǎng)絡(luò)大數(shù)據(jù)技術(shù)針對(duì)信息數(shù)據(jù)采集、信息存儲(chǔ)和信息處理的要求也隨之不斷創(chuàng)新。大數(shù)據(jù)網(wǎng)絡(luò)的興起在個(gè)人運(yùn)用網(wǎng)絡(luò)信息技術(shù)的同時(shí)(如微博、微信等網(wǎng)絡(luò)信息平臺(tái)APP),對(duì)信息數(shù)據(jù)傳播媒介、信息數(shù)據(jù)傳播個(gè)人和信息數(shù)據(jù)引擎等方面都帶來了全新的挑戰(zhàn)。簡(jiǎn)短的文本信息數(shù)據(jù)漸漸取代了傳統(tǒng)通信的長(zhǎng)文本信息數(shù)據(jù),簡(jiǎn)短的文本信息由于長(zhǎng)度短,信息上下文統(tǒng)計(jì)信方便快捷,針對(duì)傳統(tǒng)文本信息挖掘(如信息檢索、信息主題發(fā)現(xiàn)、信息語義和信息情感分析等)帶來恐懼的研究挑戰(zhàn)。相關(guān)聯(lián)的研究數(shù)據(jù)源包括利用外部數(shù)據(jù)源(如Wikipediaft)、搜索結(jié)果等)擴(kuò)充文檔或依賴內(nèi)部類似文檔信息源去擴(kuò)展短文本信息源。外部、內(nèi)部數(shù)據(jù)源的引用都帶來了噪音方面

的不良影響,處理并有機(jī)融合這些各式各異的的數(shù)據(jù)也帶來了前所未有的全新的挑戰(zhàn)。比如社交媒體中探尋地域信息與內(nèi)容的融合、時(shí)空信息技術(shù)與內(nèi)容信息技術(shù)的結(jié)合等。

3.2數(shù)據(jù)結(jié)構(gòu)的非統(tǒng)一性

傳統(tǒng)數(shù)據(jù)對(duì)象的處理不僅能將相關(guān)信息存儲(chǔ)在關(guān)聯(lián)數(shù)據(jù)庫中,而且處理數(shù)據(jù)對(duì)象都具有結(jié)構(gòu)性。虛擬網(wǎng)絡(luò)、移動(dòng)筆記本、傳感器等尖端技術(shù)的出現(xiàn)使得信息數(shù)據(jù)生成方式豐富多彩,非結(jié)構(gòu)化信息數(shù)據(jù)的生成主導(dǎo)了大數(shù)據(jù)信息存儲(chǔ)的主流。非結(jié)構(gòu)化數(shù)據(jù)蘊(yùn)含著五彩繽紛絢麗的數(shù)據(jù)知識(shí)且格式類別眾多,基本包括文本數(shù)據(jù)、文檔數(shù)據(jù)、圖形數(shù)據(jù)、視頻數(shù)據(jù)等形式,其異構(gòu)、可變的表現(xiàn)形態(tài)給數(shù)據(jù)信息分析和數(shù)據(jù)信息挖掘帶來了不小的挑戰(zhàn)。針對(duì)非結(jié)構(gòu)化數(shù)據(jù)信息組織凌亂富含相關(guān)無用信息的特點(diǎn),其帶給數(shù)據(jù)信息存儲(chǔ)、數(shù)據(jù)信息分析帶來了很大的挑戰(zhàn)。

參考文獻(xiàn):

[1]吳吉義,傅建慶,張明西,等.云數(shù)據(jù)管理研究綜述電信科學(xué),2010(5):34.41

[2]呂新奎: 《中國(guó)信息化》,北京:電子工業(yè)出版社,2002年

猜你喜歡
非傳統(tǒng)大數(shù)據(jù)實(shí)踐
基于文本挖掘的非傳統(tǒng)文本批評(píng)話語研究
慢、輕、微、精”,做傳統(tǒng)行業(yè)的非傳統(tǒng)企業(yè)……何丹妮
初中政治教學(xué)中強(qiáng)化新八德教育探討
成才之路(2016年26期)2016-10-08 11:14:30
體驗(yàn)式學(xué)習(xí)在數(shù)學(xué)教學(xué)中的應(yīng)用研究
成才之路(2016年25期)2016-10-08 10:50:54
生物專業(yè)師范生教學(xué)實(shí)習(xí)的問題與對(duì)策研究
成才之路(2016年25期)2016-10-08 10:01:19
校企協(xié)同實(shí)施高職專業(yè)課程改革的實(shí)踐研究
科技視界(2016年20期)2016-09-29 12:54:06
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
論當(dāng)代插圖藝術(shù)的非傳統(tǒng)媒介化
人間(2015年17期)2015-12-30 03:40:52
依托國(guó)際組織 保障我國(guó)非傳統(tǒng)安全
衡东县| 大田县| 峨眉山市| 侯马市| 杭锦后旗| 新竹县| 海南省| 南陵县| 苍梧县| 平罗县| 衡南县| 高台县| 兴隆县| 桐柏县| 双江| 巴林右旗| 吉安县| 贵定县| 海南省| 望城县| 宜黄县| 如皋市| 湛江市| 钦州市| 福泉市| 平阳县| 惠安县| 互助| 清水县| 石泉县| 庆元县| 拜城县| 浏阳市| 拉萨市| 青河县| 唐海县| 濮阳市| 屏东市| 长兴县| 兴化市| 潜山县|