国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

厚數(shù)據(jù)研究綜述*

2022-02-09 00:38李成熙文庭孝
高校圖書(shū)館工作 2022年1期
關(guān)鍵詞:方法研究

●李成熙 文庭孝

(中南大學(xué) 長(zhǎng)沙 410013)

1 引言

人類活動(dòng)持續(xù)不斷地產(chǎn)出海量數(shù)據(jù),其中所蘊(yùn)含的數(shù)據(jù)價(jià)值成為社會(huì)發(fā)展的重要情報(bào)來(lái)源,數(shù)據(jù)則成為工業(yè)時(shí)代邁向數(shù)字時(shí)代的重要資源和生產(chǎn)要素,大數(shù)據(jù)借助于計(jì)算機(jī)的強(qiáng)大算力和分析力,被廣泛應(yīng)用在數(shù)據(jù)密集型產(chǎn)業(yè)領(lǐng)域,大數(shù)據(jù)分析方法成為當(dāng)下最炙手可熱的定量分析方法之一。無(wú)論是科學(xué)研究、企業(yè)競(jìng)爭(zhēng)還是政府決策都越來(lái)越信任和依賴大數(shù)據(jù)。人類受益于科技發(fā)展帶來(lái)的變化,也逐漸習(xí)慣于利用數(shù)據(jù)解決問(wèn)題,傾向于“用數(shù)據(jù)說(shuō)話”的定量分析方法去揭示問(wèn)題的相關(guān)關(guān)系,但大數(shù)據(jù)背后揭示事物因果關(guān)系的定性分析似乎卻被暫時(shí)遺忘。

在大數(shù)據(jù)與人工智能時(shí)代,人類更應(yīng)該正面思考對(duì)大數(shù)據(jù)定量分析方法的過(guò)度依賴,回歸數(shù)據(jù)意義本身,更好地挖掘數(shù)據(jù)背后的故事和因果關(guān)系,正如人工智能先驅(qū)、貝葉斯網(wǎng)絡(luò)之父、圖靈獎(jiǎng)獲得者Pearl教授所說(shuō)“若求大智慧,當(dāng)知真因果”。因此,如何有效開(kāi)發(fā)利用厚數(shù)據(jù),引起了業(yè)界和學(xué)術(shù)界的關(guān)注?,F(xiàn)有文獻(xiàn)表明,國(guó)內(nèi)外厚數(shù)據(jù)研究主要集中在厚數(shù)據(jù)定義研究、厚數(shù)據(jù)應(yīng)用場(chǎng)景研究和厚數(shù)據(jù)分析方法研究等方面。

2 大數(shù)據(jù)與厚數(shù)據(jù)

2.1 大數(shù)據(jù)

大數(shù)據(jù)(Big Data,BD)概念在20世紀(jì)80年代萌芽,隨后不斷被關(guān)注和提及,其內(nèi)涵不斷豐富、外延不斷擴(kuò)大,盡管各行業(yè)對(duì)大數(shù)據(jù)一詞的定義并未達(dá)成統(tǒng)一,但現(xiàn)有定義中對(duì)大數(shù)據(jù)的描述都體現(xiàn)出一個(gè)共同特征,即大數(shù)據(jù)是指超過(guò)了我們現(xiàn)有數(shù)據(jù)處理能力的海量數(shù)據(jù)集。大數(shù)據(jù)也呈現(xiàn)出許多與小數(shù)據(jù)時(shí)代的信息不同的獨(dú)有特征,得到各行業(yè)普遍認(rèn)可的有大數(shù)據(jù)“4V”特征,即volume(容量大)、variety(種類多)、velocity(速度快)和value(價(jià)值密度低)[1]。大數(shù)據(jù)的“4V”特性以及大數(shù)據(jù)時(shí)代相較于小數(shù)據(jù)時(shí)代數(shù)據(jù)運(yùn)用的差異而言,大數(shù)據(jù)分析更傾向于要總體而不要抽樣、要效率而不要精準(zhǔn)、要相關(guān)而不要因果。隨著信息技術(shù)的發(fā)展和人類對(duì)數(shù)據(jù)的深入挖掘,科學(xué)研究不可避免地需要借助數(shù)據(jù)技術(shù),利用定量分析研究方法實(shí)現(xiàn)其方法與成果的科學(xué)化與精準(zhǔn)化。大數(shù)據(jù)分析為人類社會(huì)帶來(lái)全新的發(fā)展契機(jī)無(wú)可否認(rèn),但若持續(xù)加深對(duì)大數(shù)據(jù)的依賴,難免落入大數(shù)據(jù)傲慢與偏見(jiàn)的“陷阱”中,導(dǎo)致社會(huì)發(fā)展被視一切為數(shù)據(jù)并以數(shù)據(jù)為中心的“數(shù)據(jù)主義”世界觀支配和控制[2]。因此,厚數(shù)據(jù)相關(guān)研究開(kāi)始受到業(yè)界關(guān)注。

2.2 厚數(shù)據(jù)

在大數(shù)據(jù)強(qiáng)勢(shì)的時(shí)代背景下,對(duì)大數(shù)據(jù)背后的隱性意義和價(jià)值的挖掘成為新的研究趨勢(shì)。厚數(shù)據(jù)研究的產(chǎn)生和興起也有其特定的社會(huì)背景,時(shí)代發(fā)展和數(shù)據(jù)資源的廣泛應(yīng)用及其現(xiàn)實(shí)價(jià)值為厚數(shù)據(jù)研究提供了動(dòng)力。厚數(shù)據(jù)概念來(lái)源于人類學(xué)的“厚描(深描)”,1990年人類學(xué)家克利福德·格爾茨提出厚描述的概念:“厚描述不僅包括事實(shí),還包括評(píng)論和解釋,并具有特定細(xì)節(jié)、概念結(jié)構(gòu)和豐富含義?!盵3]但厚數(shù)據(jù)一詞作為在大數(shù)據(jù)時(shí)代背景下與大數(shù)據(jù)對(duì)比分析的使用,最早出現(xiàn)在Wang T(2013)《大數(shù)據(jù)需要厚數(shù)據(jù)》一文中,她結(jié)合人類學(xué)“厚描(深描)”概念提出了“厚數(shù)據(jù)”,即“用民族志方法來(lái)解釋在大數(shù)據(jù)視覺(jué)化與分析背后的意義”[4]。

自Wang T提出厚數(shù)據(jù)的概念后,國(guó)內(nèi)外許多學(xué)者開(kāi)始關(guān)注到這個(gè)在大數(shù)據(jù)時(shí)代背景下衍生出來(lái)的新詞,并對(duì)其進(jìn)行了較為深入的剖析解讀。Steven Maxwell指出人們過(guò)度沉迷于數(shù)據(jù)信息的量,卻忽略了“質(zhì)”的部分,也就是分析法所能揭示的商業(yè)洞察。但數(shù)據(jù)量越大并不意味著生成的洞察和創(chuàng)新就一定越多。知名咨詢顧問(wèn)公司ReD負(fù)責(zé)人Madsbjerg(2014)在《華爾街日?qǐng)?bào)》發(fā)表題為《“厚”數(shù)據(jù)的力量》的文章,指出厚數(shù)據(jù)可以協(xié)助企業(yè)理解消費(fèi)者在接觸產(chǎn)品與服務(wù)時(shí)產(chǎn)生的情感以及內(nèi)在的脈絡(luò),因此更能協(xié)助企業(yè)面對(duì)瞬息萬(wàn)變的商業(yè)挑戰(zhàn)[5]。除了商業(yè)領(lǐng)域從業(yè)者的理解外,國(guó)內(nèi)學(xué)者劉琳等(2015)則提出,厚數(shù)據(jù)是指那些豐富的、具有前后關(guān)聯(lián)性的數(shù)據(jù),它們只能通過(guò)丟開(kāi)電腦、深入實(shí)際生活才能獲得[6]。葉麗雅(2015)認(rèn)為厚數(shù)據(jù)是通過(guò)小樣本分析,找出特定人群的需求。大數(shù)據(jù)呈現(xiàn)的是數(shù)據(jù),厚數(shù)據(jù)呈現(xiàn)的是故事。大數(shù)據(jù)揭示的是“是什么”,厚數(shù)據(jù)展現(xiàn)的是“為什么”[7]。趙興龍(2017)提出所謂的厚數(shù)據(jù),是和大數(shù)據(jù)相對(duì)而言的,指在某個(gè)特定教育情景中用于反映學(xué)生全面發(fā)展的質(zhì)性數(shù)據(jù),包括學(xué)生的興趣、愛(ài)好等,媒介載體包括文本、視頻、故事、圖片等,重在揭示學(xué)生成長(zhǎng)過(guò)程中的情感、態(tài)度、某種經(jīng)歷甚至對(duì)某種活動(dòng)的意義等[8]。賈男等(2017)則認(rèn)為厚數(shù)據(jù)是指樣本數(shù)量不大但涵蓋的信息維度眾多的數(shù)據(jù)[9]。孫智中等(2020)指出,Mannik和McGarry借用厚描述的概念給出了厚數(shù)據(jù)的過(guò)程定義,厚數(shù)據(jù)的產(chǎn)生借助于對(duì)行為的觀察,并在參與性觀察的基礎(chǔ)上探索特定的社會(huì)背景和文化[3]??死锼沟侔病ゑR茲比爾格(2020)在其著作《意會(huì):算法時(shí)代的人文力量》中借用人類學(xué)家克利福德·格爾茨提出的“深描”(thcikdescription)概念,將大數(shù)據(jù)時(shí)代難以言傳、只能意會(huì)的信息稱為厚數(shù)據(jù)[10]。

從上述眾多厚數(shù)據(jù)定義中不難看出,國(guó)內(nèi)外學(xué)者在剖析解讀厚數(shù)據(jù)定義時(shí),都以大數(shù)據(jù)作為理論基礎(chǔ)和分析對(duì)象,強(qiáng)調(diào)了厚數(shù)據(jù)蘊(yùn)含的隱性價(jià)值,尤其指出要充分挖掘和利用厚數(shù)據(jù)背后的情感和意義??梢?jiàn),大數(shù)據(jù)與厚數(shù)據(jù)之間緊密的邏輯關(guān)聯(lián)和價(jià)值互聯(lián)。此外,在大數(shù)據(jù)研究過(guò)程中,學(xué)者們還提出了許多衍生概念,并與厚數(shù)據(jù)作對(duì)比?;诤駭?shù)據(jù)與薄數(shù)據(jù)的區(qū)別,Ang(2019)將厚數(shù)據(jù)定義為通過(guò)對(duì)用戶進(jìn)行觀察或互動(dòng)獲得的豐富信息,包括用戶的價(jià)值觀、目標(biāo)和消費(fèi)行為[11]。武濤等(2015)從大數(shù)據(jù)概念出發(fā)構(gòu)建了“數(shù)據(jù)譜系圖”,對(duì)慢數(shù)據(jù)、快數(shù)據(jù)、厚數(shù)據(jù)、輕數(shù)據(jù)等進(jìn)行了深入解析,尤其強(qiáng)調(diào)了厚數(shù)據(jù)區(qū)別于大數(shù)據(jù)的關(guān)鍵在于是否充分考慮“人”的因素,實(shí)質(zhì)在于厚數(shù)據(jù)將數(shù)字理性和人類感性有機(jī)結(jié)合,并指出厚數(shù)據(jù)等于“大數(shù)據(jù)+情景分析”[12]。袁曦臨(2017)則認(rèn)為薄數(shù)據(jù)呈現(xiàn)的是事實(shí),而厚數(shù)據(jù)呈現(xiàn)的包括事實(shí)及其前后聯(lián)系和意義,薄數(shù)據(jù)應(yīng)該向厚數(shù)據(jù)轉(zhuǎn)化,方法則是依靠情景化分析[13]。盡管學(xué)界尚未對(duì)厚數(shù)據(jù)的概念形成權(quán)威一致的共識(shí),但通過(guò)對(duì)國(guó)內(nèi)外研究現(xiàn)狀的梳理可以發(fā)現(xiàn),目前對(duì)“厚數(shù)據(jù)的理論基礎(chǔ)來(lái)源于人類學(xué)哲學(xué)思想”和“厚數(shù)據(jù)是定性分析方法”這兩個(gè)觀點(diǎn)已基本達(dá)成共識(shí)。

3 厚數(shù)據(jù)的應(yīng)用場(chǎng)景

在國(guó)內(nèi)外現(xiàn)有文獻(xiàn)和實(shí)踐應(yīng)用中,厚數(shù)據(jù)應(yīng)用場(chǎng)景多元,較為集中在情報(bào)學(xué)、教育學(xué)、公共管理、醫(yī)療健康、市場(chǎng)營(yíng)銷和社區(qū)改造等多個(gè)領(lǐng)域。

3.1 厚數(shù)據(jù)在情報(bào)學(xué)領(lǐng)域的應(yīng)用

情報(bào)學(xué)作為研究信息、數(shù)據(jù)、情報(bào)和知識(shí)的重要學(xué)科,對(duì)數(shù)據(jù)的研究是其應(yīng)有之義,厚數(shù)據(jù)在情報(bào)學(xué)領(lǐng)域的應(yīng)用體現(xiàn)在對(duì)于厚數(shù)據(jù)理論與方法的研究。袁曦臨(2017)從中美智庫(kù)研究與發(fā)展的差異出發(fā),提出智庫(kù)的研究性取決于多元化的跨界研究與專題化的研究資源建設(shè),而厚數(shù)據(jù)則成為其揭示事實(shí)背后的因果聯(lián)系和核心意義的重要方法[13]。Bornakke等(2018)強(qiáng)調(diào)大數(shù)據(jù)與厚數(shù)據(jù)存在互補(bǔ)關(guān)系,以此提出“大—厚數(shù)據(jù)混合”,通過(guò)兩個(gè)案例證明了如何從異構(gòu)的“大數(shù)據(jù)—厚數(shù)據(jù)”分析中獲得洞察力,并列舉了四種常見(jiàn)的混合策略及其用法[14]。Fiaidhi等(2019)利用厚數(shù)據(jù)分析范式,著重闡述了厚數(shù)據(jù)分析在社交媒體中識(shí)別對(duì)話社區(qū)的重要性[15]。孫智中等(2020)基于大數(shù)據(jù)分析局限,將厚數(shù)據(jù)引入情報(bào)學(xué)信息分析過(guò)程,提出厚數(shù)據(jù)分析的研究模式,包括厚數(shù)據(jù)分析的流程、分析結(jié)果的故事化手段[3]。除學(xué)術(shù)研究成果外,2017年3月由浙江大學(xué)主辦的“大數(shù)據(jù)與厚數(shù)據(jù)發(fā)展前瞻”高端研討會(huì)成功舉行[16]。由此可見(jiàn),情報(bào)學(xué)界對(duì)厚數(shù)據(jù)研究熱度逐漸升溫,厚數(shù)據(jù)研究也成為大數(shù)據(jù)時(shí)代背景下與大數(shù)據(jù)成對(duì)出現(xiàn)的重要研究對(duì)象。

3.2 厚數(shù)據(jù)在教育領(lǐng)域的應(yīng)用

教育大數(shù)據(jù)、智慧教育是隨著信息技術(shù)的發(fā)展而衍生出來(lái)的教育學(xué)研究方向,厚數(shù)據(jù)在教育發(fā)展過(guò)程中的作用日趨明顯。趙興龍(2017)指出在智慧教育體系構(gòu)建研究中,應(yīng)將大數(shù)據(jù)寬度和厚數(shù)據(jù)深度結(jié)合起來(lái),并強(qiáng)調(diào)厚數(shù)據(jù)的寬度是教育領(lǐng)域應(yīng)用過(guò)程中的重點(diǎn)考量因素[8]。S?lvi Mausethagen等(2018)基于對(duì)挪威中學(xué)教師在“結(jié)果會(huì)議”中使用知識(shí)來(lái)源時(shí)發(fā)現(xiàn),數(shù)據(jù)本身雖然很“薄”,但在使用實(shí)踐時(shí)卻很“厚”,指出薄數(shù)據(jù)和厚數(shù)據(jù)的關(guān)系[17]。涂濤等(2019)通過(guò)對(duì)大數(shù)據(jù)與厚數(shù)據(jù)的關(guān)系辨析,提出基于教育大數(shù)據(jù)的厚數(shù)據(jù)挖掘[18]。吳忭等(2019)對(duì)美國(guó)AERA2019年會(huì)進(jìn)行述評(píng),并基于智慧教育研究提出未來(lái)應(yīng)該采用混合的研究方法,回歸跨學(xué)科研究傳統(tǒng),突破“數(shù)據(jù)至上”的藩籬[19]。

3.3 厚數(shù)據(jù)在公共管理領(lǐng)域的應(yīng)用

數(shù)據(jù)成為社會(huì)發(fā)展的重要生產(chǎn)要素之一,被廣泛應(yīng)用于社會(huì)發(fā)展的方方面面,厚數(shù)據(jù)在公共管理領(lǐng)域也開(kāi)始發(fā)揮出獨(dú)特的優(yōu)勢(shì)。婁澤黎等(2017)將大數(shù)據(jù)與厚數(shù)據(jù)進(jìn)行多維度比較,并結(jié)合我國(guó)海關(guān)風(fēng)險(xiǎn)管理的不足,將厚數(shù)據(jù)思維與海關(guān)風(fēng)險(xiǎn)管理工作結(jié)合,對(duì)我國(guó)海關(guān)“智慧風(fēng)險(xiǎn)管理”進(jìn)行深入研究,提出建立海關(guān)風(fēng)險(xiǎn)管理工作回路、立體海關(guān)風(fēng)險(xiǎn)情報(bào)信息系統(tǒng)和海關(guān)風(fēng)險(xiǎn)管理厚數(shù)據(jù)模型[20]。Annelien Smets等(2018)提出“公民工具箱”這一試用于研究人員的支持工具,通過(guò)彌合大數(shù)據(jù)和厚數(shù)據(jù)之間的差距來(lái)應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn),使研究人員能夠在上下文中積累研究經(jīng)驗(yàn),并指出了情景化、語(yǔ)義、分析和人為解釋四種策略[21]。Lu Weisheng等(2018)通過(guò)從政府機(jī)構(gòu)獲得的定量大數(shù)據(jù)與從案例研究和訪談中獲得的定性厚數(shù)據(jù)進(jìn)行三角剖分,以分析綠色建筑對(duì)減少建筑廢料的影響[22]。上述成果從公共管理的不同方面進(jìn)行研究,并提出了結(jié)合厚數(shù)據(jù)的具體應(yīng)用方法,體現(xiàn)出厚數(shù)據(jù)在不同領(lǐng)域的適用性。

3.4 厚數(shù)據(jù)在醫(yī)療健康領(lǐng)域的應(yīng)用

在大數(shù)據(jù)時(shí)代,醫(yī)療大數(shù)據(jù)已經(jīng)成為醫(yī)學(xué)與大數(shù)據(jù)融合研究的熱點(diǎn)領(lǐng)域,對(duì)比之下,“醫(yī)療厚數(shù)據(jù)”相關(guān)研究較少,目前將厚數(shù)據(jù)應(yīng)用于醫(yī)療健康領(lǐng)域的研究成果主要集中在國(guó)外。Kate Winskell等(2018)以艾滋病縱向敘述數(shù)據(jù)為基礎(chǔ),進(jìn)行跨國(guó)和縱向研究而開(kāi)發(fā)出數(shù)據(jù)縮減和管理策略,提出三種數(shù)據(jù)管理方法:敘事量化特征、敘述摘要及關(guān)鍵詞、專題代碼[23]。Ahn Jin-Ho等(2020)將厚數(shù)據(jù)分析方法與喪葬服務(wù)業(yè)結(jié)合,詳細(xì)收集和分析了當(dāng)?shù)鼐用窈吐镁诱叩娜朔N志和用戶體驗(yàn)數(shù)據(jù),指出韓國(guó)喪葬服務(wù)業(yè)的未來(lái)發(fā)展方向[24]。Fiaidhi Jinan等(2021)基于虛擬護(hù)理研究,提出了一種VH-CPS生態(tài)系統(tǒng)解決方案,并在該系統(tǒng)中集成了一個(gè)可以使護(hù)理團(tuán)隊(duì)借鑒厚數(shù)據(jù)分析范式中定性技術(shù)的組件,協(xié)助推動(dòng)更深入的分析,使更多的患者處于低風(fēng)險(xiǎn)的護(hù)理環(huán)境中,并以更低的成本實(shí)現(xiàn)更好的結(jié)果[25]。

3.5 厚數(shù)據(jù)在市場(chǎng)營(yíng)銷領(lǐng)域的應(yīng)用

國(guó)內(nèi)外有關(guān)厚數(shù)據(jù)在企業(yè)創(chuàng)新發(fā)展的研究中,較多體現(xiàn)在與企業(yè)發(fā)展有關(guān)的市場(chǎng)營(yíng)銷、財(cái)務(wù)管理等多個(gè)方面。2004年,丹麥知名玩具企業(yè)樂(lè)高(LEGO)公司在產(chǎn)品市場(chǎng)匹配失敗面臨破產(chǎn)時(shí),該公司新任首席CEO Jorgen VigKnudstorp深入研究?jī)和婢咝枨蟛⑹占舜罅繑?shù)據(jù),利用厚數(shù)據(jù)分析而挽回頹勢(shì)。2008年,丹麥康樂(lè)寶(Colo plast)公司也通過(guò)收集、處理并分析有價(jià)值的用戶厚數(shù)據(jù)解決了市場(chǎng)份額流失困境。厚數(shù)據(jù)在商業(yè)實(shí)踐中的成功應(yīng)用也讓學(xué)者們開(kāi)始關(guān)注到厚數(shù)據(jù)所擁有的獨(dú)特優(yōu)勢(shì)和隱性價(jià)值。

Michael Alles等(2014)強(qiáng)調(diào)厚數(shù)據(jù)可以揭示大數(shù)據(jù)可視化和分析背后的含義,并將厚數(shù)據(jù)分析方法應(yīng)用到審計(jì)實(shí)踐中,指出厚數(shù)據(jù)可以將上下文添加到大數(shù)據(jù)定量分析中[26]。葉麗雅(2015)通過(guò)多個(gè)市場(chǎng)營(yíng)銷案例,指出大數(shù)據(jù)的優(yōu)勢(shì)與風(fēng)險(xiǎn),強(qiáng)調(diào)數(shù)據(jù)分析應(yīng)該多一個(gè)維度,即厚數(shù)據(jù)[7]。Reday等(2016)關(guān)注到小企業(yè)銷售人員利用信息革命中大數(shù)據(jù)分析的能力欠缺,以此提出小企業(yè)銷售人員可以利用人種志、個(gè)人訪談等定性研究方法收集厚數(shù)據(jù)的建議[27]。銀昕(2016)提及兩位市場(chǎng)專家指出企業(yè)要真正預(yù)測(cè)未來(lái)市場(chǎng)和客戶反映,除大數(shù)據(jù)分析外,還需要厚數(shù)據(jù)探究用戶行為背后的動(dòng)機(jī),并強(qiáng)調(diào)市場(chǎng)營(yíng)銷仍需人類學(xué)家[28]。賈男等(2017)指出我國(guó)企業(yè)信用體系現(xiàn)有的問(wèn)題,并提出將厚數(shù)據(jù)抽樣調(diào)查應(yīng)用于體系建設(shè)中,展望大數(shù)據(jù)與厚數(shù)據(jù)的融合應(yīng)用[9]。Thompson(2019)討論了大數(shù)據(jù)神話和厚數(shù)據(jù)機(jī)會(huì)主義在市場(chǎng)營(yíng)銷中的關(guān)系,提出厚數(shù)據(jù)不能挑戰(zhàn)大數(shù)據(jù)神話,并認(rèn)為以文化為導(dǎo)向的營(yíng)銷研究人員應(yīng)該提倡不同的本體論框架[29]。譚青等(2019)基于生存因素理論研究財(cái)務(wù)危機(jī)的影響因素,提出基于大數(shù)據(jù)和厚數(shù)據(jù)的財(cái)務(wù)危機(jī)預(yù)警體系[30]。張晨旭等(2020)通過(guò)面向城市合租人群的冰箱設(shè)計(jì)策略研究,提出大數(shù)據(jù)與厚數(shù)據(jù)融合的基本框架,并以哥本哈根市自行車評(píng)估研究案例說(shuō)明大數(shù)據(jù)與厚數(shù)據(jù)研究方法的必要性和實(shí)用性[31]。

上述研究成果從不同研究視角呈現(xiàn)出大數(shù)據(jù)與厚數(shù)據(jù)十分緊密的聯(lián)系,尤其強(qiáng)調(diào)了要將大數(shù)據(jù)與厚數(shù)據(jù)進(jìn)行融合,真正體現(xiàn)了“如果沒(méi)有‘厚數(shù)據(jù)’,大數(shù)據(jù)就沒(méi)有意義”的核心要義[32]。

3.6 厚數(shù)據(jù)在社區(qū)改造中的應(yīng)用

在社區(qū)改造中需要通過(guò)深入探索,提出更加人性化的建設(shè)方案與策略,厚數(shù)據(jù)及相關(guān)方法正好貼合了這樣的需求。張希煜等(2018)基于厚數(shù)據(jù)提出了社區(qū)更新策略,并提出社區(qū)偵探概念,讓管理者深入社區(qū),通過(guò)數(shù)據(jù)認(rèn)知居民需求,用數(shù)據(jù)實(shí)現(xiàn)共情[33]。張希煜等(2018)基于“厚數(shù)據(jù)+大數(shù)據(jù)”對(duì)背景鴨子橋社區(qū)進(jìn)行診斷和設(shè)計(jì),探索精細(xì)尺度公共空間—公共生活評(píng)估方法,以激活老舊社區(qū)公共生活,進(jìn)一步驗(yàn)證了“厚數(shù)據(jù)+大數(shù)據(jù)”在社區(qū)公共服務(wù)建設(shè)中的重要性和有效性[34]。鄭儒雅等(2020)利用厚數(shù)據(jù)用戶需求調(diào)查優(yōu)勢(shì),采用漸進(jìn)式調(diào)查方法對(duì)上海松江人樂(lè)花園進(jìn)行深入調(diào)研,以迭代分析形式對(duì)行為需求數(shù)據(jù)進(jìn)行挖掘與重構(gòu),提出厚數(shù)據(jù)支持下的老舊社區(qū)公園更新路徑[35]。而霍海鷹等(2020)則基于厚數(shù)據(jù)理念將PSPL(Public Space & Public Life)調(diào)研法與定量空間句法創(chuàng)新融合,以此對(duì)邯鄲市羅城頭老舊社區(qū)中居民行為、公共生活進(jìn)行記錄和解讀,最終以定性與定量結(jié)合的分析結(jié)果提出老舊改造建議[36]。

4 厚數(shù)據(jù)分析方法研究

厚數(shù)據(jù)分析方法是厚數(shù)據(jù)研究的重要方面,是厚數(shù)據(jù)廣泛應(yīng)用于眾多場(chǎng)景中得以實(shí)現(xiàn)的保障。目前,國(guó)內(nèi)外的厚數(shù)據(jù)分析方法研究主要集中在人類學(xué)方法、數(shù)據(jù)故事化方法、可視化方法和情感分析方法四個(gè)方面。

4.1 人類學(xué)方法

厚數(shù)據(jù)的理論基礎(chǔ)來(lái)源于人類學(xué),因此,在厚數(shù)據(jù)應(yīng)用中人類學(xué)方法占據(jù)重要地位。吳忭等(2019)在訪談國(guó)際知名學(xué)習(xí)科學(xué)專家科學(xué)專家戴維·謝弗時(shí),咨詢其有關(guān)大數(shù)據(jù)時(shí)代背景下學(xué)習(xí)和測(cè)評(píng)的觀點(diǎn)和經(jīng)驗(yàn),戴維教授指出目前數(shù)據(jù)挖掘風(fēng)潮下存在一個(gè)誤區(qū),即缺少用于描述行為行為背后含義的理論模型[37]。隨后,吳忭等(2021)又在數(shù)據(jù)驅(qū)動(dòng)視角下提出基于量化民族志的教育研究方法,指出量化民族志注重構(gòu)建“境脈中的理論”和實(shí)現(xiàn)“理論飽和”,并提供了半自動(dòng)編碼軟件nCoder和認(rèn)知網(wǎng)絡(luò)分析兩種研究工具,以確保建模結(jié)果的可靠性和可解釋性[38]??梢?jiàn),盡快在大數(shù)據(jù)時(shí)代展開(kāi)定量分析是效率、速度的體現(xiàn),但厚數(shù)據(jù)分析則更注重?cái)?shù)據(jù)的厚度,更側(cè)重挖掘數(shù)據(jù)背后的人文精神和因果關(guān)系。數(shù)據(jù)不僅僅只是數(shù)字、符號(hào)的堆砌,它記載了人類的歷史,是人類活動(dòng)的反映。因此,人類學(xué)研究方法也成為數(shù)據(jù)科學(xué)研究領(lǐng)域的一個(gè)重要方向。

4.2 數(shù)據(jù)故事化方法

厚數(shù)據(jù)分析需要將數(shù)據(jù)背后的因果關(guān)系、故事及意義展示出來(lái)。國(guó)內(nèi)學(xué)者孫智中等(2020)對(duì)比大數(shù)據(jù)分析后提出了厚數(shù)據(jù)分析的研究路徑,他提到了一個(gè)厚數(shù)據(jù)分析的核心方法,即厚數(shù)據(jù)結(jié)果的故事化,這是一種厚數(shù)據(jù)定性分析的具體方法[3]。數(shù)據(jù)故事化是其重要方法之一,通過(guò)數(shù)據(jù)故事化可以讓人們更加了解數(shù)據(jù)背后的意義、因果關(guān)系和故事。中國(guó)人民大學(xué)朝樂(lè)門(mén)教授研究團(tuán)隊(duì)是目前國(guó)內(nèi)研究數(shù)據(jù)故事化的核心團(tuán)隊(duì)之一。朝樂(lè)門(mén)等(2019)在《中國(guó)圖書(shū)館學(xué)報(bào)》發(fā)表《數(shù)據(jù)故事化:從數(shù)據(jù)感知到數(shù)據(jù)認(rèn)知》一文,提出數(shù)據(jù)呈現(xiàn)的兩種主要途徑即數(shù)據(jù)可視化和數(shù)據(jù)故事化,并對(duì)數(shù)據(jù)故事化的定義、理論基礎(chǔ)、方法工具及應(yīng)用場(chǎng)景進(jìn)行了深入研究[39]。張晨(2021)根據(jù)數(shù)據(jù)故事化研究現(xiàn)狀構(gòu)建了基于用戶交互行為分析的數(shù)據(jù)故事模型[40],該團(tuán)隊(duì)又在《情報(bào)資料工作》2021年第2期上發(fā)表了“數(shù)據(jù)故事化:一個(gè)值得研究的新方向”的研究專題,主要包括與數(shù)據(jù)故事化相關(guān)的研究成果,該團(tuán)隊(duì)對(duì)數(shù)據(jù)故事的自動(dòng)生成、數(shù)據(jù)故事敘述的關(guān)鍵技術(shù)、數(shù)據(jù)故事化評(píng)價(jià)以及可視故事化的特征、方法與應(yīng)用進(jìn)行了全面深入的探究[41-44],其研究基礎(chǔ)夯實(shí),研究成果質(zhì)量高,可以成為厚數(shù)據(jù)方法研究中的重要參考來(lái)源。Thomas Neifer等(2020)指出數(shù)據(jù)故事化方法在公司戰(zhàn)略挑戰(zhàn)和數(shù)據(jù)分析結(jié)果的有效傳達(dá)上起著決定性的作用[45]??梢钥闯觯瑪?shù)據(jù)故事化是目前厚數(shù)據(jù)分析中的重要方法之一,也成為數(shù)據(jù)科學(xué)研究的一個(gè)新方向。

除此之外,朱夢(mèng)澤等(2019)對(duì)將數(shù)據(jù)及信息以故事敘述方式生動(dòng)呈現(xiàn)的敘事式可視化研究進(jìn)行了綜述[46]。在具體應(yīng)用中,數(shù)據(jù)新聞使用數(shù)據(jù)并以最佳方式敘述故事,且是開(kāi)放的、可訪問(wèn)的和啟發(fā)性的[47],數(shù)據(jù)故事化作為數(shù)字新聞的一項(xiàng)特色也正在迅速得到重視并廣泛應(yīng)用[48]。楊曉軍(2016)認(rèn)為數(shù)據(jù)的復(fù)雜性決定了新聞更應(yīng)注重故事化敘事,且受閱讀方式、數(shù)據(jù)呈現(xiàn)與新聞敘述的三重驅(qū)動(dòng)[49]。檔案是人類文化發(fā)展中寶貴的歷史記錄,牛力等(2021)基于數(shù)字人文環(huán)境下檔案研究方法的發(fā)展,提出了以“發(fā)現(xiàn)”“重構(gòu)”和“故事化”三原語(yǔ)為主線的檔案研究路徑基本模式,形成了數(shù)字人文視角下檔案研究的方法論體系[50]。

4.3 可視化方法

臺(tái)灣學(xué)者宋世祥(2020)在其著作《百工里的人類學(xué)家2:厚數(shù)據(jù)的創(chuàng)新課》中提出在利用人類學(xué)研究方法如民族志、田野調(diào)查后,應(yīng)該促進(jìn)數(shù)據(jù)價(jià)值的有效傳遞,并基于厚數(shù)據(jù)的文化觀將其進(jìn)行創(chuàng)新[51]。宋教授強(qiáng)調(diào)應(yīng)善用厚數(shù)據(jù),化解溝通障礙,因此,他提出了厚數(shù)據(jù)可視化的四種路徑,包括厚數(shù)據(jù)如何被理解:以同理心貼近對(duì)方的語(yǔ)言和經(jīng)驗(yàn);如何被看見(jiàn):以視覺(jué)化圖表和照片重構(gòu)場(chǎng)景與脈絡(luò);如何被體驗(yàn):激發(fā)五感,搜集具有象征意義的物件;共創(chuàng)歷程:邀請(qǐng)厚數(shù)據(jù)提供者加入共創(chuàng)設(shè)計(jì)。厚數(shù)據(jù)研究是跨學(xué)科的,為加深數(shù)據(jù)的厚度、立體度,實(shí)現(xiàn)數(shù)據(jù)的有效傳遞和溝通,宋教授設(shè)計(jì)了三大類共六種厚數(shù)據(jù)可視化工具。第一類是厚數(shù)據(jù)思考視角工具:使用者基本維度圖、元問(wèn)題圖;第二類是脈絡(luò)重構(gòu)工具:身體隱喻提問(wèn)圖、使用經(jīng)驗(yàn)脈絡(luò)重建圖;第三類是需求探索與創(chuàng)新點(diǎn)挖掘工具:換位思考圖、人物志+冰山模型圖。此外,易旎等(2021)闡述了可視故事化的基本流程,并總結(jié)了三種可視故事化方法,包括視覺(jué)結(jié)構(gòu)、突出顯示和過(guò)渡指導(dǎo)[44],并提出人機(jī)交互、數(shù)據(jù)可視化、文本處理和信息融合四種技術(shù)。

4.4 情感分析方法

根據(jù)國(guó)內(nèi)外學(xué)者對(duì)厚數(shù)據(jù)的相關(guān)研究可以看出,在大數(shù)據(jù)時(shí)代不僅要利用好大數(shù)據(jù),更要揭示數(shù)據(jù)的意義和情感,讓數(shù)據(jù)有溫度。目前,國(guó)內(nèi)外許多學(xué)者利用不同的工具、方法,基于信息技術(shù)的定量化手段,研究如何有效地揭示數(shù)據(jù)意義及情感。

Thelwall Mike等(2009)將數(shù)據(jù)挖掘和內(nèi)容分析相結(jié)合,探討了My Space評(píng)論中情感程度與年齡、性別之間的關(guān)系[52]。何躍等(2018)利用樸素貝葉斯分類器對(duì)2015年北京新浪微博用戶發(fā)布的有關(guān)“霧霾”的內(nèi)容進(jìn)行情感分析,以此分析霧霾輿情、引導(dǎo)公眾情緒[53]。羅玉萍等(2018)利用語(yǔ)義分析技術(shù)對(duì)學(xué)生評(píng)教信息進(jìn)行情感挖掘,建立起情感詞庫(kù)并設(shè)置權(quán)重,再以3GWS工具對(duì)學(xué)生評(píng)教信息中對(duì)情感的褒貶程度進(jìn)行計(jì)算,形成學(xué)生對(duì)教師的評(píng)價(jià)意見(jiàn),羅玉萍等以煙臺(tái)大學(xué)相關(guān)數(shù)據(jù)驗(yàn)證了該方法的科學(xué)有效[54]。Kauffmann等(2019)提出了一個(gè)使用自然語(yǔ)言處理技術(shù)(NLP)的通用框架,包括情感分析、文本數(shù)據(jù)挖掘和聚類技術(shù),以獲得針對(duì)不同產(chǎn)品特征的基于消費(fèi)者情感的新評(píng)分,并得出結(jié)論:企業(yè)可以根據(jù)客戶的意見(jiàn)對(duì)客戶進(jìn)行分類來(lái)改進(jìn)推薦系統(tǒng)[55]。邵珊珊等(2019)利用Python和深度學(xué)習(xí)方法挖掘中美知名電商的評(píng)價(jià)話語(yǔ)并進(jìn)行情感分析,旨在促進(jìn)不同語(yǔ)種間的大數(shù)據(jù)情感分析研究[56]。史達(dá)等(2020)運(yùn)用Word2Vec、LDA和機(jī)器學(xué)習(xí)(LR、NB、SVM)等方法對(duì)Trip Advisor的酒店評(píng)論數(shù)據(jù)進(jìn)行量化處理和情感分析,該研究更加準(zhǔn)確地揭示了顧客體驗(yàn)的真實(shí)情感,但除了技術(shù)支撐外,基于數(shù)據(jù)挖掘的情感分析也要重視人的因素[57]。杜洪濤等(2016)在輿情研判研究中指出大數(shù)據(jù)分析和計(jì)算機(jī)技術(shù)的重要作用,強(qiáng)調(diào)在實(shí)踐中應(yīng)重視人的主導(dǎo)作用和技術(shù)的互動(dòng)耦合[58]。

從上述研究成果可以看出,在情感分析研究中較常利用的工具包括但不限于Python、3GWS、Word2Vec、LDA等,使用的方法包括但不限于深度學(xué)習(xí)、樸素貝葉斯、內(nèi)容分析法等。值得注意的是,部分研究成果在闡述數(shù)據(jù)挖掘相關(guān)技術(shù)特性時(shí),仍強(qiáng)調(diào)了人在數(shù)據(jù)情感分析時(shí)的主導(dǎo)作用,在之后的厚數(shù)據(jù)研究中應(yīng)加強(qiáng)“以人為本”的研究思維。盡管上述研究成果中并未直接提及“厚數(shù)據(jù)”一詞,但其對(duì)數(shù)據(jù)背后情感和因果的揭示與“厚數(shù)據(jù)”內(nèi)涵較為相近,本文通過(guò)梳理部分國(guó)內(nèi)外基于數(shù)據(jù)挖掘的情感分析方法,旨在為未來(lái)厚數(shù)據(jù)分析方法研究提供參考。

5 厚數(shù)據(jù)研究展望

盡管厚數(shù)據(jù)的理論基礎(chǔ)可以追溯到20世紀(jì)90年代甚至更久遠(yuǎn)的人類學(xué)哲學(xué)思想,但國(guó)內(nèi)外厚數(shù)據(jù)的相關(guān)研究卻集中在2013年大數(shù)據(jù)被廣泛提及后,主要表現(xiàn)為厚數(shù)據(jù)與大數(shù)據(jù)成對(duì)出現(xiàn)。由此看來(lái),正是有了大數(shù)據(jù)才讓人們關(guān)注到厚數(shù)據(jù)并對(duì)其進(jìn)行探索。對(duì)于這樣一個(gè)大數(shù)據(jù)時(shí)代的全新概念,未來(lái)的研究重點(diǎn)和方向或?qū)⒓性诤駭?shù)據(jù)理論研究、厚數(shù)據(jù)融合研究、厚數(shù)據(jù)方法研究、厚數(shù)據(jù)應(yīng)用研究等多個(gè)方面。

5.1 厚數(shù)據(jù)理論研究

目前,業(yè)界和學(xué)術(shù)界對(duì)厚數(shù)據(jù)都有較為廣泛的實(shí)踐應(yīng)用和學(xué)術(shù)研究,但是對(duì)厚數(shù)據(jù)的定義及內(nèi)涵仍未達(dá)成一致,有關(guān)厚數(shù)據(jù)的定義研究仍有待深入。實(shí)踐需要理論的支撐,理論的產(chǎn)生發(fā)展都有其不同的社會(huì)背景和領(lǐng)域特色,尤其是在大數(shù)據(jù)背景下,厚數(shù)據(jù)作為一個(gè)全新的概念,成為數(shù)據(jù)科學(xué)研究中不可忽略的一個(gè)分支。因此,未來(lái)需要持續(xù)不斷地對(duì)厚數(shù)據(jù)定義與理論進(jìn)行研究,拓展厚數(shù)據(jù)理論以支撐厚數(shù)據(jù)實(shí)踐和應(yīng)用的能力,全面把握厚數(shù)據(jù)科學(xué)理論對(duì)實(shí)踐的指導(dǎo)作用。

5.2 厚數(shù)據(jù)融合研究

人類一直都以大數(shù)據(jù)的海量、高價(jià)值為傲,并以此作為根本遵循去進(jìn)行數(shù)據(jù)應(yīng)用,但在技術(shù)迅速發(fā)展的洪流中,人類是否應(yīng)該停下腳步進(jìn)行思考,或者回歸到傳統(tǒng)的分析方法上。當(dāng)然,最好的發(fā)展,就是傳統(tǒng)方法和新技術(shù)方法的不斷磨合、融合,共同進(jìn)步、發(fā)展。大數(shù)據(jù)與厚數(shù)據(jù)的結(jié)合正是定量分析和定性分析方法的巧妙融合,既能利用大數(shù)據(jù)的寬度來(lái)揭示數(shù)據(jù)的相關(guān)關(guān)系,又能利用厚數(shù)據(jù)的深度來(lái)揭示數(shù)據(jù)背后的因果關(guān)系和意義價(jià)值。在大數(shù)據(jù)時(shí)代背景下,厚數(shù)據(jù)的跨學(xué)科發(fā)展值得關(guān)注,學(xué)科融合應(yīng)該更加多元,如厚數(shù)據(jù)可以與情報(bào)學(xué)領(lǐng)域中的計(jì)量學(xué)進(jìn)行跨學(xué)科融合,形成厚數(shù)據(jù)計(jì)量學(xué),利用計(jì)量學(xué)方法對(duì)厚數(shù)據(jù)隱性知識(shí)進(jìn)行深入挖掘并揭示意義。

5.3 厚數(shù)據(jù)方法研究

除上文提到的人類學(xué)研究方法、數(shù)據(jù)故事化方法、可視化方法和情感分析方法外,Ethnography Matters刊載的題為《(大)數(shù)據(jù)時(shí)代的五種混合研究方法》的文章強(qiáng)調(diào)“大數(shù)據(jù)傳遞數(shù)字;厚數(shù)據(jù)可以傳遞故事。大數(shù)據(jù)依賴于機(jī)器學(xué)習(xí);厚數(shù)據(jù)依賴于人類的學(xué)習(xí)”,并提出實(shí)時(shí)接受受眾反饋的民主反思法、自拍工作坊、跟蹤采訪、移動(dòng)應(yīng)用的演練方法和微量人種志五種混合創(chuàng)新研究方法,在這五種混合研究方法中,研究人員概述了他們?nèi)绾问褂脛?chuàng)新的方法來(lái)充分利用數(shù)字?jǐn)?shù)據(jù),這些方法揭示了數(shù)據(jù)的含義、上下文和故事[59]。數(shù)據(jù)的產(chǎn)生歸根結(jié)底來(lái)源于人類活動(dòng),在頻繁的人類活動(dòng)和海量數(shù)據(jù)堆積下,人類社會(huì)成為一個(gè)偌大的數(shù)據(jù)庫(kù),且人類具備大數(shù)據(jù)分析中機(jī)器所沒(méi)有或不能達(dá)到的揭示情感和意義的能力,因此“以人為本”是厚數(shù)據(jù)分析不可或缺的研究思維,將厚數(shù)據(jù)與大數(shù)據(jù)分析方法融合創(chuàng)新成為未來(lái)揭示數(shù)據(jù)意義和情感的重要方向之一。

5.4 厚數(shù)據(jù)應(yīng)用研究

國(guó)內(nèi)外諸多學(xué)者都更傾向于將大數(shù)據(jù)與厚數(shù)據(jù)結(jié)合在一起進(jìn)行多場(chǎng)景應(yīng)用,這既適應(yīng)了大數(shù)據(jù)時(shí)代發(fā)展,又融合了定性分析優(yōu)勢(shì)。在大數(shù)據(jù)和厚數(shù)據(jù)如何在企業(yè)組織中發(fā)揮協(xié)同效應(yīng)的思考中,Wang T提出了大數(shù)據(jù)和厚數(shù)據(jù)融合發(fā)展的多個(gè)應(yīng)用場(chǎng)景,包括但不限于健康醫(yī)療、社會(huì)網(wǎng)絡(luò)分析、產(chǎn)品/服務(wù)設(shè)計(jì)和品牌戰(zhàn)略等[4]?;趪?guó)內(nèi)外研究現(xiàn)狀可以發(fā)現(xiàn),厚數(shù)據(jù)研究場(chǎng)景十分廣泛,包括情報(bào)學(xué)研究、教育大數(shù)據(jù)、公共管理、人類健康、財(cái)務(wù)審計(jì)、市場(chǎng)營(yíng)銷、社區(qū)改造等。隨著信息技術(shù)、數(shù)字人文等多領(lǐng)域的創(chuàng)新發(fā)展,厚數(shù)據(jù)應(yīng)用場(chǎng)景將會(huì)更加多元化。

6 結(jié)語(yǔ)

本文首先對(duì)當(dāng)前國(guó)內(nèi)外厚數(shù)據(jù)的相關(guān)定義研究進(jìn)行綜述,可以看出,目前各界對(duì)厚數(shù)據(jù)的定義尚未達(dá)成權(quán)威一致的共識(shí),但基本形成了以人類學(xué)哲學(xué)思想為理論基礎(chǔ)、以定性分析為核心的內(nèi)涵。其次,對(duì)國(guó)內(nèi)外厚數(shù)據(jù)在具體場(chǎng)景中的應(yīng)用進(jìn)行綜述,總結(jié)歸納出包括情報(bào)學(xué)、教育、公共管理、醫(yī)療健康、市場(chǎng)營(yíng)銷和社區(qū)改造六大應(yīng)用場(chǎng)景。再次,對(duì)國(guó)內(nèi)外厚數(shù)據(jù)分析方法進(jìn)行認(rèn)真思考和剖析,歸納出目前厚數(shù)據(jù)分析研究中的四大類研究方法,主要包括人類學(xué)方法、數(shù)據(jù)故事化方法、可視化方法和情感分析方法。最后,基于國(guó)內(nèi)外厚數(shù)據(jù)研究的最新進(jìn)展和發(fā)展趨勢(shì),指出厚數(shù)據(jù)未來(lái)的研究重點(diǎn)和方向,可圍繞厚數(shù)據(jù)理論研究、厚數(shù)據(jù)融合研究、厚數(shù)據(jù)方法研究和厚數(shù)據(jù)應(yīng)用研究四個(gè)方面進(jìn)行深入探究。

猜你喜歡
方法研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國(guó)內(nèi)翻譯研究述評(píng)
遼代千人邑研究述論
視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
學(xué)習(xí)方法
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
用對(duì)方法才能瘦
四大方法 教你不再“坐以待病”!
賺錢(qián)方法
楚雄市| 安图县| 治县。| 南雄市| 黄梅县| 高碑店市| 吴旗县| 准格尔旗| 宾川县| 友谊县| 邵阳县| 明星| 佛山市| 河间市| 大埔县| 新平| 延吉市| 上蔡县| 白朗县| 新竹市| 曲阳县| 右玉县| 通辽市| 绥滨县| 遵化市| 丰县| 商洛市| 浦北县| 牡丹江市| 四平市| 江孜县| 政和县| 固安县| 林州市| 乌什县| 民权县| 广河县| 泽州县| 额尔古纳市| 江达县| 富源县|