張 敏,姜冠蘭,丁 恒
(1. 華中師范大學(xué)信息管理學(xué)院,武漢 430079;2. 西南大學(xué)計算機與信息科學(xué)學(xué)院,重慶 400715)
在“互聯(lián)網(wǎng)+”時代,人類科學(xué)活動模式面臨新的變革。傳統(tǒng)的科學(xué)結(jié)構(gòu)、研究過程、交流方式與價值體系都被置于新的網(wǎng)絡(luò)開放環(huán)境之中。21世紀(jì)初,Academia.edu、ResearchGate、Mendeley和小木蟲等優(yōu)秀學(xué)術(shù)社區(qū)的創(chuàng)立,為科研人員提供了全新的互動領(lǐng)域。學(xué)術(shù)社區(qū)用戶以提問、回答會話交互方式,就某一特定問題的持續(xù)討論拓展了學(xué)術(shù)交流的深度,促進學(xué)術(shù)知識共享,為相關(guān)領(lǐng)域發(fā)展奠定學(xué)術(shù)知識基礎(chǔ)。
交互通常被理解為“需要至少兩個對象和兩個動作的相互事件,這兩個物體和事件相互影響時,就會發(fā)生相互作用”[1]。LIS(library and informa‐tion science)領(lǐng)域早期聚焦信息查詢者與信息系統(tǒng)之間的交互研究,同時關(guān)注信息查詢者與中介代理者(如圖書館參考館員)之間的問題協(xié)商交互過程,這類研究考察了代理者如何與用戶協(xié)商查詢術(shù)語,以及在查詢過程中圖書館員和用戶的角色。隨后,相關(guān)研究擴展至更寬泛的信息系統(tǒng)環(huán)境中的人機交互及人際溝通研究[2]。隨著搜索引擎和網(wǎng)絡(luò)社區(qū)的發(fā)展,問答服務(wù)和在線討論論壇的快速發(fā)展促進了用戶會話交互研究發(fā)展,這種會話交互是基于計算機協(xié)調(diào)的多人之間非正式交流,相關(guān)研究借鑒了面對面對話中蘊含的語言特征和副語言特征(如面部表情等),借助用戶會話行為的客觀指標(biāo),探究用戶會話問題特征、回答質(zhì)量等問題。還有學(xué)者利用參與會話線程的用戶數(shù)量、話輪次數(shù)探究會話結(jié)構(gòu)特征,或通過小樣本會話文本數(shù)據(jù)定性編碼以探究會話模式?,F(xiàn)有研究較少針對會話交互過程,以及自動抽取與挖掘分析用戶會話序列結(jié)構(gòu),未能完整反映會話成員針對某一議題形成和發(fā)展知識的建構(gòu)過程。
伴隨學(xué)者們越來越多地參與到網(wǎng)絡(luò)學(xué)術(shù)社區(qū)交互,識別其中會話交互模式,探究會話交互本質(zhì)具有重要的意義。本研究選取小木蟲論壇進行實證分析,在用戶會話行為和會話內(nèi)容定性編碼的基礎(chǔ)上,通過R語言抽取用戶的會話交互序列結(jié)構(gòu),自動聚類出用戶典型會話模式,繼而從知識形成與發(fā)展的建構(gòu)過程探究會話交互的質(zhì)量特征,重點探索以下問題:①學(xué)術(shù)社區(qū)中用戶會話交互行為的整體分布狀況如何?②學(xué)術(shù)社區(qū)用戶會話交互行為序列有哪些?主要的會話模式是什么?③會話交互質(zhì)量水平如何?④不同會話模式的交互質(zhì)量水平有何差異?是否受會話長度的影響?本研究有助于深入理解網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶會話交互的規(guī)律,以增強開放領(lǐng)域問答系統(tǒng)互動性設(shè)計,提高用戶生成內(nèi)容的共享效率,增強用戶黏性,促進學(xué)術(shù)社區(qū)健康持續(xù)發(fā)展。
相關(guān)研究主要集中在網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶交互行為類型及交互關(guān)系、交互內(nèi)容、交互模式與質(zhì)量等方面。
(1)會話交互行為類型及交互關(guān)系研究。網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶的會話交互行為目前還沒有一致的定義與劃分標(biāo)準(zhǔn)。學(xué)者們按照用戶參與程度,將其劃分為發(fā)帖行為、回帖行為和瀏覽行為[3-4]。根據(jù)用戶對平臺功能的使用,劃分出分享、檢索、閱讀、評論和推薦等行為[5]。按照用戶交互目的,劃分出利用行為、交互及合作行為[6]等。此外,研究者還常常通過社區(qū)的鏈接關(guān)系、回復(fù)關(guān)系、好友關(guān)系、會話關(guān)系等數(shù)據(jù)構(gòu)建社群網(wǎng)絡(luò),以分析用戶交互結(jié)構(gòu)特征[7-8]。這些研究從行為學(xué)視角刻畫了學(xué)術(shù)社區(qū)用戶細(xì)粒度的交互行為特征和關(guān)系模式,不足之處在于其割裂了某一議題的意義,不能夠完整反映整個會話過程交互特征。
(2)會話交互內(nèi)容研究。學(xué)者們將用戶會話劃分為提問內(nèi)容和回答內(nèi)容兩個部分,根據(jù)具體會話內(nèi)容進一步編碼為事實信息、意見和建議等主要類型。例如,Deng等[9]將學(xué)術(shù)社區(qū)中用戶提問分為信息型、意見型、建議型,并指出用戶更傾向于獲取事實知識,表達看法、提供事實信息和提供建議是最常見的回帖內(nèi)容;盧恒等[10]發(fā)現(xiàn)小木蟲論壇用戶的交互內(nèi)容分為任務(wù)信息類和社交情感類,以學(xué)術(shù)任務(wù)類信息交互為主。這類研究重點在于從會話內(nèi)容探究用戶參與動機,較少涉及群體用戶之間問題解決的會話交互機理。
(3)會話交互模式研究。針對會話過程遷移演化、話輪轉(zhuǎn)換等層面的少量研究目前集中于微信用戶群[11]、在線醫(yī)療平臺[12]、在線健康社區(qū)[1]等研究情境。例如,李月琳等[12]針對在線健康醫(yī)療平臺用戶與醫(yī)生交互模式,采用開放編碼和會話分析相結(jié)合的方法,總結(jié)了直線式和螺旋式兩種會話交互模式,發(fā)現(xiàn)了用戶醫(yī)療信息需求描述、交互負(fù)荷、表達方式、知識勢能差等影響交互效率的關(guān)鍵因素;Savolainen[1]總結(jié)了糖尿病論壇的4種會話模式等。此類現(xiàn)有研究主要通過小樣本的會話文本數(shù)據(jù)定性編碼完成,未涉及會話序列結(jié)構(gòu)的自動抽取探索,也未見針對會話長度對會話質(zhì)量的影響關(guān)系探討。
(4)會話交互質(zhì)量研究。圍繞用戶評論質(zhì)量、回答質(zhì)量、知識交流效率等,學(xué)者們構(gòu)建了文本內(nèi)容、用戶特征、平臺特征、聲望影響等維度指標(biāo),通過內(nèi)容分析、描述性統(tǒng)計分析、機器學(xué)習(xí)等方法進行會話交互質(zhì)量的評價及預(yù)測(表1)。例如,丁敬達等[13]從聲望、受眾和影響3個方面的客觀數(shù)據(jù)特征入手,發(fā)現(xiàn)用戶評論及評論頻次等交互指標(biāo)能夠反映學(xué)術(shù)博客的質(zhì)量??傮w而言,現(xiàn)有會話交互質(zhì)量研究主要通過答案數(shù)量、RG分?jǐn)?shù)(Research‐Gate score)等客觀指標(biāo)進行評價,對會話過程中知識細(xì)化、整合、反思及遷移應(yīng)用的知識建構(gòu)過程的挖掘與呈現(xiàn)還不夠重視,未能體現(xiàn)用戶知識交互深度的現(xiàn)狀。
表1 網(wǎng)絡(luò)學(xué)術(shù)社區(qū)會話交互質(zhì)量評價相關(guān)研究
總體而言,現(xiàn)有相關(guān)研究較偏重于從行為學(xué)視角刻畫學(xué)術(shù)社區(qū)用戶會話行為分布特征和關(guān)系模式。將基于議題的會話互動作為分析單元、探討用戶交互行為序列以及會話模式研究較少,不同會話交互序列的知識建構(gòu)水平研究也較為缺乏。
本研究以小木蟲論壇作為數(shù)據(jù)采集平臺,選擇了如表2所示的5個學(xué)科(專業(yè))版塊的數(shù)據(jù)進行分析。按照《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T 13745-2009)一級學(xué)科的分類方式,這5個版塊覆蓋了4個學(xué)科門類。其中,小木蟲人文社科以大類命名,并未做細(xì)致的學(xué)科劃分,主要包括中外史學(xué)、地理人文、宗教哲學(xué)等具體的交流主題。選取小木蟲論壇作為數(shù)據(jù)來源的主要原因包括:①該論壇是中國最活躍的學(xué)術(shù)科研互動社區(qū)之一,擁有2700萬用戶積累,所選擇的5個學(xué)科(專業(yè))板塊具有較高活躍性,發(fā)帖類型多樣,可保證所獲取用戶會話交互數(shù)據(jù)豐富,能完整覆蓋本研究編碼方案所涉及的數(shù)據(jù)維度;②作為綜合性的網(wǎng)絡(luò)學(xué)術(shù)社區(qū),所選擇的學(xué)科(專業(yè))板塊代表了成熟的基礎(chǔ)學(xué)科、應(yīng)用學(xué)科,以及新興交叉學(xué)科或跨學(xué)科領(lǐng)域,有助于對比各學(xué)科用戶會話交互行為差異,得出更加全面的結(jié)論。
表2 數(shù)據(jù)收集結(jié)果統(tǒng)計表
本研究于2020年12月利用八爪魚數(shù)據(jù)采集器完成了數(shù)據(jù)自動收集,采集了各學(xué)科版塊最近6個月的發(fā)/回帖數(shù)據(jù),數(shù)據(jù)收集結(jié)果如表2所示。
本研究基于會話分析理論剖析小木蟲論壇中用戶會話交互行為類型及序列結(jié)構(gòu)。會話分析理論(conversation analysis theory)是一種社會學(xué)的言語行為研究理論,始于20世紀(jì)60年代社會學(xué)家收集自然發(fā)生的真實會話語料所進行的分析,旨在揭示人們之間互動行為的內(nèi)在組織結(jié)構(gòu),從中發(fā)現(xiàn)人類言語交際的規(guī)律和模式,并解釋其中隱含的社會秩序和社會規(guī)律[19]。Wang等[20]和Savolainen[1]認(rèn)為在線討論社區(qū)會話交互核心功能是提問和回答,代表著用戶信息查詢與共享需求;進一步區(qū)分會話發(fā)起者和參與者的不同角色,提出會話交互行為概念框架。本研究借鑒了Savolainen[1]會話行為分類編碼方案,并以此為基礎(chǔ)從縱向角度挖掘發(fā)現(xiàn)會話交互序列結(jié)構(gòu)和交互模式(表3)。
表3 網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶會話交互行為編碼方案
為進一步探討用戶會話交互質(zhì)量,本研究借鑒Harasim的協(xié)同知識建構(gòu)理論[21]以及社會交互分析模型IAM(interaction analysis model)[22]等,同時綜合考慮學(xué)術(shù)社區(qū)的特征[23]形成會話交互質(zhì)量編碼方案(表4),以社區(qū)成員的知識發(fā)散、知識聯(lián)結(jié)和知識收斂3個階段為標(biāo)志,反映參與者通過對話交互最終共同完成知識建構(gòu)的過程。在學(xué)術(shù)社區(qū)中,用戶通過提出問題,協(xié)商、反復(fù)討論并持續(xù)對觀點和解決思路進行修正,逐步達到收斂和一致,最終實現(xiàn)對問題的理解或解決,并通過內(nèi)化遷移實現(xiàn)個體或社區(qū)群體知識建構(gòu)。本研究按照知識建構(gòu)的3個層級對會話序列進行不同分值賦值,轉(zhuǎn)化為知識建構(gòu)的質(zhì)量水平,分值越高,代表知識建構(gòu)水平越高(層級越深)。
表4 網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶交互質(zhì)量分析編碼框架(知識建構(gòu)層次)
續(xù)表
為了保證編碼方案與研究數(shù)據(jù)的匹配性和有效性,本研究首先選擇無機非金屬學(xué)科板塊進行人工編碼,經(jīng)過編碼實踐論證,進行了適當(dāng)調(diào)整,形成最終版本,如表3、表4所示。一個學(xué)科板塊編碼完成后,再擴展至其他學(xué)科板塊。本研究采用了多種人工編碼方式。由于樣本數(shù)量較大,編碼主要由1位主編碼員完成。Miles等[24]認(rèn)為,在進行內(nèi)容分析編碼時,單獨的研究人員可以重復(fù)對數(shù)據(jù)進行編碼,直到編碼的一致性達到90%,以保證可信度。本研究按照這個規(guī)則進行單人多輪次編碼,直到重復(fù)測量的Co‐hen's kappa系數(shù)達到90%。在編碼的過程中若發(fā)現(xiàn)有歧義的地方,則采用雙人或三人編碼形式,與交互行為和知識建構(gòu)理論的兩位專家進行討論交流,直到達成最終共識。圖1為本研究的整體研究框架。
圖1 本研究的整體研究框架
通過數(shù)據(jù)清洗,刪除因屏蔽無法獲取具體提問內(nèi)容的帖子,以及僅分享信息而不提問的發(fā)帖,最后共得到1485條主帖記錄,其中無機非金屬最多(N=609),其次分別為量子化學(xué)(N=311)、人文社科(N=256)、醫(yī)學(xué)(N=201),信息科學(xué)發(fā)帖最少(N=108);同時包含7099條有效回帖數(shù)據(jù)。在此基礎(chǔ)上進行編碼統(tǒng)計分析。
依據(jù)會話行為編碼方案,按照會話意義單元對帖子信息內(nèi)容進行編碼,一個單獨的帖子可能包含一個或多個會話行為,對每個會話單元都通過適當(dāng)?shù)拇a,如IA、PAQ等進行識別。對所有數(shù)據(jù)進行編碼后,1485個初始問題(即主貼)共計發(fā)生8681個會話行為,總體分布情況如表5所示。
表5 各學(xué)科用戶會話交互行為的類型分布
統(tǒng)計分析結(jié)果顯示,網(wǎng)絡(luò)學(xué)術(shù)社區(qū)會話行為以回答相關(guān)行為(IA、ICA、PCA)為主,占所有會話行為的62.73%,提問相關(guān)行為(IQ、PAQ、IAQ)占36.39%。相比于糖尿病論壇26%提問比例[1],學(xué)術(shù)社區(qū)顯示了更高的提問需求。提問行為在不同討論組別中有所差異,其中量子化學(xué)用戶提問相關(guān)行為占比高達50.74%,涉及交叉學(xué)科面臨的復(fù)雜技術(shù)操作性問題、理論方法問題、研究方向選擇等信息需求?;卮鹣嚓P(guān)的行為中,學(xué)術(shù)社區(qū)中初始回答最為常見,占所有會話行為的43.57%,參與者補充回答的比例為8.80%,顯示了學(xué)術(shù)社區(qū)用戶信息共享的旺盛需求。
進一步探討不同學(xué)科會話行為的差異,對5個學(xué)科的會話行為進行卡方檢驗,結(jié)果表明存在顯著差異(χ2=496.398,P<0.001)。具體來說,醫(yī)學(xué)和人文社科的初始回答行為顯著高于其他學(xué)科,一定程度上表明這兩個學(xué)科大部分參與者都只進行一次基本回復(fù)??赡艿脑蚴沁@兩個板塊未進一步細(xì)分學(xué)科,用戶所討論的問題比較寬泛,較多涉及經(jīng)驗分享,如提問:讀博計劃、請分享你的抗疫心路歷程等,針對具體學(xué)術(shù)議題展開深入交流比例較小。工科用戶顯示雙向互動更為頻繁,交互層次更深入。例如,信息科學(xué)參與者更喜歡對自身或他人的回答進行補充(16.49%);無機非金屬學(xué)科話題發(fā)起者追加提問比例(4.20%)更高;量子化學(xué)參與者更積極向其他用戶追加提問(25.74%),吸引發(fā)起者補充回答的比例也更高(11.22%)。證實了已有相關(guān)研究發(fā)現(xiàn),即理工科的科研人員相對于人文學(xué)科學(xué)者更青睞網(wǎng)絡(luò)學(xué)術(shù)社區(qū),在社區(qū)交互方面更為活躍[25]。
總體而言,學(xué)術(shù)社區(qū)用戶提出質(zhì)疑的比例較低,同人文社科學(xué)者相比,理工科學(xué)者對答案質(zhì)疑比例更低,可能是人文學(xué)科學(xué)者重思想辯論,而理工科類討論話題往往聚焦于具體問題的解決,如針對概念事實和實驗方法的恰當(dāng)解釋,而這些問題往往都是有明確答案的。
網(wǎng)絡(luò)學(xué)術(shù)社區(qū)中會話交互行為并不是表面看上去的隨意、雜亂無序,而是有規(guī)律可循,這種規(guī)律性不是研究者虛構(gòu)出來的,而是會話參與者在交往中受一定的規(guī)范指引形成的[26]。以往研究多依靠質(zhì)性分析進行小樣本量會話內(nèi)容的探索性分析[1],本研究引入序列分析工具TraMineR,根據(jù)用戶會話行為編碼數(shù)據(jù),從中抽取會話序列結(jié)構(gòu),以挖掘發(fā)現(xiàn)學(xué)術(shù)用戶會話交互規(guī)律。
序列分析最早應(yīng)用于確定DNA(deoxyribonu‐cleic acid)上核苷酸排列的順序,目前被廣泛應(yīng)用于社會學(xué)、心理學(xué)、生命歷程研究和時間利用研究等領(lǐng)域,是研究用戶行為規(guī)律、挖掘潛在行為模式的重要方法之一。TraMineR是進行序列分析的常見工具之一,是日內(nèi)瓦大學(xué)人口與社會經(jīng)濟學(xué)研究所開發(fā)的免費開源R語言包[27],可用于社會科學(xué)領(lǐng)域序列數(shù)據(jù)的挖掘、描述和可視化[28-29]。
4.2.1 高頻會話序列分析
本研究將每一個帖子都看成一個會話線程,按照會話在帖子中出現(xiàn)的先后排列,形成一個特定序列,每一個序列都由初始問題IQ引發(fā)其他的會話行為,如“初始問題(IQ)→初始回答(IA)→發(fā)起者附加問題(IAQ)……”統(tǒng)計分析發(fā)現(xiàn),在全部1485個線程中,最短的序列為1,即只包含問題的序列;最長的序列中包含了355個會話行為,平均會話長度為5.8。圖2統(tǒng)計顯示了1485個線程中出現(xiàn)頻率最高的前20個序列,其中X軸表示在整個交互序列中各會話行為出現(xiàn)位置,例如,X1代表第1個會話行為,即初始問題IQ,X2代表第2個會話行為,以此類推。Y軸則顯示了序列出現(xiàn)的累積頻率百分比,這20個序列出現(xiàn)頻率約占總樣本的64%。
圖2分析顯示,小木蟲社區(qū)出現(xiàn)最頻繁的序列是IQ(初始提問),占25.9%,即1485個會話序列中有1/4是只有一個初始提問而沒有回答的序列。經(jīng)內(nèi)容分析發(fā)現(xiàn)這些問題60%以上由新用戶發(fā)布,大部分會話是為了查找客觀事實信息,如書籍資料、軟件安裝包和一些具有確定答案的問題,例如,“大家好!哪位老師有《無機材料合成方法》的視頻課件,麻煩給我發(fā)一份”。這類任務(wù)型問題往往在特定的分區(qū)能找到解答。Sin等[28]針對計算機技術(shù)問答網(wǎng)站會話交互的研究同樣發(fā)現(xiàn),空序列占比高達48.6%。其次最常見的序列是IQ→IA和IQ→IA→IA序列,即初始提問之后只收到一個和兩個初始回答的序列占比為14.8%和5.4%。第4個常見序列是IQ→PAQ(參與者追加提問),即除初始問題外,第一個參與者向發(fā)起者提出了一個附加問題的行為序列占3.6%。第5個常見序列為IQ→IA→ICA(發(fā)起者補充回答),即初始提問和初始回答之后,發(fā)起者又進行了補充回答,發(fā)起者和參與者之間完成了一次簡短的交互,該類行為序列占2.6%。
圖2 高頻會話交互行為序列(彩圖請見https://qbxb.istic.ac.cn/)
4.2.2 會話交互模式分析
為了探究學(xué)術(shù)社區(qū)整體的會話序列特征,本研究對所有的會話序列進行聚類,以確定代表性序列。通過TraMineR計算最佳匹配矩陣,最佳匹配(the optimal matching,OM)分析是一種計算序列之間相似性的常用方法[30]。隨后使用ward方法進行層次聚類分析,并根據(jù)聚類評估選擇合適的聚類數(shù)量。Savolainen[31]針對DIY(do it yourself)社區(qū)會話行為的研究指出,雖然一些帖子中有較多會話行為,產(chǎn)生了較長序列,但是后半部分的內(nèi)容中會話結(jié)構(gòu)變得單一,余下的內(nèi)容不會給研究結(jié)果增加太多新內(nèi)容。本研究分析發(fā)現(xiàn),1485條主貼中,只有10條主貼超過了100條會話,且這些長帖多為交流、調(diào)研某一現(xiàn)象,如“為什么選計算化學(xué)”“女生為了事業(yè)而放棄愛情和家庭,值得嗎?”少數(shù)帖子回復(fù)量較高,導(dǎo)致整體會話序列長度差異較大。為了使聚類結(jié)果更具有代表性,本研究最多截取每個帖子的前100條會話行為進行分析。
通過對1485個會話線程進行聚類分析,最終得出5個聚類類別,分別從5個聚類中抽取代表性序列,如圖3所示。參照Wang等[20]、Savolainen[1]等按照會話行為的順序組合成會話序列的觀點,根據(jù)每個代表性序列包含的會話行為類型、會話行為的轉(zhuǎn)換,最終構(gòu)成以問答方式表現(xiàn)的有意義的會話行為模式,總結(jié)出網(wǎng)絡(luò)學(xué)術(shù)社區(qū)中用戶會話交互模式主要包括問題澄清、簡單問答、回答擴充、問題協(xié)商。下文結(jié)合實例進行討論。
圖3 5個聚類中選取的代表性序列(彩圖請見https://qbxb.istic.ac.cn/)
1)聚類1:問題澄清模式
聚類1(n=511)代表序列表現(xiàn)為IQ-PAQ(參與者追加提問),該模式平均會話長度為1.43,是5個聚類中最短的代表序列。其典型情況是,發(fā)起者在提出問題后,得到的第1個回答不是針對問題的解決方式,而是參與者直接提出追加問題,請求闡明初始問題中的細(xì)節(jié)或提出其他延伸問題。如下面這個例子中,提問者想要買一些專業(yè)書籍,在論壇請求他人推薦:
請問買一些信息科學(xué)方面的經(jīng)典書目,求推薦,謝謝?。↖92-IQ)
具體是想做啥?面太寬就不好推薦(I92-PAQ)
在這個問題中,由于提問內(nèi)容不清晰,參與者請求對問題做進一步的說明,但未得到繼續(xù)響應(yīng),因此該會話以這樣一個提問結(jié)束。
2)聚類2:簡單問答模式
聚類2僅包含8個樣本,是5個聚類中最小的集群,即線程較長但結(jié)構(gòu)相對單一的會話模式:IQIA-IA-…PCA-IA-…IA…,主要由社區(qū)中部分熱門的帖子構(gòu)成,整個序列由參與者積極參與初始回答形成,但較多參與者僅產(chǎn)生一次初始回答行為,并不能支配整個交互。例如,在信息科學(xué)中一個用戶提出問題“手機硬件的下一步的發(fā)展方向在哪?”這個帖子共計發(fā)生116個會話行為,其中初始回答(IA)行為共計95條,在這個帖子中,會話發(fā)起者主要是想調(diào)研或與他人交流對某一主題的看法,而不是解決問題,很少發(fā)生更進一步的循環(huán)交互。由于這一聚類包含樣本過少,說明這一會話模式在社區(qū)中并不常見,本研究未將其歸為代表性序列加以后續(xù)分析。
3)聚類3、聚類5:問題協(xié)商模式
聚類3(n=320)代表性序列由IQ-IA(初始回答)-IAQ(發(fā)起者追加提問)-PCA(參與者補充回答)-PAQ(參與者追加提問)等構(gòu)成,例如:
實驗室有聚乙烯醇分子量75000~79000,還有聚乙二醇2000和800的,因為之前陶瓷粉干壓后,總是掉粉,燒成后,也是愛斷層。想用粘合劑,用哪種呢,怎樣用呢?(IN137-IQ)
文獻中都說用的是PVA,但具體聚合度很少提及。加入量為1.5%~2%,不過加了后燒結(jié)前要增加脫脂工序的(IN137-IA)。為什么要脫脂呢(IN137-IAQ),怎么脫脂呀?(IN137-IAQ)非常感謝!
加了粘結(jié)劑,是為了有利于成型,但它若不除去會對材料產(chǎn)生雜質(zhì)污染,影響最終性能與使用……在坯料內(nèi)外氣孔通道封閉前將粘結(jié)劑全部清除。(IN137-PCA)
你好,那怎么判斷脫脂的程度呢?(IN137-PAQ)粘結(jié)劑的殘留量怎么測呢?(IN137-PAQ)
這可能就要反復(fù)測試每個脫脂溫度對應(yīng)的燒結(jié)體中的殘?zhí)剂縼頉Q定最佳的脫脂溫度了。(IN137-PCA)
這個例子代表了一個問答交互的實例,發(fā)起者與參與者一問一答的交替使問題逐步明晰,并得到更多有用的回答。此外,由于社區(qū)的開放性,會話的過程并不完全是發(fā)起者與參與者的交互,也可能是參與者之間的交互。在上述例子中的后半部分,參與者對發(fā)起者的追加問題進行補充回答之后,又與其他參與者進行了問答交互,Wang等[20]指出,回答問題的參與者之間的討論,有助于有效地進行知識的分享與傳遞。
聚類5(n=462)的代表序列由IQ-IA(初始回答)-ICA(發(fā)起者補充回答)-PAQ(參與者追加提問)-ICA-PAQ交替構(gòu)成,該序列和聚類3相似,都有完整的發(fā)起者與參與者的問答交互,表現(xiàn)出更明顯的回答與追加提問交替的過程,并且主要以參與者提問、發(fā)起者回答的形式完成。
這兩種序列可以歸納為問題協(xié)商模式,平均會話長度為4.89,典型特征是最初的問題和答案之后是一系列補充回答和追加提問,問題和回答交替可以為用戶提供更加詳細(xì)的解決方案。
4)聚類4:回答擴充模式
聚類4(n=184)的代表序列為IQ-IA(初始回答)-ICA(發(fā)起者補充回答)-IA-PCA(參與者補充回答)-IA-IA-IA-IA-IA,平均會話長度為14.30。聚類4中包含更多的回答行為,包括初始回答和附加回答,前半部分發(fā)起者與參與者進行補充回答交互(IA-ICA-IA-PCA),后半部分則主要由初始回答構(gòu)成。這種模式可以歸納為回答擴充型模式,在初始的回答行為之后由一系列補充回答形成,這些補充回答是基于前述回答的詳細(xì)闡釋,以及對問題的逐步細(xì)化。例如:
圓盤造粒機,生坯球形度不高……是不是加水或加粉方式及用量存在問題。(IN57-IQ)之前我試驗過40-70目的,關(guān)鍵點在這幾點:……(IN57-IA)
謝謝回復(fù)。噴壺我已經(jīng)做出調(diào)整,噴出來的水相比之前霧化效果更好,但是肯定達不到3μm。另外,我試過如果水噴得少的話,生坯球可能不夠致密,輕輕一搓就會散掉,這也是個問題。(IN57-ICA)
試著每次噴水后轉(zhuǎn)時間長,少噴水,多轉(zhuǎn)。另外這個跟個人熟練程度有很大關(guān)系。老師傅做得確實比較好。所以需要不斷積累經(jīng)驗,掌握料、水、時間的最佳關(guān)系點。這個量化標(biāo)準(zhǔn)不好衡量。(IN57-PCA)
這種會話序列通過一系列補充回答對最初的回答進行提煉或擴充,可能會提出更加有針對性的解決方案,往往是對問題的某一點進行的詳細(xì)解析,有利于解決發(fā)起者的問題。
會話分析理論認(rèn)為,一次完整的會話通常由啟動、展開和結(jié)束這3個部分構(gòu)成[32]。在實際的對話交互中,一個完整的會話線程通常不會只由一種單一的序列結(jié)構(gòu)組成,會話越長,越有可能出現(xiàn)多種序列交織。由于學(xué)術(shù)社區(qū)是自由開放的,會話過程整體較為自由松散,話題的轉(zhuǎn)換也較為隨意,會話可能隨時中斷,也可能歷經(jīng)較長時間之后由其他用戶“喚醒”,繼續(xù)中止前的階段。
4.3.1 學(xué)術(shù)社區(qū)用戶知識建構(gòu)層次及結(jié)構(gòu)分析
根據(jù)交互質(zhì)量編碼方案對7099條回帖文本進行分析編碼。統(tǒng)計結(jié)果顯示,小木蟲社區(qū)用戶知識發(fā)散階段的回帖共5317條,占總回帖的74.90%。這一層次的交互特征主要是回帖者簡單表明對問題或其他回帖的態(tài)度或感受,如“贊同”“謝謝”等;或是簡單地提出疑問,如“同求”“這個問題樓主解決了嗎”等;或是簡單提出觀點,但不對觀點進行闡釋,如“BN耐火材料應(yīng)該可以”“燒結(jié)制度可以調(diào)整一下看”。
知識聯(lián)結(jié)階段的回帖共計1528條,占21.50%。主要是對其他用戶的觀點進行評價回復(fù),相互分享信息和觀點,通過提出相關(guān)問題和解答問題相互進行觀點的意義協(xié)商,結(jié)合不同觀點深化自身對問題的認(rèn)識。例如,在歸納整合層次,針對氧化鋯陶瓷拋光的問題,一個回帖者做出如下回復(fù):“氧化鋯陶瓷拋光過程中,如果應(yīng)力過大,有可能晶粒脫落產(chǎn)生坑點的,其實可以從坑點的晶粒形態(tài)分析,如果是那種棱角分明的情況,基本可以認(rèn)為是有晶粒脫落造成的,那種燒結(jié)不致密殘留的孔洞的邊緣應(yīng)該不會有那種明顯的棱角的。”回帖者能夠提出自身觀點,并從多方面分析問題,把各自的觀點聯(lián)系起來,將許多零散的觀點匯聚成一個較大的觀點,個人的理解也逐步加深。
知識收斂階段文本共254條,占3.60%。在學(xué)術(shù)社區(qū)較少發(fā)生,這個層次的會話交互主要是用戶對與自身觀點有矛盾沖突的地方提出質(zhì)疑,或在原有觀點的基礎(chǔ)上受到其他用戶觀點的啟發(fā),對過程、結(jié)果等進行總結(jié)和反思,實現(xiàn)對問題的理解和解決,各種觀點的聯(lián)結(jié)和結(jié)合點已經(jīng)被辨別出來,參與會話成員基于共享知識的理解進行知識建構(gòu)。其中,101條回帖顯示用戶能對某些觀點提出質(zhì)疑或指出其錯誤,這說明參與用戶能對帖子內(nèi)容進行仔細(xì)閱讀和思考,如“您的話我看懂了,但是您說的有錯誤。您說‘高斯軟件計算出來的分子軌道圖中成鍵軌道和反鍵軌道的顏色是不一樣的’,我很負(fù)責(zé)任地告訴您,那是波函數(shù)的相位,與成鍵軌道和反鍵軌道并無直接關(guān)系。請不要追問我什么是波函數(shù)的相位”。有137條回復(fù)處于深入思考階段,參與者根據(jù)自身經(jīng)驗和相關(guān)資料,提出全面詳細(xì)的個人觀點、看法和建議。例如,針對一位用戶使用圓盤造粒機出現(xiàn)生坯球形度不高的問題,一位參與者根據(jù)自己以往的經(jīng)驗提出6條建議,分別是“水量問題、生球強度的提高、母球的篩分、礬土的可塑性、制粒鍋的內(nèi)壁光滑程度和轉(zhuǎn)速、做顆粒的順序”,并且每條建議都給出了相應(yīng)的解釋。僅16條回復(fù)達到內(nèi)化遷移層次,如關(guān)于某軟件在使用中出現(xiàn)的問題,參與者通過理解和吸收他人提出的觀點與建議,將其與自身的實際情況結(jié)合,實現(xiàn)了對問題的解決,并對自己的學(xué)習(xí)過程進行思考總結(jié),編碼示例如表4中的D3所示。
由于非正式學(xué)術(shù)交流的開放性以及學(xué)科領(lǐng)域的復(fù)雜性,學(xué)術(shù)社區(qū)用戶交互主題呈現(xiàn)高度分散特征,用戶的知識建構(gòu)多處于知識發(fā)散和聯(lián)結(jié)層次,表現(xiàn)為針對提問或回帖進行思考回應(yīng),依據(jù)自身知識和經(jīng)驗提出個人觀點,較少進行批判性思考及明確表達一致觀點,整個社區(qū)的知識收斂還處于潛在發(fā)展?fàn)顟B(tài),即針對某一問題參與的用戶增進了相互的共享理解而不一定達到觀點收斂。
交互與認(rèn)知理論認(rèn)為,會話的過程結(jié)構(gòu)與會話產(chǎn)生的認(rèn)知表征之間存在對應(yīng)關(guān)系[20],學(xué)術(shù)社區(qū)用戶參與會話交互的行為過程實際也伴隨著知識建構(gòu)的認(rèn)知過程。在會話啟動階段,用戶通過初始提問、問題解釋與澄清,達到淺層的知識領(lǐng)會;有些會話進入展開階段,有些由于交互程度有限而直接進入中止階段。在會話進入回答擴充和問題協(xié)商模式后,用戶通過意義協(xié)商、觀點的歸納整合,深化了認(rèn)識,少部分用戶通過分析質(zhì)疑、深入思考,完成了知識內(nèi)化遷移應(yīng)用。用戶知識建構(gòu)過程也是循環(huán)往復(fù)、螺旋上升的,只有經(jīng)過周而復(fù)始的迭代,用戶才能加深對問題的理解,社區(qū)的集體智慧也才能上升到一個更高的層次。本研究結(jié)合會話交互行為序列和認(rèn)知建構(gòu)階段歸納了網(wǎng)絡(luò)學(xué)術(shù)社區(qū)知識建構(gòu)的整體結(jié)構(gòu)特征,如圖4所示。
圖4 網(wǎng)絡(luò)學(xué)術(shù)社區(qū)知識建構(gòu)過程的整體結(jié)構(gòu)
4.3.2 各學(xué)科交互知識建構(gòu)質(zhì)量差異分析
對5個學(xué)科的不同交互質(zhì)量層次的回帖數(shù)據(jù)進行卡方檢驗,結(jié)果表明各學(xué)科存在顯著差異(χ2=179.578,P<0.001),具體分布如圖5所示。
圖5 各學(xué)科交互質(zhì)量層級的分布統(tǒng)計
具體而言,在知識發(fā)散階段,醫(yī)學(xué)有68.67%的內(nèi)容處于淺層領(lǐng)會的層次,通過內(nèi)容分析發(fā)現(xiàn)可能的原因在于小木蟲醫(yī)學(xué)版塊的特殊性,其存在部分健康信息查詢問題,這部分發(fā)帖往往能引起較多回答者對自身健康經(jīng)歷的分享,但是大部分都是對自身經(jīng)歷的簡單描述,缺乏對醫(yī)學(xué)專業(yè)問題的探索和對信息的深加工。在知識聯(lián)結(jié)階段,可以看出大部分回復(fù)都集中在意義協(xié)商層次,無機非金屬、量子化學(xué)、信息科學(xué)的意義協(xié)商比例明顯高于醫(yī)學(xué)和人文社科,顯示理工科用戶會通過更多的互動交流展開對問題的探討,不僅進行單向的知識傳播,還更加注重雙向的知識建構(gòu)。在知識收斂階段,雖然這一階段在各學(xué)科中占比都較小,但是從圖5仍然可以看出量子化學(xué)中處于深入思考和內(nèi)化遷移層次的回復(fù)明顯高于其他學(xué)科,顯示這一新興交叉學(xué)科用戶呈現(xiàn)出能夠使自己不斷審視、反思自身想法、思考與對比其他學(xué)者的意見、不斷去完善自我認(rèn)知的意愿。
交互質(zhì)量等級屬于定性分類變量,而卡方檢驗只能了解各層次回帖的分布差異,不利于對各分類之間的交互質(zhì)量進行定量對比。本研究在已有定性變量的基礎(chǔ)上計算了每個發(fā)帖的交互質(zhì)量水平,具體計算方式為:首先對知識發(fā)散、聯(lián)結(jié)和收斂回帖分別賦值為1、3、5權(quán)值,其次用不同的交互質(zhì)量等級乘以對應(yīng)等級的回帖數(shù)量的總和,再除以每個帖子的回帖總量。如帖子IN13的知識發(fā)散交互數(shù)量是1條,聯(lián)結(jié)交互數(shù)量是3條,收斂交互數(shù)量是1條,該帖的交互質(zhì)量水平=(1×1+3×3+1×5)/5=3。
將交互層級轉(zhuǎn)化為交互質(zhì)量水平之后,本研究進一步探究不同學(xué)科的交互質(zhì)量水平差異,經(jīng)檢驗,本研究數(shù)據(jù)不符合正態(tài)分布,采用不要求數(shù)據(jù)呈正態(tài)分布的Kruskal-Wallis H檢驗方法來進行分析,分析結(jié)果如表6所示。量子化學(xué)(M=1.45)交互質(zhì)量水平最高,其次為無機非金屬(M=1.24)和信息科學(xué)(M=1.03),然后是人文社科(M=0.85)與醫(yī)學(xué)(M=0.79)。各學(xué)科交互質(zhì)量水平存在顯著差異(P<0.001),無機非金屬與量子化學(xué)顯著大于醫(yī)學(xué)和人文社科。
表6 各學(xué)科交互質(zhì)量水平差異分析
用戶之間的會話交互模式可能會影響整個會話線程的結(jié)果,采用Kruskal-Wallis H檢驗方法來進行分析,結(jié)果顯示,各交互模式之間的質(zhì)量水平存在顯著差異(χ2=727.635,P<0.001),進一步查看成對比較結(jié)果,如表7所示,3類主要的會話交互模式之間均存在顯著差異。
表7 各交互模式的交互質(zhì)量水平差異分析
數(shù)據(jù)分析結(jié)果顯示,問題澄清模式(M=0.29)的交互質(zhì)量水平顯著低于問題協(xié)商模式(M=1.29)和回答擴充模式(M=1.28)。問題澄清模式由于用戶問題表達不夠清晰,導(dǎo)致問題識別和理解形成低效率的會話模式,未能展開有效的知識建構(gòu)?;卮饠U充和問題協(xié)商模式的交互質(zhì)量水平相比于問題澄清更高,表明用戶對初始問題和回答的補充信息更有可能產(chǎn)生有用的知識[20],更復(fù)雜和多樣化的協(xié)商過程可能帶來更多不同的觀點和建議碰撞[28]。由此可見,在學(xué)術(shù)社區(qū)中更復(fù)雜多樣的會話模式具有更高的交互質(zhì)量水平。
以往研究指出,長序列會話交互質(zhì)量更好[28,33],但較少同時考慮會話長度和會話交互模式對會話質(zhì)量的影響。本研究利用SPSSAU軟件按照不同的交互模式構(gòu)建了分組回歸模型,進一步探究不同交互模式對會話長度與交互質(zhì)量水平關(guān)系的調(diào)節(jié)作用,如表8所示。
回歸分析的結(jié)果(表8)顯示,在問題澄清和回答擴充兩種會話模式中,會話長度均對交互質(zhì)量水平產(chǎn)生促進作用。此外,問題澄清模式中會話長度的回歸系數(shù)為0.423,明顯大于回答擴充模式中的回歸系數(shù)0.006。進一步對兩種模式的回歸系數(shù)進行差異分析,結(jié)果顯示存在顯著差異(t=27.986,P<0.001),說明問題澄清模式相比于回答擴充模式更容易受會話長度的影響。而在問題協(xié)商模式下,會話長度對交互質(zhì)量水平的影響不顯著,說明更復(fù)雜和多樣化的協(xié)商過程可能提高知識建構(gòu)的效率,問題協(xié)商模式中混雜的對立和混合的觀點對提問者來說是有益的,因為這種互相反駁、論證有利于提問者更快找到可信的答案[34]。
表8 會話長度與交互質(zhì)量水平的回歸分析(各交互模型分組回歸結(jié)果)
根據(jù)表7的分析結(jié)果可知,不同會話模式的知識建構(gòu)水平存在顯著差異。本研究進一步利用Kruskal-Wallis H檢驗對會話模式交互數(shù)量展開分析,結(jié)果顯示,不同交互模式的回復(fù)量、有效回復(fù)、瀏覽量等交互數(shù)量也存在顯著差異(表9)。學(xué)術(shù)社區(qū)中回答擴充型的會話模式能夠帶來更廣泛的圍觀和直接參與,而問題澄清模式則不然,說明不同會話模式對網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶的整體知識建構(gòu)廣度、深度起著不同作用。
表9 各會話交互模式的交互數(shù)量差異分析
本研究不同于傳統(tǒng)的互惠、偏好依附[20]等行為互動視角,將會話行為和認(rèn)知表征結(jié)合,按照“行為編碼-序列抽取-會話模式總結(jié)-知識建構(gòu)”的邏輯順序,探討了網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶會話交互模式和知識建構(gòu)關(guān)系,得出以下結(jié)論。
(1)學(xué)術(shù)社區(qū)用戶通過提問和回答交替方式共享知識和經(jīng)驗。泰勒的問題協(xié)商理論指出,最初的問題并不總是恰當(dāng)?shù)胤从吵鰝€人本能需求,需要通過額外的努力來發(fā)現(xiàn)更深的需求[35]。學(xué)術(shù)社區(qū)用戶會話交互同樣是問題協(xié)商的過程,幫助用戶在提問與回答交互中找到解決問題的方法。整體而言,初始回答行為占比較大,提問比例相對于其他類型社區(qū)也更高,特別是以量子化學(xué)為代表的交叉學(xué)科在應(yīng)對復(fù)雜理論與技術(shù)問題挑戰(zhàn)時表現(xiàn)出更旺盛的信息查詢與共享的需求。不同學(xué)科會話交互行為呈現(xiàn)差異性。
相比于健康社區(qū)用戶(如糖尿病論壇用戶),學(xué)術(shù)社區(qū)用戶多輪往復(fù)的螺旋式會話交互相對較少,可能是不同問題類型及需求表達方式造成了健康信息用戶與學(xué)術(shù)信息用戶會話交互的行為差異。Jeong[36]的研究發(fā)現(xiàn),圍繞沖突觀點展開的會話交互能促進更多的討論和批判性思考,而小木蟲學(xué)術(shù)社區(qū)用戶更傾向于尋求問題解決的縱向會話交互,質(zhì)疑、反思等橫向會話交互還較為有限[4]。
(2)本研究基于會話交互行為的序列位置順序編碼,自動聚類抽取了會話交互的典型序列結(jié)構(gòu),在內(nèi)容分析基礎(chǔ)上歸納總結(jié)了學(xué)術(shù)社區(qū)3種主要的會話交互行為模式。其中問題澄清模式出現(xiàn)頻率最多,要求發(fā)起者對問題的細(xì)節(jié)進行補充說明,常常以問題結(jié)束會話;問題協(xié)商模式中提問和回答的交替使用戶之間的交互潛力得到最大發(fā)揮;回答擴充模式,發(fā)起者和參與者相互補充和闡釋問題相關(guān)信息,有利于問題得到更詳細(xì)和更集中的解決。
會話序列是會話分析研究的核心原則和決定性特征。已有的會話模式相關(guān)研究中,學(xué)者們多采用小樣本量文本手工編碼進行探索性分析,Savolainen[1]總結(jié)糖尿病論壇會話行為序列時歸納出提問-回答、問題澄清、加強答案、提問-回答交互4種會話模式,其中提問-回答是最基礎(chǔ)的交互模式,尤其針對定義良好的初始問題最有幫助。本研究聚類分析結(jié)果顯示,問題澄清系列聚類樣本數(shù)最多,可見用戶提問需求的清晰表達是會話模式形成的關(guān)鍵性影響因素;針對問題協(xié)商、回答擴充模式的內(nèi)容分析發(fā)現(xiàn),線程發(fā)起者在序列后端更活躍的參與交互,以及會話參與者更多的引用問題會引導(dǎo)會話交互序列的縱深發(fā)展。
和問題探究式的課堂會話模式相比[33],雖然課堂會話由老師主導(dǎo)并且精心設(shè)計流程,可能產(chǎn)生螺旋上升的知識建構(gòu)過程,而學(xué)術(shù)社區(qū)氛圍寬松,用戶參與自由度更大,更多弱連接用戶參與帶來不同的視角,更有利于各學(xué)科用戶合作進行跨學(xué)科知識建構(gòu),為用戶多角度探索問題和創(chuàng)新思考提供了更多可能性。與學(xué)術(shù)會議小組討論的問題協(xié)商[37]相比,在學(xué)術(shù)社區(qū)這種非正式交流情境中提問和回答并不是一一對應(yīng)的,用戶間的互動更為隨意,會話的走向難以把控,主要由問題需求表達及交互模式推動。彭雪[37]認(rèn)為,學(xué)術(shù)會議會話結(jié)構(gòu)體現(xiàn)機構(gòu)組織特征,會話序列結(jié)構(gòu)變化是參與者建構(gòu)專家、研究者和教師等多重身份的動態(tài)過程,受交際語境制約。小木蟲學(xué)術(shù)社區(qū)由于用戶身份匿名,無法利用現(xiàn)實“暈輪”效應(yīng),專家級用戶無法在其中鞏固現(xiàn)實學(xué)術(shù)身份以提高學(xué)術(shù)影響,表現(xiàn)為用戶現(xiàn)實身份在推動會話序列結(jié)構(gòu)變化中的作用有限,會話交互模式演變更取決于問題類型、定義和用戶交互過程。
(3)在交互質(zhì)量方面,社會建構(gòu)主義理論認(rèn)為知識建構(gòu)本質(zhì)上是合作的,通常由對話觸發(fā)。本研究基于交互行為和知識建構(gòu)的雙重編碼統(tǒng)計,總結(jié)中文網(wǎng)絡(luò)學(xué)術(shù)社區(qū)交互質(zhì)量的主要特征是:①會話交互只有極少部分發(fā)展到了知識收斂階段,與在線學(xué)習(xí)社區(qū)的研究結(jié)果類似[38]。學(xué)術(shù)社區(qū)的知識收斂還處于潛在發(fā)展?fàn)顟B(tài),用戶之間更加注重問題的解決而不是觀點的討論,較難升華觀點至更深層級,最終導(dǎo)致社區(qū)知識與集體智慧缺乏凝練;②在學(xué)科差異上,工程技術(shù)和自然科學(xué)用戶知識聯(lián)結(jié)和收斂的比例更高,其中,量子化學(xué)表現(xiàn)出更明顯的高階思維與深層認(rèn)知。一方面可能是因為小木蟲以理工學(xué)科版塊為主,另一方面可能是本研究選取的具體分支學(xué)科無機非金屬、信息科學(xué)、量子化學(xué)都帶有交叉學(xué)科的屬性,交叉學(xué)科需要解決一些綜合性問題,網(wǎng)絡(luò)學(xué)術(shù)社區(qū)正好滿足了這些研究人員對公共交流平臺的需求,可以通過與其他用戶的深度交互打破自身的思維壁壘,完善研究內(nèi)容并促進研究成果創(chuàng)新。
(4)本研究深入探究了交互模式、會話長度與知識建構(gòu)水平的關(guān)系。以往較少有研究將三者結(jié)合分析。本研究揭示了不同會話模式的知識建構(gòu)水平差異,問題澄清模式知識建構(gòu)水平顯著低于回答協(xié)商模式和回答擴充模式。李月琳等[12]針對在線健康醫(yī)療平臺用戶與醫(yī)生交互模式,認(rèn)為初始問題描述不明確引發(fā)的螺旋式對話,比用戶需求描述準(zhǔn)確、醫(yī)生解釋詳細(xì)的直線式效率低。本研究同樣證實了問題需求表達影響和塑造了用戶交互模式與交互質(zhì)量。問題協(xié)商和回答擴充蘊含更復(fù)雜多樣的直線式或螺旋式交互方式,更有可能達到較高的交互質(zhì)量水平?;卮饏f(xié)商模式通過更復(fù)雜的觀點碰撞提升知識建構(gòu)的深度,回答擴充型的會話模式能夠帶來更廣泛的圍觀和參與,提升知識建構(gòu)的廣度。
圍繞會話長度(或線程參與用戶數(shù)量)的影響研究存在較多爭議。Hew等[39]、Sin等[28]的研究發(fā)現(xiàn),在線討論論壇中參與用戶數(shù)量同高質(zhì)量的知識建構(gòu)正相關(guān);Schellens等[40]則認(rèn)為,越少的群體更可能達到知識建構(gòu)的高級階段,因為參與人數(shù)太多可能造成認(rèn)知負(fù)擔(dān)。本研究結(jié)果顯示會話長度在不同會話情境中的作用具有差異性,在問題澄清和回答擴充模式中,會話長度對知識建構(gòu)質(zhì)量水平起著促進作用,而在問題協(xié)商模式中知識建構(gòu)質(zhì)量水平不受會話長度的影響,更細(xì)致揭示了學(xué)術(shù)社區(qū)用戶會話模式與知識建構(gòu)的關(guān)系。
網(wǎng)絡(luò)學(xué)術(shù)社區(qū)是現(xiàn)實科研環(huán)境的延伸,探討網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶交互的會話結(jié)構(gòu),有助于了解學(xué)術(shù)用戶會話交互規(guī)律,提高交互效率,提升不同學(xué)科會話交互知識建構(gòu)的質(zhì)量水平,為網(wǎng)絡(luò)學(xué)術(shù)社區(qū)的持續(xù)發(fā)展提供有針對性的建議和參考。由于學(xué)術(shù)社區(qū)用戶會話交互的動態(tài)性與復(fù)雜性,用戶的會話交互過程較難細(xì)致刻畫。本研究采用定性與定量相結(jié)合的方法為未來用戶數(shù)字會話分析提供了新的方法和視角。基于學(xué)術(shù)社區(qū)用戶會話真實語境,本研究融合定性內(nèi)容編碼分析、會話序列分析、統(tǒng)計分析等方法,對自動抓取的豐富數(shù)據(jù)展開深入挖掘和結(jié)構(gòu)化分析,克服了以往依靠質(zhì)性小樣本數(shù)據(jù)及單一維度的研究局限。針對學(xué)術(shù)社區(qū)用戶會話結(jié)構(gòu)分析不足,聚焦用戶會話交互行為的序列結(jié)構(gòu)、交互模式,同時深入剖析了學(xué)術(shù)社區(qū)用戶知識建構(gòu)質(zhì)量現(xiàn)狀,豐富了網(wǎng)絡(luò)學(xué)術(shù)社區(qū)用戶會話交互行為研究體系。
(1)引導(dǎo)用戶改進會話交互方式,提升會話交互質(zhì)量。統(tǒng)計分析結(jié)果顯示,1485個會話線程中存在1/4的空問題序列,問題澄清模式也是樣本數(shù)量最多的會話模式,說明在網(wǎng)絡(luò)學(xué)術(shù)社區(qū)中,用戶如何正確提問和表達需求是需要提升的重要技能,社區(qū)系統(tǒng)應(yīng)予以合理的引導(dǎo)和干預(yù)?;驀L試設(shè)置付費回答專區(qū)等措施,提高用戶回帖的積極性,同時鼓勵有影響力的用戶發(fā)揮引領(lǐng)作用,對用戶提問做出及時反饋,引導(dǎo)用戶展開更復(fù)雜多樣的交互模式,推動用戶分析質(zhì)疑、深入思考、遷移應(yīng)用等深層知識收斂建構(gòu),改善學(xué)術(shù)社區(qū)淺表化和碎片化交流的弊端,促進集體知識建構(gòu)和集體智慧的形成。
(2)會話過程的建模挖掘以及會話模式的識別為智能問題系統(tǒng)設(shè)計提供了針對性指導(dǎo)意見,為提升用戶體驗提供了理論依據(jù)。本研究自動分析會話序列,識別3種主要會話模式,分別從會話啟動、展開和中止或喚醒階段揭示了用戶不同的交互特征,為論壇改進交互設(shè)計提出要求。例如,為改進問題澄清式的低效率會話,可嘗試在會話啟動階段以結(jié)構(gòu)化方式引導(dǎo)用戶提出咨詢問題;在會話展開后可采用機器學(xué)習(xí)技術(shù)對用戶低質(zhì)量的交互行為進行識別和干預(yù)。針對不同問題類型進行建模分類,本研究顯示在提問時設(shè)置交流、討論、調(diào)研(有獎)等分類有助于吸引更多用戶參與;會話線程中更多地引用問題,將對其他用戶的回復(fù)直接顯示在原回帖的下方,有助于提高會話的針對性,便于用戶之間對某一回復(fù)內(nèi)容的觀點進行深入討論,引導(dǎo)用戶展開回答擴充或問題協(xié)商交互,充分挖掘用戶交互潛力。
(3)高度重視交叉學(xué)科用戶的交互服務(wù)。本研究顯示,交叉學(xué)科用戶表現(xiàn)出對學(xué)術(shù)社區(qū)的旺盛需求,量子化學(xué)用戶的交互質(zhì)量均呈現(xiàn)較高水平。交叉學(xué)科已經(jīng)成為我國第14個學(xué)科門類,網(wǎng)絡(luò)學(xué)術(shù)社區(qū)應(yīng)抓住機遇和挑戰(zhàn),基于平臺自身已有的信息網(wǎng)絡(luò)和龐大用戶群體,開辟專門的交叉學(xué)科分區(qū),將不同學(xué)科的人才匯聚在一起,促進跨學(xué)科合作交流,產(chǎn)生新增長,并通過交叉學(xué)科用戶對學(xué)術(shù)社區(qū)的依賴和黏性,逐步帶動整個論壇的活躍度,提升交互質(zhì)量,促進社區(qū)持續(xù)繁榮發(fā)展。
本研究存在一定局限性。在研究對象方面,只選擇了一個中文網(wǎng)絡(luò)學(xué)術(shù)社區(qū),在后續(xù)研究中需選擇國內(nèi)外更多社區(qū)予以驗證。在研究內(nèi)容方面,采用人工編碼結(jié)合統(tǒng)計分析,未來可利用機器學(xué)習(xí)方法展開會話交互模式的自動標(biāo)注和識別抽取,進一步驗證研究結(jié)論。在會話交互行為方面,由于較少研究將序列分析引入學(xué)術(shù)社區(qū)的會話行為,因此本研究是一次嘗試,研究結(jié)果的代表性還有待進一步驗證。不同交互模式的影響因素,特別是會話長度和會話模式的交互作用、空序列的挖掘分析等都是值得探討的重要問題。