王宇波,譚 昭
(武漢大學(xué)文學(xué)院/中國語情與社會(huì)發(fā)展研究中心,湖北武漢430072)
微博意見領(lǐng)袖字頻組間差異計(jì)量研究
王宇波,譚 昭
(武漢大學(xué)文學(xué)院/中國語情與社會(huì)發(fā)展研究中心,湖北武漢430072)
本研究以新浪微博語料為統(tǒng)計(jì)樣本,通過字頻統(tǒng)計(jì)、組間對(duì)比,分析不同類別意見領(lǐng)袖高頻字使用差異及話題傾向。意見領(lǐng)袖與平衡語料庫在高頻共用字和獨(dú)用字上均有差異,不同行業(yè)、學(xué)歷、年齡、性別意見領(lǐng)袖的字頻也存在統(tǒng)計(jì)學(xué)上的顯著性差異。黨政、公知、博士、中老年、男性意見領(lǐng)袖傾向于關(guān)注政治、法律、社會(huì)發(fā)展等議題,文藝、自由職業(yè)、中青年、女性意見領(lǐng)袖傾向于關(guān)注感情和生活。利用意見領(lǐng)袖對(duì)相關(guān)話題的依賴性,可以有效地、有針對(duì)性地“議程設(shè)置”引導(dǎo)網(wǎng)絡(luò)輿情。
語料庫;獨(dú)用字;共用字;影響力;顯著度
“意見領(lǐng)袖”最早由美國傳播學(xué)學(xué)者Lazarsfeld在其著作“The People’s Choice”中提出[1]。近年來,隨著互聯(lián)網(wǎng)的發(fā)展,尤其是社交網(wǎng)絡(luò)的迅猛發(fā)展,新媒體意見領(lǐng)袖在信息傳播中的作用更加明顯。越來越多的研究表明,意見領(lǐng)袖在突發(fā)事件的信息傳播[2]、選舉中話語權(quán)的實(shí)現(xiàn)[3]、網(wǎng)絡(luò)輿論及口碑效應(yīng)的影響力[4-5]等社會(huì)現(xiàn)象中具有重要作用。隨著微博日益成為網(wǎng)絡(luò)輿論陣地,研究微博等社交網(wǎng)絡(luò)中意見領(lǐng)袖的語言特征對(duì)新媒體語言監(jiān)測等問題具有重要意義。
據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2015年7月22日發(fā)布的《第36次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,“2015年上半年,微博客用戶中,使用新浪微博的用戶占69.4%,一至五級(jí)城市的使用率都在65%以上,全面超越其他微博客運(yùn)營商,新浪微博一家獨(dú)大的格局已經(jīng)確立和穩(wěn)固?!保?]新浪微博意見領(lǐng)袖通過原創(chuàng)、轉(zhuǎn)發(fā)或者評(píng)論來表達(dá)對(duì)社會(huì)事件的觀點(diǎn),以個(gè)人號(hào)召力影響大眾傳播,其語言特征在新媒體意見領(lǐng)袖中具有代表性。
新浪微博平臺(tái)上具有輿論影響力的人群包括社會(huì)名人、機(jī)構(gòu)、網(wǎng)絡(luò)紅人和其他大V等,這些有影響力的用戶并不全是微博意見領(lǐng)袖。從多家機(jī)構(gòu)發(fā)布的中國微博意見領(lǐng)袖排行榜看,存在行業(yè)覆蓋面窄、參照時(shí)間短等弊端,不利于進(jìn)行全面的社會(huì)語言學(xué)分析。本文為考察不同行業(yè)、學(xué)歷、年齡、性別的意見領(lǐng)袖在字頻上的組間差異,制定了覆蓋面較全的排行。
第一步,依據(jù)環(huán)球網(wǎng)論壇2015年2-3月間的4次公布的新浪微博意見領(lǐng)袖百強(qiáng)排行榜,分別抓取他們2015年1月1日-4月30日期間的所有微博,包括發(fā)博時(shí)間、轉(zhuǎn)發(fā)量、評(píng)論數(shù)、回帖數(shù)、點(diǎn)贊數(shù)等相關(guān)信息。
第二步,確定兩個(gè)一級(jí)量化指標(biāo)和七個(gè)二級(jí)量化指標(biāo)。由于微博意見領(lǐng)袖是在某一主題內(nèi)特別活躍并且在該主題內(nèi)具有極大影響力的用戶,因此本文將“用戶影響力”和“用戶活躍度”作為衡量微博意見領(lǐng)袖的兩個(gè)一級(jí)指標(biāo)。“用戶影響力”包括“被轉(zhuǎn)發(fā)數(shù)、被評(píng)論數(shù)、被提及數(shù)”3個(gè)二級(jí)指標(biāo),“用戶活躍度”包括“原創(chuàng)數(shù)”“自回帖數(shù)”“回他人貼數(shù)”“活躍天數(shù)”4個(gè)二級(jí)指標(biāo)。
第三步,量化相關(guān)指標(biāo)。影響力的計(jì)算公式:Influence影響力=V被轉(zhuǎn)發(fā)*W1+V被評(píng)論*W2+V被提及* W3,活躍度的計(jì)算公式:Activity活躍度=V原創(chuàng)數(shù)*W4+ V自回帖數(shù)*W5+V回他人貼數(shù)*W6+V活躍天數(shù)*W7。本文采用美國學(xué)者T.L.saaty提出的AHP層次分析法確定W1-7各指標(biāo)的權(quán)重,并結(jié)合劉志明,劉魯(2011)制定的權(quán)重?cái)?shù)據(jù)及計(jì)算方法進(jìn)行量化。
第四步,根據(jù)數(shù)據(jù)篩選出前50名微博意見領(lǐng)袖,然后參考近兩年行業(yè)微博情況報(bào)告、微博名人排行榜、新浪微博名人堂等資料,分析得到微博意見領(lǐng)袖的14個(gè)行業(yè)分布。權(quán)衡行業(yè)、年齡、學(xué)歷、性別的人數(shù)比例后,制定出囊括了30人的“新浪微博意見領(lǐng)袖排行榜”(不分前后)。
表1 新浪微博意見領(lǐng)袖排行榜
將30位意見領(lǐng)袖在2015年1月1日-4月30日之間(共4個(gè)月)公開發(fā)表的所有原創(chuàng)微博自建小型語料庫,微博正文共計(jì)7091條,496917字。字頻統(tǒng)計(jì)上,使用了北京語言大學(xué)開發(fā)的“CCRL工智檢索通”軟件。
前100高頻字為:的、是、一、人、不、了、我、有、在、大、這、國、個(gè)、中、生、們、年、你、為、和、會(huì)、上、到、法、來、天、多、要、家、就、時(shí)、自、說、也、好、么、以、看、心、他、能、發(fā)、都、過、出、對(duì)、可、子、公、事、愛、活、得、新、下、最、日、還、沒、學(xué)、去、小、地、無、如、網(wǎng)、開、里、后、民、與、微、行、于、點(diǎn)、信、起、之、文、師、那、成、今、道、些、者、長、想、作、只、友、經(jīng)、本、己、真、動(dòng)、很、院、問、理,字頻從每千字28.618到1.44。將該字頻列表與北京大學(xué)中國語言學(xué)研究中心公布的“CCL現(xiàn)代漢語語料字符統(tǒng)計(jì)信息”[7](總字符數(shù)為581794456字)的前100高頻字對(duì)比后發(fā)現(xiàn),兩者共用字68個(gè),意見領(lǐng)袖獨(dú)用字為“最、只、真、院、友、信、心、些、想、無、問、微、網(wǎng)、師、如、去、起、你、那、沒、么、看、今、己、活、很、好、還、都、點(diǎn)、道、愛”,共計(jì)32個(gè)。將前50個(gè)高頻字對(duì)比發(fā)現(xiàn),兩者共用字35個(gè),意見領(lǐng)袖獨(dú)用字為“自、子、心、天、事、你、能、可、看、好、過、公、法、都、么”,共計(jì)15個(gè)。我們以68個(gè)共用字在各自字頻中的序列為依據(jù),利用SPSS19.0軟件檢驗(yàn)共用字排序的相關(guān)性,得到的數(shù)據(jù)為:Pearson相關(guān)性為0.699,顯著性(雙側(cè))為0.000,由于相關(guān)系數(shù)居于0.6~0.8之間,共用字的位序具有“強(qiáng)相關(guān)”關(guān)系,但是離0.8~1之間的極強(qiáng)相關(guān)還是有差距,意見領(lǐng)袖的共用字在位序上產(chǎn)生了較大變化。說明微博意見領(lǐng)袖高頻字有別于現(xiàn)代漢語平衡語料庫統(tǒng)計(jì)數(shù)據(jù),兩者之間存在較大差異。
大量高頻獨(dú)用字和共用字位次變化反映了意見領(lǐng)袖特有的語言風(fēng)格及話題內(nèi)容傾向性,王秀麗(2014)認(rèn)為,意見領(lǐng)袖的語言風(fēng)格在很大程度上影響其信息的傳播力、可信度和權(quán)威性[8]。微博意見領(lǐng)袖高頻獨(dú)用字中,程度副詞“最、很”、形容詞“好、真”、心理動(dòng)詞“想、愛”、范圍副詞“只、都”、能愿動(dòng)詞“能”等,都是具有強(qiáng)烈主觀色彩的字詞。Ng& Bradac(1993)、O’Keefe(2002)就認(rèn)為,清晰、有力、包含感情色彩的詞語能夠增加信息的影響力[9],而乏味的語言則會(huì)減弱意見領(lǐng)袖的影響力[10]。Huffaker(2010)也發(fā)現(xiàn),網(wǎng)絡(luò)意見領(lǐng)袖通過大量使用自信、感情色彩強(qiáng)烈和多樣性的語言提升其網(wǎng)絡(luò)影響[11]??梢姡@些主觀性強(qiáng)的獨(dú)用字不僅增強(qiáng)了意見領(lǐng)袖的語言表現(xiàn)力,也有助于其影響力的提升。
微博意見領(lǐng)袖共用字中,判斷動(dòng)詞“是”的字頻居第2位,僅次于結(jié)構(gòu)助詞“的”,而CCL語料庫中“是”的字頻居第4位。Burrell&Koper(1998)就認(rèn)為,肯定有力的語言比蒼白無力的語言更有說服力。[12]進(jìn)一步檢索發(fā)現(xiàn),“是”多出現(xiàn)在肯定句中,可見高頻使用肯定性判斷句也是微博意見領(lǐng)袖提升其話語影響力的手段之一。
意見領(lǐng)袖影響力對(duì)話題的依賴性較強(qiáng),獨(dú)用字折射出意見領(lǐng)袖對(duì)包含該字的相關(guān)話題的關(guān)注度較高。Huffaker(2010)認(rèn)為,網(wǎng)絡(luò)意見領(lǐng)袖通常會(huì)積極推動(dòng)有關(guān)政治和公共議題的討論,以及提供專業(yè)、可信的信息提升影響力。獨(dú)用字在語料中的構(gòu)詞情況也呈現(xiàn)這一趨勢,如高頻獨(dú)用字“院、法、公”在微博語料中構(gòu)成的“醫(yī)院、法院、學(xué)院、國務(wù)院、院士”、“立法、法庭、法警、司法、法律,違法”、“公權(quán)、公信力、公民、公益、公務(wù)員)”等大部分進(jìn)入高頻詞的前100,說明微博意見領(lǐng)袖對(duì)法制、醫(yī)療、教育、社會(huì)發(fā)展等方面話題關(guān)注度較高。
為有效地進(jìn)行組間差異比較,將30位意見領(lǐng)袖所在的14職業(yè)歸并為“黨政、經(jīng)濟(jì)、文化、公知、文藝、宗教、自由職業(yè)”7大領(lǐng)域,分別統(tǒng)計(jì)七組行業(yè)的字頻,列出各行業(yè)的前200高頻字表。設(shè)計(jì)小型程序,提取前200字和前50字中的行業(yè)共用字,篩選前20個(gè)高頻字列表中各領(lǐng)域的獨(dú)用字(即其他行業(yè)意見領(lǐng)袖前20高頻字中均未出現(xiàn)的字)。
(一)高頻共用字行業(yè)差異
七組前200高頻字表中,所有行業(yè)均有的共用字為43個(gè)。使用SPSS(19.0)軟件對(duì)七個(gè)行業(yè)、共21對(duì)數(shù)據(jù)做成對(duì)樣本T檢驗(yàn)。從顯著度Sig(雙尾)值上看,共有12對(duì)數(shù)據(jù)在95%置信區(qū)間具有顯著性差異(表二),其中自由職業(yè)與黨政、公知、經(jīng)濟(jì)、文藝、文化的Sig(雙尾)值為0.000(保留小數(shù)點(diǎn)后三位),自由職業(yè)與宗教為0.002,公知與文藝、經(jīng)濟(jì)、宗教分別為0.000、0.018、0.039,文化與經(jīng)濟(jì)、文藝分別為0.022、0.003,黨政與文藝為0.034。由此可見,自由職業(yè)與其他六組行業(yè)的意見領(lǐng)袖共用高頻字都具有顯著性差異;公知、文藝分別與四個(gè)行業(yè)具有顯著性差異;文化、經(jīng)濟(jì)分別與三個(gè)行業(yè)有顯著性差異;黨政、宗教、經(jīng)濟(jì)與其他行業(yè)的差異最小,僅與其他兩個(gè)行業(yè)有顯著性差異。
用同樣的步驟檢索前50個(gè)高頻字中的共用字,也得到類似的結(jié)果。除了公知與經(jīng)濟(jì)、宗教,文化與經(jīng)濟(jì)、文藝共4對(duì)的Sig(雙尾)值大于0.05,不具有顯著度,其他8對(duì)仍然具有顯著性差異。
表2 高頻字共用字行業(yè)差異成對(duì)樣本T檢驗(yàn)
(二)高頻獨(dú)用字行業(yè)差異
由于某一行業(yè)意見領(lǐng)袖的高頻獨(dú)用字能反映其異于其他行業(yè)意見領(lǐng)袖的特有話題傾向,我們截取七個(gè)行業(yè)的前20個(gè)高頻字,篩選出了各行業(yè)的高頻獨(dú)用字。
黨政部門工作的意見領(lǐng)袖,其獨(dú)用字有“家(5.45)①括號(hào)中數(shù)據(jù)為每千字的字頻。、友(4.87)、來(4.18)、公(4.18)、網(wǎng)(4.08)、微(3.60)”,共計(jì)6個(gè)。從其獨(dú)用字在語料庫中的構(gòu)詞情況看,較多涉及“國家、公民/益/眾/權(quán)、微博”等方面內(nèi)容②進(jìn)一步對(duì)語料進(jìn)行詞頻統(tǒng)計(jì)后發(fā)現(xiàn),“公益”屬于黨政機(jī)關(guān)意見領(lǐng)袖的前20高頻詞獨(dú)用詞之一。;公知領(lǐng)域意見領(lǐng)袖的獨(dú)用字有“法(6.42)、天(4.01)、會(huì)(3.76)”?!胺ā痹谡Z料庫中的構(gòu)詞主要涉及“法律、法庭、憲法、合法、兩會(huì)”等方面內(nèi)容,是該領(lǐng)域意見領(lǐng)袖熟識(shí)或擅長的知識(shí)領(lǐng)域?!疤臁痹谡Z料中主要構(gòu)成“昨天、明天、今天”等,時(shí)間名詞高頻使用說明公知領(lǐng)域的意見領(lǐng)袖更注重信息的準(zhǔn)確性和真實(shí)性。Pornpitakpan(2004)就認(rèn)為,意見領(lǐng)袖更注重通過言論的準(zhǔn)確性、專業(yè)性和權(quán)威性增加其影響力[13];文藝領(lǐng)域意見領(lǐng)袖的獨(dú)用字有“也(5.00)、愛(4.63)、時(shí)(4.27)”,說明話題較多涉及情感生活等方面;自由職業(yè)意見領(lǐng)袖獨(dú)用字包括“頻(5.16)、集(4.19)、視(4.19)、東(3.87)、看(3.87)、包(3.55)、京(3.55)、之(2.90)、買(2.90)、分(2.58)、旅(2.58)”,該領(lǐng)域獨(dú)用字較多是因韓寒、馮鶴等自由職業(yè)意見領(lǐng)袖微博文本量較少、話題相對(duì)單一的影響,比如“視頻”“東京”等高頻使用;宗教獨(dú)用字也較多,多與生活哲理及佛理相關(guān),包括“活(19.20)、心(9.98)、命(6.86)、要(6.11)、些(5.86)、那(5.81)、對(duì)(5.70)”;經(jīng)濟(jì)和文化領(lǐng)域的意見領(lǐng)袖獨(dú)用字最少,分比為“到(5.28)”、“好(3.60)”。
不同行業(yè)意見領(lǐng)袖高頻字差異折射出話題傾向性的組間差異。黨政部門工作的意見領(lǐng)袖多關(guān)注國家與公共議題,公知意見領(lǐng)袖多關(guān)注法制與社會(huì),文藝與自由職業(yè)意見領(lǐng)袖多關(guān)注生活,意見領(lǐng)袖熱衷的話題與其職業(yè)有密切聯(lián)系。劉志明、劉魯(2011),肖宇等(2012),熊濤、何躍(2013)曾指出意見領(lǐng)袖影響力對(duì)話題的依賴程度較高。[14-16]意見領(lǐng)袖對(duì)某類話題的傾向性,源于對(duì)該話題的熟識(shí)性,所發(fā)表的相關(guān)信息更具專業(yè)性、權(quán)威性和準(zhǔn)確性,更容易產(chǎn)生網(wǎng)絡(luò)影響力。王秀麗(2014)認(rèn)為,線下?lián)碛刑囟I(lǐng)域相關(guān)的知識(shí)背景和能力的專家,在網(wǎng)絡(luò)社區(qū)中較容易的成為相關(guān)領(lǐng)域的意見領(lǐng)袖[17]。
根據(jù)意見領(lǐng)袖的學(xué)歷分布,將其分為本科以下、本科、碩士、博士四組,分組計(jì)量各學(xué)歷層次的字頻,分析不同學(xué)歷層次的意見領(lǐng)袖在高頻共用字和獨(dú)用字上的組間差異。
(一)高頻共用字學(xué)歷差異
四組前200個(gè)高頻字中,共用字有89個(gè)。對(duì)高頻共用字做成對(duì)樣本T檢驗(yàn)之后發(fā)現(xiàn),只有本科以下與博士之間存在顯著性差異,Sig(雙尾)值為0.047,小于0.05的閾值。其他組間差異沒有顯著性。組間字頻差值最大兩個(gè)字是“國、家”,本科以下到博士的千字頻分別為“1.42、4.14、5.12、6.17”,“1.42、2.74、3.02、3.08”,意見領(lǐng)袖學(xué)歷越高越關(guān)注涉及“國家”的話題。前50個(gè)高頻字詞中,共用字有19個(gè),T檢驗(yàn)結(jié)果Sig(雙尾)值為0.01,再次說明只有本科以下與博士之間存在顯著性差異,相鄰的學(xué)歷層次之間的差異不顯著,不具有統(tǒng)計(jì)學(xué)上的意義。
表3 高頻字共用字學(xué)歷差異成對(duì)樣本T檢驗(yàn)
(二)高頻獨(dú)用字學(xué)歷差異
前20個(gè)高頻字中,本科以下學(xué)歷的意見領(lǐng)袖獨(dú)用字有“你、要、自、這、得、好、心、在”,共8個(gè);本科學(xué)歷的獨(dú)用字有“到、天”,共2個(gè);碩士學(xué)歷的獨(dú)用字有“們、來、公”,共3個(gè);博士學(xué)歷有“為、和、生”,共3個(gè)。本碩博高學(xué)歷意見領(lǐng)袖的高頻字相似度較高,高學(xué)歷和本科以下學(xué)歷在高頻字的“字種”上區(qū)別較大。
前100個(gè)高頻字中,本科以下學(xué)歷獨(dú)用字有“己(3.6)、想(2.67)、些(2.56)、只(2.45)、無(2.45)、情(2.23)、那(2.18)、感(2.13)、成(2.07)、活(1.85)、什(1.85)、很(1.74)、做(1.69)、著(1.69)、少(1.69)、別(1.63)、實(shí)(1.63)、知(1.58)”,共18個(gè);本科學(xué)歷獨(dú)用字有“愛(3.26)、塵(3.22)、清(2.25)、師(2.24)、院(2.08)、哈(1.96)、律(1.96)、機(jī)(1.69)”,共8個(gè);碩士學(xué)歷獨(dú)用字有“論(2.47)、第(2.19)、動(dòng)(2.19)、孩(2.10)、力(2.10)、樂(1.74)、市(1.74)、同(1.74)、主(1.74)、萬(1.64)、更(1.55)、場(1.55)、經(jīng)(1.55)、理(1.55)”,共14個(gè);博士學(xué)歷獨(dú)用字有“微(3.15)、案(3)、信(2.93)、網(wǎng)(2.84)、文(2.43)、關(guān)(2.11)、于(2.02)、政(2)、道(1.87)、全(1.82)、明(1.67)、女(1.67)、但(1.67)、意(1.67)”,共14個(gè)。
從獨(dú)用字的情況看,本科以下學(xué)歷的關(guān)注“情感”、“生活”方面的內(nèi)容居多;“(關(guān))愛”、“塵(肺?。?、“(老/律)師”等字,說明本科學(xué)歷對(duì)情感、醫(yī)療、法律、教育等問題關(guān)注較多;“(言/輿)論”、“孩(子)”等字,說明碩士學(xué)歷對(duì)社會(huì)熱點(diǎn)議題以及家庭生活關(guān)注較多;“微(博)、網(wǎng)(絡(luò))、(提/預(yù))案、案(件)、政(治)”等,說明博士學(xué)歷對(duì)社會(huì)、法制和國家發(fā)展問題關(guān)注較多。學(xué)歷的組間差異比較說明,不同學(xué)歷層次的意見領(lǐng)袖所關(guān)注的熱點(diǎn)問題不盡相同,本科以下與博士學(xué)歷的意見領(lǐng)袖差異最大。
網(wǎng)絡(luò)意見領(lǐng)袖的年齡分布有別于網(wǎng)絡(luò)紅人,前者以中年居多,后者以青年居多。本文篩選出的30位微博意見領(lǐng)袖的年齡分布也有這一特點(diǎn),年齡主要集中在40-60歲間,30歲左右的人數(shù)較少。因此,本文將意見領(lǐng)袖按年齡分為兩大類:五十歲以下的中青年與五十歲以上的中老年。
(一)高頻共用字年齡差異
前200個(gè)和前50高頻字的共用字分別為136、31,對(duì)兩者分別做成對(duì)樣本T檢驗(yàn)后,顯著度Sig(雙尾)值分別為0.111、0.4,差異均無顯著性。雖然整體差異無統(tǒng)計(jì)學(xué)上的顯著性,但是部分高頻字的字頻差距很大:(1)從字頻的差值上看,中老年比中青年組字頻高出最多的兩個(gè)字是“國、中”,差值分別為每千字頻3.21、2.28,說明中老年意見領(lǐng)袖比中青年更關(guān)注國家話題。中青年比中老年組字頻高出最多的兩個(gè)字是“我、生”,差值分別為3.03,2.76。(2)從字頻的比值上看,中老年與中青年組比值最大的字是“民”,而中青年與中老年組比值最大的字是“活”。表4、5分別是兩者共用字比值超過1.5倍的字。
考察字頻差值和字頻比值發(fā)現(xiàn),中老年意見領(lǐng)袖更關(guān)注國家、民生、文化、網(wǎng)絡(luò)、法制等話題,中青年更關(guān)注生活、個(gè)人情感方面的話題。
表4 中老年與中青年共用字字頻比值
表5 中青年與中老年共用字字頻比值
(二)高頻獨(dú)用字年齡差異
前20個(gè)高頻字中,中青年意見領(lǐng)袖獨(dú)用字有“生(6.056)、你(5.225)、到(3.966)、就(3.928)、天(3.764),共5個(gè);中老年組獨(dú)用字有“中(6.024)、法(4.661)、為(4.331)、會(huì)(4.32)、和(3.726)”,共5個(gè);
前100個(gè)高頻字中,中青年組獨(dú)用字有“活(2.87)、得(2.67)、去(2.52)、些(2.17)、無(2.13)、如(2.08)、?。?.06)、里(2.04)、那(2.04)、己(1.99)、想(1.88)、師(1.86)、長(1.86)、只(1.83)、感(1.8)、起(1.8)、給(1.8)、今(1.8)、很(1.79)、案(1.76)、成(1.76)、友(1.73)”,共22個(gè)。中老年獨(dú)用字有“塵(2.89)、民(2.67)、網(wǎng)(2.3)、學(xué)(2.23)、地(2.08)、清(2.03)、者(1.99)、文(1.97)、律(1.92)、之(1.92)、作(1.91)、本(1.89)、方(1.88)、道(1.87)、接(1.77)、機(jī)(1.75)、全(1.75),共17個(gè)。①兩組獨(dú)用字的數(shù)量不同是刪除了非漢字字符的結(jié)果。
高頻獨(dú)用字的使用數(shù)據(jù)再次說明:中老年意見領(lǐng)袖對(duì)國家、網(wǎng)絡(luò)、環(huán)境、法制、教育等話題關(guān)注較多,如“中、法、律、網(wǎng)、民、塵”等;中青年組關(guān)注的是生活、情感、法制、教育等話題,如“生、活、想、感、今、天、案、師”等。
(一)高頻共用字性別差異
前200個(gè)和前50高頻字的共用字分別為122、28,對(duì)兩者分別做成對(duì)樣本T檢驗(yàn)后,顯著度Sig(雙尾)值分別為0.623、0.267,說明男性與女性意見領(lǐng)袖在高頻共用字字頻上無顯著性差異。但是部分高頻字的字頻差距仍然很大,(1)從字頻的差值上看,男性比女性字頻高出最多的字是“國、人、生、們、大、中、家、公”,而女性比男性字頻高出最多的字是“是、你、愛、法、師、了、有、那、也、想”等。(2)從字頻的比值上看,“國”是男性與女性比值最大的字,比值為3.47;“師”是女性與男性比值最大的字,比值為2.97。表6、7分別是兩者共用字比值超過1.5倍的字。
通過以上分析發(fā)現(xiàn),男性比女性更關(guān)注國家、網(wǎng)絡(luò)等話題,女性比男性更關(guān)注教育、情感等話題。
(二)高頻獨(dú)用字性別差異
前20個(gè)高頻字中,兩性獨(dú)用字各有8個(gè),男性獨(dú)用字為“國(6.069)、中(5.192)、們(4.939)、生(4.893)、年(4.78)、會(huì)(3.869)、為(3.836)、和(3.776)”;女性獨(dú)用字為“你(6.161)、法(5.486)、到(4.587)、愛(4.542)、也(4.227)、就(4.182)、好(3.912)、天(3.867)”。
表6 男性與女性共用字的比值
表7 女性與男性共用字的比值
前100個(gè)高頻字中,兩性獨(dú)用字各有24個(gè),有代表性的男性獨(dú)用字包括“家(3.54)、發(fā)(2.87)、新(2.32)、日(2.25)、民(2.15)、網(wǎng)(2.09)、學(xué)(2.05)、活(2.03)、信(1.93)、微(1.89)、成(1.88)、今(1.87)、塵(1.8)”等,有代表性的女性獨(dú)用字包括“律(3.69)、師(3.42)、想(2.7)、嗎(2.16)、情(2.07)、很(1.98)、真(1.93)、案(1.84)”等男女性意見領(lǐng)袖獨(dú)用字的情況說明:(1)兩性前20個(gè)高頻字的差異較大,共用字僅為12個(gè),當(dāng)擴(kuò)大到前100個(gè)高頻字時(shí),共用字明顯增多,說明在兩性各自最關(guān)注的話題上,存在較大差異。(2)獨(dú)用字“國、中、家、民、網(wǎng)、塵”等說明男性更關(guān)注涉及國家、民生、環(huán)保等方面的話題;獨(dú)用字“愛、法”、“律、師、想、情、案”等說明女性更關(guān)注情感、法律、教育等方面的話題。(3)女性更傾向于使用程度副詞、形容詞等主觀性強(qiáng)的字提升其話語影響力,如“很、好、真”等。趙蓉暉(2003)、馬琰(2009)都認(rèn)為,女性在言語交際中常常帶有濃厚的感情色彩,更多地使用夸張的詞語等[18-19]。(4)“嗎”的高頻使用說明女性意見領(lǐng)袖更多地使用帶疑問語氣詞的是非疑問句,而且疑問語氣詞“吧”“啊”“呢”等字,女性意見領(lǐng)袖的字頻均高于男性。Lakoff(1973:56~57)就指出,女性比男性更多地使用疑問句,喜歡把有陳述句功能的句子用疑問句形式表現(xiàn)出來[20]。Fishman(1980:234~241)的研究證實(shí)了Lakoff的觀點(diǎn)[21]。王宇波(2011)對(duì)中文博客文本中的四類疑問句進(jìn)行了分類統(tǒng)計(jì),也認(rèn)為女性比男性更多地使用疑問句。[22]可見,高頻使用疑問句不僅是女性微博意見領(lǐng)袖的句式特點(diǎn),也是女性普遍具有的話語特征。
通過對(duì)意見領(lǐng)袖高頻字及組間差異計(jì)量研究發(fā)現(xiàn),不同行業(yè)、學(xué)歷、年齡、性別的意見領(lǐng)袖在高頻字的使用上存在差異。行業(yè)的組間差異大部分具有統(tǒng)計(jì)學(xué)上的顯著性,自由職業(yè)與其他行業(yè)差距最大,公知與文藝領(lǐng)域次之。各學(xué)歷層次之間,除了本科以下與博士學(xué)歷有顯著性差異以外,其他學(xué)歷層次之間的差異無顯著性。年齡和性別的組間差異不具有顯著性,但是部分共用字和獨(dú)用字字頻差距較大。
意見領(lǐng)袖高頻字所具有的獨(dú)特性,折射出意見領(lǐng)袖對(duì)話題主題的依賴性。劉志明,劉魯(2011)認(rèn)為,意見領(lǐng)袖是依賴主題的,只有很少用戶可以在不同主題同時(shí)成為意見領(lǐng)袖[23]。微博意見領(lǐng)袖作為社交網(wǎng)絡(luò)輿論的發(fā)起者和參與者,發(fā)布的主題多圍繞自己關(guān)注或擅長的領(lǐng)域展開,黨政領(lǐng)域意見領(lǐng)袖比其他領(lǐng)域意見領(lǐng)袖更多地關(guān)注國家發(fā)展、社會(huì)民生等,公知意見領(lǐng)袖更多關(guān)注法制和社會(huì)發(fā)展。其總體傾向是:黨政部門、公知、博士學(xué)歷、中老年、男性的意見領(lǐng)袖更關(guān)注國家政治、社會(huì)發(fā)展、法制等公共議題;文藝、自由職業(yè)、本科及以下學(xué)歷、中青年、女性的意見領(lǐng)袖更關(guān)注情感、生活等方面議題;教育、醫(yī)療、環(huán)境等主題是大部分意見領(lǐng)袖都會(huì)關(guān)注的熱點(diǎn)議題,沒有太明顯的組間差異。
[1]Lazarsfeld P F,Berelson B,Gaudet H.The People's Choice[M]. New York:Columbia University Press,1948.
[2]姜珊珊,李欲曉,徐敬宏.非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情中的意見領(lǐng)袖分析[J].情報(bào)理論與實(shí)踐,2010,33(12):101-104.
[3]Lee,Kim.The spiral of silence and journalists'outspokenness on Twitter[J].Asian Journal of Communication.2014,24(3):262-278.
[4]Yala Penga,Jiajie Lia,Hui Xiaa,Siyuan Qia,Jianhong Lib.The effects of food safety issues released by we media on consumers' awareness and purchasing behavior:A case study in China[J]. Food Policy.2015(No.C).
[5]元志潤.在網(wǎng)絡(luò)口碑溝通中的意見領(lǐng)袖(Opinion Leader)研究——以韓國超級(jí)博客(Power Blog)為例[D].上海:復(fù)旦大學(xué),2011.
[6]國互聯(lián)網(wǎng)絡(luò)信息中心.第36次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/ 201507/P020150723549500667087.pdf(2016-03-15).
[7]CCL現(xiàn)代漢語語料字符統(tǒng)計(jì)信息[EB/OL].中國社會(huì)科學(xué)網(wǎng),http://www.cssn.cn/yyx/yyxcyzy/201509/W0201509224221904 43322.pdf(2016-03-15).
[8]王秀麗.網(wǎng)絡(luò)社區(qū)意見領(lǐng)袖影響機(jī)制研究——以社會(huì)化問答社區(qū)“知乎”為例[J].國際新聞界,2014(9):47-57.
[9]Ng,S.H.,&Bradac,J.J.Power in language:verbal communication and social influence[M].Newbury Park:Sage,1993.
[10]O′Keefe,D.J.Persuasion:theory and research(2nd ed.)[M]. Thousand Oaks,CA:Sage,2002.
[11]Huffaker,D.Dimensions of leadership and social influence in online communities[J].Human Communication Research,2010,36(4):593-617.
[12]Burrell,N.A.,&Koper,R.J.The efficacy of powerful/powerless language on attitudes and source credibility[C]//In M.Allen&R.W.Preiss(Eds.),Persuasion:advancesthrough metaanalysis.Cresskill,NJ:Hampton Press,1998:203-216.
[13]Pornpitakpan,C.The persuasiveness of source credibility:a critical review of five decades'evidence[J].Journal of Applied Social Psychology,2004,34(2):243-281.
[14]熊濤,何躍.微博轉(zhuǎn)發(fā)網(wǎng)絡(luò)中意見領(lǐng)袖的識(shí)別與分析[J].現(xiàn)代圖書情報(bào)技術(shù),2013,29(6):55-62.
[15]劉志明,劉魯.微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識(shí)別及分析[J].系統(tǒng)工程,2011,29(6):8-16.
[16]肖宇,許煒,夏霖.一種基于情感傾向分析的網(wǎng)絡(luò)團(tuán)體意見領(lǐng)袖識(shí)別算法[J].計(jì)算機(jī)科學(xué),2012,39(2):34-37.
[17]王秀麗.網(wǎng)絡(luò)社區(qū)意見領(lǐng)袖影響機(jī)制研究——以社會(huì)化問答社區(qū)“知乎”為例[J].國際新聞界,2014(9).
[18]趙蓉暉.語言與性別:口語的社會(huì)語言學(xué)研究[M].上海:上海外語教育出版社,2003:
[19]馬琰.漢語恭維語中的性別語言實(shí)證研究[J].商洛學(xué)院學(xué)報(bào),2009,23(5):57-62.
[20]Lakoff,R.Language and Woman's Place[J].Language in Society,1973(2):45-80.
[21]Fishman,P.Conversational Insecurity[A].Giles,H.,Robinson,W.,&Smith,P.(eds.).Language:Social Psychological Perspective[C].Oxford:Pergamon Press,1980.
[22]王宇波.基于網(wǎng)絡(luò)媒體監(jiān)測語料庫(漢語)的性別語言差異實(shí)證研究[D].華中師范大學(xué)博士學(xué)位論文,2011.
[23]劉志明,劉魯.微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識(shí)別及分析[J].系統(tǒng)工程,2011(6):8-16.
責(zé)任編輯:畢 曼
G209
A
1004-941(2016)03-0134-06
2016-03-10
國家社科基金青年項(xiàng)目“基于大規(guī)模標(biāo)注語料庫的自媒體語言計(jì)量研究”(項(xiàng)目編號(hào):12CYY030);教育部人文社科青年項(xiàng)目“基于大規(guī)模標(biāo)注博客語料庫的性別話語差異實(shí)證研究”(項(xiàng)目編號(hào):12YJC740106);國家語委重點(diǎn)科研項(xiàng)目“新媒體意見領(lǐng)袖話語傳播機(jī)制研究”(項(xiàng)目編號(hào):ZDI135-11);研究成果得到“中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)基金”資助。
王宇波(1983-),男,湖北漢川人,博士,應(yīng)用語言學(xué)博士后(出站),情報(bào)學(xué)博士后(第二站),主要研究方向?yàn)樯鐣?huì)語言學(xué);譚昭(1994-),女,湖北漢川人,主要研究方向?yàn)樯鐣?huì)語言學(xué)。