文/新華社“中國(guó)網(wǎng)事”總編 李俊
《“詞云”提醒:城鎮(zhèn)化還需以人為本》配圖。(新華社/發(fā))
“天上一片云,地上一張網(wǎng)”。數(shù)字時(shí)代的瞭望者以此描述新的傳播格局。一方面,海量數(shù)據(jù)以幾何級(jí)數(shù)在“云端”匯聚;另一方面,媒體、自媒體井噴般地采集、生產(chǎn)新數(shù)據(jù)和知識(shí)。
這是大數(shù)據(jù)時(shí)代令人興奮的信息圖譜,也是擺在媒體工作者面前的時(shí)代難題。大數(shù)據(jù)采之為財(cái)富,存之則如糞土。未經(jīng)分析、挖掘的大數(shù)據(jù),百無(wú)一用。大數(shù)據(jù)時(shí)代的主要矛盾是社會(huì)日益增長(zhǎng)的龐大的數(shù)據(jù)生產(chǎn)、存儲(chǔ)能力和媒體、受眾貧瘠的數(shù)據(jù)分析、加工能力間的矛盾。
今年3月,新華社新媒體專線首次采用“詞云”技術(shù)報(bào)道全國(guó)兩會(huì),媒體用戶和讀者盛贊“新風(fēng)撲面”。但如果把這項(xiàng)小小的技術(shù)升級(jí)放在“大數(shù)據(jù)之問(wèn)”的時(shí)代背景下,它的意義和啟示也許才能彰顯。
所謂詞云,就是利用語(yǔ)言分析技術(shù),對(duì)大數(shù)據(jù)文本進(jìn)行詞頻分析,并生成可視化圖像的技術(shù)。由清華大學(xué)計(jì)算機(jī)系自然語(yǔ)言分析實(shí)驗(yàn)室開(kāi)發(fā)的中文“詞云”就像一把打開(kāi)數(shù)據(jù)之門(mén)的鑰匙——十萬(wàn)字的文本,“讀懂”只需幾秒鐘,還能飛快生成“趨勢(shì)化、可視化”的圖表。
十年來(lái)的兩會(huì)文本、文獻(xiàn)浩如煙海。政府工作報(bào)告如何讓公眾“聽(tīng)得懂,愿意聽(tīng),記得住,能管用”?艱深專業(yè)的預(yù)算報(bào)告如何讓公眾像“看緊”自家賬本一樣“看緊”公共賬本?如何看懂文字背后十年來(lái)的成就與變遷?
新華社采編人員和清華大學(xué)年輕的工程師們?cè)凇懊^過(guò)河”的狀態(tài)中,“試”出了《“詞云”提醒:城鎮(zhèn)化還需以人為本》等一批新報(bào)道。在這些稿件中,詞云技術(shù)分別被用來(lái)分析文本本身,得出帶有趨勢(shì)性的結(jié)論,并配以精準(zhǔn)解讀。
在一個(gè)越來(lái)越開(kāi)放透明、公眾和媒體擁有同步獲取大數(shù)據(jù)能力的時(shí)代,在圖閱讀、淺閱讀盛行的時(shí)代,媒體的價(jià)值在于將那些看起來(lái)雜亂無(wú)序的數(shù)據(jù)進(jìn)行篩選、分析、解讀,讓讀者“見(jiàn)所未見(jiàn)”,和讀者一起發(fā)現(xiàn)數(shù)據(jù)背后的真相。這需要人性化的眼界,也需要智能化的技術(shù)。詞云只是朵朵白云中的一朵,而已。