王皖瀛
【摘要】隨著信息技術(shù)和互聯(lián)網(wǎng)的迅速發(fā)展,大數(shù)據(jù)技術(shù)的出現(xiàn)給新聞媒體行業(yè)帶來了前所未有的機(jī)遇和挑戰(zhàn)。本文以借助大數(shù)據(jù)推動(dòng)新聞媒體行業(yè)的發(fā)展為主題,探討了大數(shù)據(jù)技術(shù)在新聞媒體行業(yè)中的應(yīng)用現(xiàn)狀及其潛力,并分析了其影響和作用。通過對(duì)現(xiàn)有研究成果的綜述和實(shí)證研究的分析,本文得出了如下結(jié)論:大數(shù)據(jù)技術(shù)在新聞媒體行業(yè)中的應(yīng)用已經(jīng)具有重要的意義和廣闊的前景,可以幫助新聞媒體機(jī)構(gòu)更好地適應(yīng)互聯(lián)網(wǎng)時(shí)代的新要求和挑戰(zhàn),提高信息獲取和傳播的效率和質(zhì)量,推動(dòng)新聞媒體行業(yè)的發(fā)展。
【關(guān)鍵詞】大數(shù)據(jù);新聞媒體;信息獲?。恍畔鞑?;數(shù)據(jù)分析
中圖分類號(hào):G212? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2023.08.066
新聞媒體是社會(huì)公共信息傳播的重要渠道,其角色和地位在互聯(lián)網(wǎng)時(shí)代得到了進(jìn)一步的凸顯。然而,在信息爆炸的時(shí)代,新聞媒體機(jī)構(gòu)面臨著越來越多的挑戰(zhàn),如何更好地滿足讀者的需求,提高信息獲取和傳播的效率和質(zhì)量,成為新聞媒體機(jī)構(gòu)面臨的重要問題。在這種背景下,大數(shù)據(jù)技術(shù)的出現(xiàn)給新聞媒體行業(yè)帶來了前所未有的機(jī)遇和挑戰(zhàn)。通過對(duì)大數(shù)據(jù)的收集、分析和挖掘,可以為新聞媒體機(jī)構(gòu)提供更多的信息和洞察,幫助其更好地了解讀者的需求和喜好以及社會(huì)的變化和趨勢(shì),從而更好地適應(yīng)和引領(lǐng)新聞媒體的發(fā)展。
1. 大數(shù)據(jù)技術(shù)的特點(diǎn)
1.1 高速
大數(shù)據(jù)的來源涵蓋了各行各業(yè)的信息,包括但不限于互聯(lián)網(wǎng)、傳感器、移動(dòng)設(shè)備、社交媒體等。這些數(shù)據(jù)的傳輸速度非???,需要具備高速的數(shù)據(jù)處理能力才能應(yīng)對(duì)。大數(shù)據(jù)的處理需要借助于大數(shù)據(jù)技術(shù),包括數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能等多個(gè)領(lǐng)域的知識(shí)和技術(shù)。在處理大數(shù)據(jù)時(shí),需要考慮到數(shù)據(jù)的質(zhì)量、安全、隱私等問題,同時(shí)也需要注意數(shù)據(jù)的應(yīng)用場(chǎng)景,為不同的應(yīng)用提供針對(duì)性的解決方案。
1.2 多樣性
大數(shù)據(jù)集合通常包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)類型具有不同的特點(diǎn)和處理方式。結(jié)構(gòu)化數(shù)據(jù)指按照某種規(guī)則排列的數(shù)據(jù),如關(guān)系型數(shù)據(jù)庫中的表格數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)則是指有一定結(jié)構(gòu),但不符合關(guān)系型數(shù)據(jù)庫的規(guī)則,如XML、JSON等數(shù)據(jù)格式。而非結(jié)構(gòu)化數(shù)據(jù)則是指沒有固定結(jié)構(gòu)的數(shù)據(jù),如文本、音頻、圖像等。處理這些不同類型的數(shù)據(jù)需要使用不同的技術(shù)和工具,如使用SQL等關(guān)系型數(shù)據(jù)庫工具處理結(jié)構(gòu)化數(shù)據(jù),使用NoSQL數(shù)據(jù)庫處理半結(jié)構(gòu)化數(shù)據(jù),使用自然語言處理、計(jì)算機(jī)視覺等技術(shù)處理非結(jié)構(gòu)化數(shù)據(jù)。因此,為了更好地處理大數(shù)據(jù),需要具備不同類型數(shù)據(jù)的處理能力。
1.3 大規(guī)模
大數(shù)據(jù)集合的規(guī)模通常非常大,可以達(dá)到數(shù)百TB、甚至是PB的級(jí)別。這就要求具備大規(guī)模數(shù)據(jù)的存儲(chǔ)和處理能力。傳統(tǒng)的存儲(chǔ)和處理方式已經(jīng)無法滿足大數(shù)據(jù)處理的需求,因此需要采用分布式存儲(chǔ)和計(jì)算技術(shù)。分布式存儲(chǔ)將數(shù)據(jù)分散存儲(chǔ)在多個(gè)物理節(jié)點(diǎn)上,可以提高數(shù)據(jù)的可靠性和可擴(kuò)展性,同時(shí)降低單個(gè)節(jié)點(diǎn)的存儲(chǔ)壓力。分布式計(jì)算則是將計(jì)算任務(wù)分配到多個(gè)計(jì)算節(jié)點(diǎn)上并行處理,從而加速數(shù)據(jù)處理的速度。常見的大數(shù)據(jù)存儲(chǔ)和計(jì)算技術(shù)包括Hadoop、Spark、Cassandra、HBase等。同時(shí),還需要具備高速網(wǎng)絡(luò)、高性能計(jì)算、大規(guī)模數(shù)據(jù)遷移等方面的能力,才能更好地應(yīng)對(duì)大規(guī)模數(shù)據(jù)的存儲(chǔ)和處理需求。
1.4 價(jià)值密度低
大數(shù)據(jù)集合中往往存在很多垃圾數(shù)據(jù)或無效數(shù)據(jù),這些數(shù)據(jù)不僅浪費(fèi)存儲(chǔ)空間,也會(huì)降低數(shù)據(jù)的分析和處理效率。因此,挖掘和篩選有效數(shù)據(jù)的能力也是大數(shù)據(jù)處理的重要方面。在挖掘有效數(shù)據(jù)方面,需要使用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù),通過對(duì)數(shù)據(jù)的分析和模型訓(xùn)練,找到其中的有用信息。而在篩選無效數(shù)據(jù)方面,則需要使用數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理等技術(shù),剔除掉其中的錯(cuò)誤、冗余、不一致等數(shù)據(jù)。此外,還需要針對(duì)不同的應(yīng)用場(chǎng)景和業(yè)務(wù)需求,對(duì)數(shù)據(jù)進(jìn)行合理的選擇和處理,以提高數(shù)據(jù)的價(jià)值和應(yīng)用效果。因此,具備挖掘和篩選有效數(shù)據(jù)的能力也是大數(shù)據(jù)處理不可或缺的一部分。
2. 大數(shù)據(jù)技術(shù)在新聞媒體行業(yè)中的應(yīng)用
2.1 新聞采集
隨著互聯(lián)網(wǎng)的普及,越來越多的新聞和輿情信息在互聯(lián)網(wǎng)上廣泛傳播。通過對(duì)互聯(lián)網(wǎng)上的新聞資訊、社交媒體上的輿情信息等進(jìn)行采集和整理,可以為新聞媒體提供更多的新聞素材和信息資源,豐富新聞報(bào)道的內(nèi)容和角度。同時(shí),對(duì)這些信息進(jìn)行分析和處理,可以發(fā)現(xiàn)其中的趨勢(shì)和規(guī)律,為新聞報(bào)道提供更深入的見解和分析。此外,通過對(duì)用戶的關(guān)注點(diǎn)和行為進(jìn)行分析,可以為新聞媒體提供更加精準(zhǔn)的新聞定位和服務(wù),提高用戶對(duì)新聞的滿意度和忠誠(chéng)度。因此,對(duì)互聯(lián)網(wǎng)上的新聞資訊和輿情信息進(jìn)行采集和整理以及分析和處理,不僅可以為新聞媒體提供更多的信息資源和價(jià)值,也可以為用戶提供更加豐富和精準(zhǔn)的新聞服務(wù)。
2.2 信息分析
通過對(duì)大數(shù)據(jù)集合進(jìn)行分析和挖掘,可以獲取更多的信息洞察,深入了解社會(huì)熱點(diǎn)、讀者需求和趨勢(shì)等,為新聞媒體提供更多的思路和方向。通過對(duì)海量的社交媒體數(shù)據(jù)、新聞搜索記錄、用戶行為數(shù)據(jù)等進(jìn)行分析,可以快速了解讀者的關(guān)注點(diǎn)和需求,進(jìn)而針對(duì)性地制定新聞策略和編輯方案。此外,通過對(duì)用戶在社交媒體上的互動(dòng)行為進(jìn)行分析,可以了解用戶對(duì)不同話題和新聞事件的態(tài)度和情感傾向,為新聞報(bào)道提供更深入的見解和分析。通過對(duì)大數(shù)據(jù)集合的挖掘和分析,可以幫助新聞媒體更好地了解社會(huì)的發(fā)展和變化,把握新聞報(bào)道的方向和趨勢(shì),提高新聞報(bào)道的針對(duì)性和時(shí)效性。因此,大數(shù)據(jù)分析和挖掘?yàn)樾侣劽襟w提供了豐富的信息資源和洞察,有助于提升新聞報(bào)道的質(zhì)量和影響力。
2.3 定向推送
通過對(duì)讀者的數(shù)據(jù)分析和個(gè)性化推薦,新聞媒體可以為讀者提供更加精準(zhǔn)的新聞內(nèi)容推送服務(wù),提高新聞的曝光和傳播效率。通過分析讀者的歷史瀏覽記錄、搜索記錄和互動(dòng)行為,可以了解讀者的興趣和偏好,進(jìn)而制定個(gè)性化的推送策略,向讀者推送他們最感興趣的新聞內(nèi)容。此外,通過對(duì)讀者的地域、年齡、性別等基本信息進(jìn)行分析,可以更好地了解讀者的特征和需求,為新聞的定位和服務(wù)提供更精準(zhǔn)的指導(dǎo)。通過個(gè)性化推薦,不僅可以提高新聞的曝光和傳播效率,也可以提高讀者對(duì)新聞的關(guān)注度和忠誠(chéng)度,促進(jìn)新聞媒體的發(fā)展和壯大。因此,通過對(duì)讀者數(shù)據(jù)的分析和個(gè)性化推薦,可以為新聞媒體提供更加精準(zhǔn)的推送策略,實(shí)現(xiàn)新聞和讀者之間的良性互動(dòng)和共贏。
2.4 數(shù)據(jù)可視化
通過數(shù)據(jù)可視化工具和技術(shù),可以將復(fù)雜的數(shù)據(jù)和信息以圖表、地圖、詞云等形式呈現(xiàn),使得新聞媒體的報(bào)道更生動(dòng)、直觀、易懂??梢暬粌H能夠呈現(xiàn)數(shù)據(jù)的統(tǒng)計(jì)指標(biāo)、趨勢(shì)和規(guī)律,還能夠讓讀者更加深入地理解新聞事件的背景、原因和影響。通過可視化技術(shù),新聞媒體可以將大數(shù)據(jù)的洞察和分析結(jié)果以更加形象化的方式展現(xiàn)出來,使得讀者更容易接受和理解,從而提高讀者對(duì)新聞的關(guān)注度和信任度。同時(shí),數(shù)據(jù)可視化也可以讓新聞媒體的報(bào)道更加直觀和生動(dòng),增強(qiáng)讀者的閱讀體驗(yàn)和記憶效果,從而提高新聞的傳播效果和社會(huì)影響力。因此,通過數(shù)據(jù)可視化工具和技術(shù),可以為新聞媒體提供更加生動(dòng)、直觀、易懂的報(bào)道方式,提高新聞的傳播效果和社會(huì)影響力,實(shí)現(xiàn)新聞與讀者之間的良性互動(dòng)和共贏。
3. 大數(shù)據(jù)技術(shù)在新聞媒體行業(yè)中面臨的挑戰(zhàn)
3.1 數(shù)據(jù)隱私和安全問題
隨著大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,新聞媒體需要處理大量的個(gè)人數(shù)據(jù)和敏感信息,如讀者的閱讀歷史、偏好、地理位置等。然而,這些數(shù)據(jù)的收集和使用涉及到個(gè)人隱私,如果被泄露或?yàn)E用,將會(huì)對(duì)個(gè)人造成損失和威脅,也會(huì)對(duì)新聞媒體造成聲譽(yù)和法律方面的風(fēng)險(xiǎn)。此外,由于新聞媒體通常面向廣大公眾,數(shù)據(jù)的收集和使用需要遵守相關(guān)的法律法規(guī)和倫理標(biāo)準(zhǔn),如《個(gè)人信息保護(hù)法》《數(shù)據(jù)安全法等》。
3.2 數(shù)據(jù)質(zhì)量問題
大數(shù)據(jù)集合中垃圾數(shù)據(jù)和無效數(shù)據(jù)的存在是一個(gè)普遍的問題,這些數(shù)據(jù)可能是由于傳感器誤差、數(shù)據(jù)傳輸錯(cuò)誤、網(wǎng)絡(luò)攻擊等原因?qū)е碌?,也可能是由于?shù)據(jù)采集的方法不規(guī)范、數(shù)據(jù)質(zhì)量不佳等原因?qū)е碌?。這些數(shù)據(jù)的存在會(huì)對(duì)新聞的準(zhǔn)確性和可信度造成嚴(yán)重的影響,可能會(huì)誤導(dǎo)新聞媒體的報(bào)道和決策,同時(shí)也會(huì)損害新聞媒體的聲譽(yù)和信譽(yù)。
3.3 數(shù)據(jù)分析和應(yīng)用問題
大數(shù)據(jù)集合中的數(shù)據(jù)類型和格式多樣,可能包括文本、圖像、視頻、音頻等多種類型的數(shù)據(jù),并且這些數(shù)據(jù)往往需要以不同的格式進(jìn)行存儲(chǔ)和處理。新聞媒體需要有技術(shù)人員具備處理這些多樣化數(shù)據(jù)的能力,這需要技術(shù)人員具備深厚的技術(shù)背景、算法知識(shí)和數(shù)據(jù)分析能力。同時(shí),技術(shù)人員需要不斷地跟進(jìn)最新的技術(shù)發(fā)展和算法改進(jìn),以應(yīng)對(duì)不斷變化的數(shù)據(jù)格式和類型,這對(duì)新聞媒體的技術(shù)團(tuán)隊(duì)提出了更高的要求。此外,由于新聞媒體往往需要將數(shù)據(jù)集成到自己的系統(tǒng)中,因此還需要技術(shù)人員具備系統(tǒng)集成和開發(fā)能力。
4. 大數(shù)據(jù)技術(shù)在新聞媒體行業(yè)中面臨的實(shí)施策略
4.1 數(shù)據(jù)安全與隱私保護(hù)
數(shù)據(jù)安全和隱私保護(hù)是大數(shù)據(jù)應(yīng)用過程中的重要問題,特別是對(duì)于新聞媒體這樣具有廣泛社會(huì)影響力和大量個(gè)人數(shù)據(jù)的行業(yè)來說更為關(guān)鍵。因此,新聞媒體需要制定和實(shí)施一系列的數(shù)據(jù)安全和隱私保護(hù)策略,以確保個(gè)人隱私和信息安全得到充分保護(hù)。這些策略包括建立完善的數(shù)據(jù)訪問權(quán)限管理、加強(qiáng)對(duì)個(gè)人數(shù)據(jù)的加密和匿名化處理、制定數(shù)據(jù)收集和使用規(guī)范、加強(qiáng)對(duì)數(shù)據(jù)存儲(chǔ)和傳輸?shù)陌踩O(jiān)管等。除此之外,新聞媒體還需要加強(qiáng)員工的數(shù)據(jù)安全意識(shí)培訓(xùn),強(qiáng)化技術(shù)人員的安全素質(zhì)和技能,以及不斷跟進(jìn)數(shù)據(jù)安全和隱私保護(hù)的最新技術(shù)和法規(guī)要求。只有這樣,新聞媒體才能真正利用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),同時(shí)確保個(gè)人隱私和信息安全得到全面保護(hù)。
4.2 數(shù)據(jù)質(zhì)量保障
在大數(shù)據(jù)時(shí)代,新聞媒體面對(duì)的數(shù)據(jù)規(guī)模和數(shù)據(jù)質(zhì)量的挑戰(zhàn)越來越大。為確保新聞報(bào)道的準(zhǔn)確性和可信度,需要制定有效的數(shù)據(jù)質(zhì)量保障策略。首先,新聞媒體需要對(duì)數(shù)據(jù)進(jìn)行清洗和去重,過濾掉冗余和無效數(shù)據(jù),確保數(shù)據(jù)質(zhì)量的準(zhǔn)確性和一致性。其次,需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將不同來源、不同格式的數(shù)據(jù)整合成標(biāo)準(zhǔn)化的數(shù)據(jù)格式,以方便后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘。此外,新聞媒體還需要建立數(shù)據(jù)質(zhì)量評(píng)估機(jī)制,通過數(shù)據(jù)質(zhì)量的評(píng)估來確保數(shù)據(jù)的可靠性和準(zhǔn)確性。只有建立了有效的數(shù)據(jù)質(zhì)量保障策略,才能更好地利用大數(shù)據(jù)技術(shù)為新聞報(bào)道服務(wù)。
4.3 數(shù)據(jù)分析與挖掘能力
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展和應(yīng)用,新聞媒體對(duì)技術(shù)人員的能力和素質(zhì)提出了更高的要求。為了更好地應(yīng)用大數(shù)據(jù)技術(shù),新聞媒體需要培養(yǎng)和提升技術(shù)人員的數(shù)據(jù)分析和挖掘能力,這可以通過提供相關(guān)的培訓(xùn)、課程和工作經(jīng)驗(yàn)來實(shí)現(xiàn)。此外,新聞媒體還可以聘請(qǐng)專業(yè)的數(shù)據(jù)分析人員或外包數(shù)據(jù)分析服務(wù),以解決技術(shù)人員能力不足的問題。培養(yǎng)和提升技術(shù)人員的數(shù)據(jù)分析和挖掘能力是新聞媒體應(yīng)對(duì)大數(shù)據(jù)時(shí)代的重要舉措,這不僅有助于發(fā)現(xiàn)數(shù)據(jù)中的價(jià)值和洞察,還有助于提高新聞報(bào)道的質(zhì)量和競(jìng)爭(zhēng)力。
4.4 建設(shè)高效的數(shù)據(jù)中心
在大數(shù)據(jù)技術(shù)的應(yīng)用中,數(shù)據(jù)中心是至關(guān)重要的基礎(chǔ)設(shè)施之一,它不僅僅是數(shù)據(jù)的存儲(chǔ)和處理中心,還需要提供高速的數(shù)據(jù)傳輸、備份和恢復(fù)等功能,因此需要投入大量的資源來建設(shè)和維護(hù)。新聞媒體可以通過云計(jì)算等技術(shù),將數(shù)據(jù)中心外包給專業(yè)的云服務(wù)提供商,以節(jié)省資源和成本,同時(shí)獲得更高效的數(shù)據(jù)存儲(chǔ)和處理能力。此外,新聞媒體也可以采用分布式存儲(chǔ)和計(jì)算技術(shù),將數(shù)據(jù)分散存儲(chǔ)在多臺(tái)服務(wù)器上,以提高數(shù)據(jù)的可靠性和安全性,同時(shí)也能夠更好地應(yīng)對(duì)數(shù)據(jù)規(guī)模的快速增長(zhǎng)。建設(shè)高效的數(shù)據(jù)中心是大數(shù)據(jù)技術(shù)應(yīng)用的前提,需要在資金和技術(shù)上進(jìn)行全面考慮和規(guī)劃。
4.5 數(shù)據(jù)可視化與交互應(yīng)用
數(shù)據(jù)可視化和交互應(yīng)用技術(shù)是大數(shù)據(jù)技術(shù)的重要應(yīng)用之一,通過使用圖表、地圖、詞云等視覺化工具,可以將復(fù)雜的數(shù)據(jù)和信息以更生動(dòng)、直觀的形式呈現(xiàn)出來,更容易被讀者理解和接受。這對(duì)于新聞媒體來說非常重要,因?yàn)樗梢蕴岣咝侣剤?bào)道的吸引力和可讀性。同時(shí),交互應(yīng)用技術(shù)可以讓用戶更主動(dòng)地參與到數(shù)據(jù)的探索和分析中來,使讀者更深入地了解數(shù)據(jù)所包含的信息和價(jià)值。因此,新聞媒體需要不斷地發(fā)掘和利用數(shù)據(jù)可視化和交互應(yīng)用技術(shù),以提升新聞報(bào)道的品質(zhì)和價(jià)值。
5. 結(jié)束語
大數(shù)據(jù)技術(shù)的快速發(fā)展,為新聞媒體行業(yè)帶來了巨大的機(jī)遇和挑戰(zhàn)。新聞媒體可以通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)智能寫作、數(shù)據(jù)驅(qū)動(dòng)、新聞監(jiān)測(cè)和商業(yè)模式創(chuàng)新,提高新聞報(bào)道的質(zhì)量和效率,增強(qiáng)新聞媒體的競(jìng)爭(zhēng)力和影響力。但同時(shí),也需要注意隱私保護(hù)、數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量和技術(shù)壁壘等方面的問題,采取有效的措施和策略,克服這些挑戰(zhàn)和問題,實(shí)現(xiàn)大數(shù)據(jù)技術(shù)與新聞媒體行業(yè)的有機(jī)結(jié)合,為更好地服務(wù)讀者和社會(huì)作出貢獻(xiàn)。
參考文獻(xiàn):
[1]黃文軍.大數(shù)據(jù)背景下新聞傳播要素的變革研究[J].新聞文化建設(shè),2022(05):166-168.
[2]隋欣.試論大數(shù)據(jù)時(shí)代新聞媒體創(chuàng)新發(fā)展[J].西部廣播電視,2019(13):63-64.
[3]王維振. 媒介智能化對(duì)新聞傳播主體的影響[D].山東師范大學(xué),2019.
[4]陳國(guó)富.探析大數(shù)據(jù)時(shí)代對(duì)新聞傳播的影響[J].傳播力研究,2018,2(34):45.
[5]孫偉.大數(shù)據(jù)時(shí)代新聞傳播的變革、困境與對(duì)策[J].傳播與版權(quán),2018(07):5-6,9.
[6]拜宇.大數(shù)據(jù)驅(qū)動(dòng)下的新聞業(yè)新發(fā)展[J].西部廣播電視,2017(14):10.
[7]史文雄.大數(shù)據(jù)帶給新聞業(yè)的變化與挑戰(zhàn)[J].采寫編,2017(03):63-64.