媒資系統(tǒng)云端賦能升級的探索與實踐

2022-12-16 05:37:54馬曉春

西部廣播電視 2022年22期

馬曉春

（作者單位：江蘇省南通市通州區(qū)融媒體中心）

所謂賦能升級就是采用“本地+云端”的協(xié)同生產(chǎn)模式，在有效降低本地系統(tǒng)升級投入的同時，通過業(yè)務(wù)協(xié)同賦能方式，實現(xiàn)云端平臺業(yè)務(wù)功能在本地系統(tǒng)中的實際應(yīng)用，從而達到本地系統(tǒng)功能升級的目的。

近年來，隨著廣播電視事業(yè)的發(fā)展，媒資系統(tǒng)成為廣播電視行業(yè)的標(biāo)準(zhǔn)配置。但是縣級傳統(tǒng)媒資系統(tǒng)大部分都是歸檔型系統(tǒng)，主要用于解決節(jié)目素材的存儲和保護問題，普遍存在融合生產(chǎn)功能不完善的缺點。同時，受各種條件的限制，系統(tǒng)建設(shè)和后續(xù)的升級改造都難以實現(xiàn)類似人工智能（Artificial Intelligence，AI）等高級功能，影響了融媒體時代內(nèi)容的管理和節(jié)目的生產(chǎn)。為有效解決上述問題，通州區(qū)融媒體中心與江蘇省廣播電視總臺聯(lián)手，通過平臺的互聯(lián)對接和賦能應(yīng)用系統(tǒng)的開發(fā)，成功實現(xiàn)了荔枝云省運營平臺融合生產(chǎn)業(yè)務(wù)功能在通州媒資系統(tǒng)的本地化應(yīng)用[1]。

1 傳統(tǒng)媒資系統(tǒng)的弊端

1.1 編目質(zhì)量難以控制

所謂編目就是對音視頻資源中的代表性特征信息進行提取和整理，抽取關(guān)鍵幀，劃分層次，確定相關(guān)著錄項。編目質(zhì)量的好與壞，直接影響到節(jié)目的后期再利用。傳統(tǒng)媒資系統(tǒng)主要依賴人工方式通過主觀判斷來完成內(nèi)容主題的分離和描述，因此，系統(tǒng)受人為因素影響較大，得到的編目信息無法全面客觀地展現(xiàn)素材的內(nèi)容和特征，以致編目質(zhì)量不高，難以得到有效控制。這是傳統(tǒng)媒資在智能化環(huán)節(jié)上的一個主要難點。

1.2 審核容易出現(xiàn)差錯

作為海量內(nèi)容存儲中心的媒資系統(tǒng)，節(jié)目與素材的審核是極為重要的任務(wù)環(huán)節(jié)，主要包括敏感人物、敏感詞語以及插播廣告、掛角內(nèi)容的審核等。傳統(tǒng)媒資的審核工作主要由人工完成，面對龐大、密集、冗雜的內(nèi)容信息，審核人員的主觀判斷難免會出現(xiàn)偏差，極易導(dǎo)致漏審和差錯。

1.3 檢索效率偏低

受人工編目方式的制約，著錄級別較高，檢索深度和維度偏低，可用的檢索手段不多，導(dǎo)致無法高效地提取節(jié)目內(nèi)容的特征信息。

1.4 功能不完善

由于傳統(tǒng)媒資系統(tǒng)主要用于解決節(jié)目、素材的保存問題，因此，對系統(tǒng)的功能要求相對簡單，尤其是縣級媒資系統(tǒng)，基本上不具備后期的融合生產(chǎn)能力，更沒有類似人工智能的先進功能，只能提供最基本的存儲、查找和再利用功能，媒資系統(tǒng)的綜合服務(wù)效能不高。

2 賦能升級思路和系統(tǒng)設(shè)計

2.1 總體方案

通過賦能系統(tǒng)的開發(fā)和應(yīng)用，建立“本地+云端”的協(xié)同生產(chǎn)模式。應(yīng)用微服務(wù)、分布式等技術(shù)，為通州區(qū)融媒體中心打造一個持續(xù)發(fā)展的媒體資產(chǎn)管理系統(tǒng)；逐步引入基于媒資的生產(chǎn)工具，實現(xiàn)所見即所得的資料調(diào)用，助力通州媒資系統(tǒng)由單純的存儲型媒資向生產(chǎn)型媒資轉(zhuǎn)型；提升融合媒體生產(chǎn)能力，賦予通州區(qū)融媒體中心融合媒體生產(chǎn)工具集、短視頻快編工具、視頻編輯工具等；實現(xiàn)人工智能本地化賦能，促進通州媒資的融合發(fā)展。通過此模式，在降低本地端平臺建設(shè)改造成本的同時，以先進的框架、開放的模式、統(tǒng)一的思想、多重的能力、多樣的服務(wù)，賦予通州區(qū)融媒體中心豐富的融合業(yè)務(wù)能力，推動通州傳統(tǒng)媒資系統(tǒng)的轉(zhuǎn)型升級。

2.2 具體對接設(shè)計

通州區(qū)融媒體中心本地媒資平臺與荔枝云省運營平臺互聯(lián)，依靠省平臺提供的技術(shù)支持，促進內(nèi)容、生產(chǎn)、媒體處理等業(yè)務(wù)的協(xié)同。為實現(xiàn)業(yè)務(wù)和管理的便捷化，系統(tǒng)具有多用戶功能，包括內(nèi)容管理、應(yīng)用管理、用戶管理等功能，便于實現(xiàn)門戶統(tǒng)一集中管理。聯(lián)網(wǎng)對接模式如圖1所示。

圖1 通州區(qū)融媒體中心與荔枝云省運營平臺互聯(lián)示意圖

2.3 云端協(xié)同交互流程

具體云端賦能流程如下：一是通州區(qū)融媒體中心本地媒資系統(tǒng)素材入庫，入庫素材為原碼素材；二是通州區(qū)融媒體中心本地媒資系統(tǒng)對原碼素材進行轉(zhuǎn)碼，將內(nèi)容轉(zhuǎn)為低碼素材；三是通州區(qū)融媒體中心通過本地安全網(wǎng)絡(luò)互聯(lián)專有鏈路，將本地媒資系統(tǒng)中的低碼素材自動上傳至省運營平臺的內(nèi)容管理系統(tǒng)中；四是荔枝云省運營平臺啟動智能服務(wù)，調(diào)用人工智能功能，包括關(guān)鍵詞分析、人臉識別、鏡頭語言識別等；五是通過人工智能功能的調(diào)用，對上傳至荔枝云省運營平臺的低碼素材進行分析，并形成數(shù)據(jù)標(biāo)簽；六是智能數(shù)據(jù)標(biāo)簽通過安全網(wǎng)絡(luò)互聯(lián)專有鏈路，傳輸至通州區(qū)融媒體中心本地媒資系統(tǒng)中，并綁定原碼素材，形成最終的媒資內(nèi)容業(yè)務(wù)數(shù)據(jù)。云端賦能流程如圖2所示。

圖2 云端賦能流程圖

3 業(yè)務(wù)協(xié)同本地化應(yīng)用場景分析

根據(jù)系統(tǒng)設(shè)計思路，荔枝云省運營平臺可為通州區(qū)融媒體中心提供媒體能力協(xié)同、媒體內(nèi)容協(xié)同和應(yīng)用產(chǎn)品協(xié)同等方面的服務(wù)。通州區(qū)融媒體中心可以根據(jù)實際業(yè)務(wù)需要，進行開通和使用。

3.1 媒體能力協(xié)同

媒體能力協(xié)同為通州區(qū)融媒體中心提供云端媒體處理應(yīng)用程序編程接口（Application Programming Interface，API）服務(wù)，包括AI智能分析（語音識別、人像識別、文字識別等）、云端轉(zhuǎn)碼、大數(shù)據(jù)分析等應(yīng)用，通州區(qū)融媒體中心無須購買昂貴的本地引擎，根據(jù)實際的使用需要，調(diào)用荔枝云省運營平臺提供的各種API接口，實現(xiàn)對本地端媒體文件的多元化處理，基于云端媒體能力協(xié)同系統(tǒng)返回數(shù)據(jù)進行本地化應(yīng)用，從而以低成本實現(xiàn)多種媒體能力的集成。

第一，鏡頭語言識別（見圖3）。在視頻拍攝過程中，拍攝者會根據(jù)自己的意圖去尋找、組織畫面，利用鏡頭為觀眾呈現(xiàn)所要講述故事，觀眾可以透過鏡頭畫面了解體會拍攝者所要表達的意思，這就是鏡頭語言。鏡頭語言識別基于視頻深度學(xué)習(xí)技術(shù)，對新聞視頻內(nèi)容進行智能分析，得到鏡頭運動、拍攝角度、景別、畫面屬性等鏡頭語言結(jié)果。

圖3 鏡頭語言識別

第二，命名實體識別。命名實體識別又稱作“專名識別”，是信息提取、問答系統(tǒng)、句法分析、機器翻譯、面向元數(shù)據(jù)標(biāo)注等應(yīng)用領(lǐng)域的重要基礎(chǔ)工具，是自然語言處理（Natural Language Processing，NLP）任務(wù)中最為基礎(chǔ)和常用的任務(wù)之一，也是支持內(nèi)容標(biāo)簽庫的主要技術(shù)手段，是眾多NLP任務(wù)的分析基礎(chǔ)。命名實體識別（Named Entity Recognition，NER）目前可識別出實體類型包含人名、地名、時間、職務(wù)、組織機構(gòu)名稱等。

第三，關(guān)鍵詞提取。關(guān)鍵詞提取是從較長的文本中，選出可以表達最重要信息的詞語或短語，提高信息獲取效率，減少閱讀耗時，是輔助閱讀和編輯的重要內(nèi)容。關(guān)鍵詞提取算法基于深度文本理解技術(shù)，對文本中各個詞語的重要性進行計算，提取能代表人腦記憶快照的關(guān)鍵詞，支持用戶對文本的快速理解和語義檢索。

第四，詞向量。基于深度學(xué)習(xí)技術(shù)，通過文本向量化處理，建立詞向量表示模型，便于用戶快速準(zhǔn)確挖掘理解語義。在當(dāng)前“萬物皆可embedding”（embedding即“嵌入”）的思想領(lǐng)導(dǎo)下，詞向量既是NLP 領(lǐng)域中一個非常基礎(chǔ)的工具，也是推薦、廣告等業(yè)務(wù)場景中用于召回和排序等階段的簡單且實用的有力手段，主要用于語義相似度度量等。

第五，新聞文本分類。新聞文本分類采用編目規(guī)范的分類體系，輸出文章的一級主題、二級主題和三級主題，如政治、軍事、體育、科學(xué)技術(shù)、法律、休閑娛樂、公安工作、政府工作、外國軍事、球類運動等。該分類體系更適合專業(yè)領(lǐng)域的理解與使用，有助于相關(guān)資料的收錄與存檔。

第六，新聞?wù)崛?。新聞?wù)δ芑谏疃葘W(xué)習(xí)技術(shù)，從較長的新聞文本中，自動抽取關(guān)鍵信息，形成簡明的摘要結(jié)果，幫助用戶快速理解文本主要內(nèi)容并應(yīng)用于內(nèi)容分發(fā)、智能寫作等多種應(yīng)用場景，是智能媒體等行業(yè)必備的AI能力之一。

第七，視頻內(nèi)容綜合分析。智能視頻內(nèi)容綜合分析是基于計算機視覺、自然語言處理、知識圖譜等AI技術(shù)多維度處理的一款專業(yè)提取視頻標(biāo)簽的產(chǎn)品，能夠為用戶提供音視頻綜合分析服務(wù)。通過多種AI人工智能基礎(chǔ)識別能力，把得到的基礎(chǔ)數(shù)據(jù)通過自然語言處理、專業(yè)領(lǐng)域知識圖譜等融合推理，輸出對應(yīng)視頻的人物、場景、實體和關(guān)鍵詞等具有結(jié)構(gòu)化的標(biāo)簽，供用戶搜索或者后期制作使用。視頻內(nèi)容綜合分析包括以下四個方面：一是視頻人物識別。由于傳統(tǒng)媒資系統(tǒng)不具備智能化視頻人物識別能力，只能依靠人工方式來完成視頻人物監(jiān)管，存在工作任務(wù)重、效率低下的弊端。同時，受審核人員能力水平和精力狀態(tài)等因素的影響，有可能出現(xiàn)審核遺漏和主觀判斷偏差導(dǎo)致的錯誤，造成安全播出事故。使用人臉識別技術(shù)，可以最大限度避免人工標(biāo)注任務(wù)時，因人為因素造成的錯誤情況的發(fā)生。在展現(xiàn)的界面上，可以根據(jù)時間軸上展現(xiàn)的信息，對視頻中的指定人物進行更加快速準(zhǔn)確的定位監(jiān)管。荔枝云省運營平臺賦予的視頻人物識別能力，可以幫助我們快速地獲取圖像的關(guān)鍵幀，經(jīng)過預(yù)處理計算，生成圖像模式向量和特征值，從而獲得圖像的底層視角語義信息。通過人臉識別技術(shù)和豐富全面的人物庫，識別視頻中的重要人物或敏感人物等，并與篩選的結(jié)果進行比較判斷，采取相應(yīng)的處理方式。人臉識別人物庫可由用戶自定義來保證系統(tǒng)的廣泛適用性[2]。二是視頻語音識別。視頻語音識別技術(shù)是基于統(tǒng)計模式識別的基本理論，通過機器對視頻語音內(nèi)容的學(xué)習(xí)和理解，獲得語音信號對應(yīng)文本的功能。一個完整的語音識別系統(tǒng)大致包括語音特征提取、識別算法、語義理解、語言模型等幾個方面。荔枝云省運營平臺視頻語音識別系統(tǒng)就是基于語音轉(zhuǎn)寫技術(shù)，把視頻中語音內(nèi)容轉(zhuǎn)化為文本信息供融合推理使用[3]。三是實體識別。在NLP中通常所說的實體指的是人名、地名、機構(gòu)名，在新聞領(lǐng)域，人們希望了解突發(fā)事件的主體，比如人物、地點、機構(gòu)等。從識別步驟來看可分為兩步：第一步識別出實體詞邊界，也就是實體的開始和結(jié)束位置；第二步識別出實體的類型，也就是事件所描述和涉及的人名、地名、機構(gòu)名等具體的實體類型。通過實體識別算法從自動語音識別（Automatic Speech Recognition，ASR）或光學(xué)字符識別（Optical Character Recognition，OCR）文本中獲取人名、地名、機構(gòu)名。四是標(biāo)簽提取。內(nèi)容標(biāo)簽是對文本、圖文、視頻等內(nèi)容以關(guān)鍵詞或者短語形式進行的特征描述。例如，在文本內(nèi)容中標(biāo)簽常常使用關(guān)鍵詞抽取技術(shù)，提取出該文本置信度最高的關(guān)鍵詞，用以表征該文本內(nèi)容。項目中標(biāo)簽提取功能，就是通過自然語言處理和知識圖譜融合推理后，提取出視頻中有效的結(jié)構(gòu)化標(biāo)簽。

第八，文字識別。圖像處理技術(shù)是目前人工智能發(fā)展最為普遍的領(lǐng)域。在視頻領(lǐng)域積累和沉淀了大量的圖像數(shù)據(jù)，依托著豐富的“場景+數(shù)據(jù)+算法”，克服背景復(fù)雜、藝術(shù)字體、分辨率低、非均勻光照、圖像退化、字符形變、多語言混合、文本行復(fù)雜版式、檢測框字符殘缺等困難。荔枝云省運營平臺為通州區(qū)融媒體中心提供一套準(zhǔn)確率高，識別速度快，魯棒性強的OCR識別算法，并提供相應(yīng)的云服務(wù)。

第九，智能化編目。應(yīng)用云端人工智能識別和自然語言處理技術(shù)，可以對音視頻素材進行更為詳盡而系統(tǒng)的著錄編目，這是媒資系統(tǒng)智能化的重要標(biāo)志之一。應(yīng)用荔枝云省運營平臺賦予的能力，對音視頻文件進行AI人工智能分析，通過內(nèi)容結(jié)構(gòu)化處理，得出人像信息、語音轉(zhuǎn)文本及智能鏡頭拆條等結(jié)果，從微觀角度對視音頻內(nèi)容進行編目描述，將所有標(biāo)簽結(jié)果與內(nèi)容的關(guān)鍵碼相關(guān)聯(lián)，相較傳統(tǒng)編目方式更加細(xì)致精準(zhǔn)。主要工具有人像信息編目、語音信息編目、基本信息編目等。除此之外，我們還可基于AI人工智能服務(wù)，根據(jù)業(yè)務(wù)需要靈活定制其他信息編目方式[4]。

3.2 媒體內(nèi)容協(xié)同

荔枝云省運營平臺媒體內(nèi)容協(xié)調(diào)單元為通州區(qū)融媒體中心媒資系統(tǒng)提供海量媒體內(nèi)容服務(wù)，包括互聯(lián)網(wǎng)聚合內(nèi)容、省平臺共享內(nèi)容、云端收錄內(nèi)容、云端備份內(nèi)容等。通州區(qū)融媒體中心可對云端內(nèi)容進行選擇使用。支持在本地上載、非編等工具中對云端素材直接拖拽上時間線進行天地混編；支持云端與本地內(nèi)容庫的統(tǒng)一瀏覽；支持云端跟本地內(nèi)容交互和共享，互為備份[5]。

3.3 應(yīng)用產(chǎn)品協(xié)同

實現(xiàn)了開放式的應(yīng)用集成框架，支持開發(fā)/運維一體化管理，各類軟件即服務(wù)（Software-as-a-Service，SaaS）工具/服務(wù)基于應(yīng)用協(xié)同單元規(guī)范均可以掛接到應(yīng)用協(xié)同單元上統(tǒng)一運營，從而為通州區(qū)融媒體中心提供豐富的云端媒體SaaS應(yīng)用服務(wù)（線索服務(wù)、輿情服務(wù)、視頻編輯、稿件編輯、內(nèi)容分發(fā)等）。通州區(qū)融媒體中心可按需開通，通過瀏覽器/服務(wù)器（Brower/Server，B/S）方式使用云端數(shù)據(jù)、工具及其他服務(wù)，從而彌補本地端業(yè)務(wù)能力的不足，實現(xiàn)融合生產(chǎn)、協(xié)同管理。

一是線索服務(wù)。通過大數(shù)據(jù)技術(shù)，對網(wǎng)站、微信、微博、手機應(yīng)用程序（Application，App）等共計2000多個數(shù)據(jù)源進行訂閱，每日采集50 000余條互聯(lián)網(wǎng)信息，為通州區(qū)融媒體中心采編人員提供海量的互聯(lián)網(wǎng)線索。

二是輿情服務(wù)。通過人工智能技術(shù)，設(shè)置敏感詞匯或監(jiān)控內(nèi)容主題，對通州相關(guān)微信、微博和客戶端的信息數(shù)據(jù)進行監(jiān)控。例如，監(jiān)控發(fā)現(xiàn)敏感內(nèi)容，及時告警，并全面分析研判，予以有效處置。

4 結(jié)語

通州媒資系統(tǒng)賦能升級的實踐，是媒體融合時代多平臺業(yè)務(wù)協(xié)同的一次有益探索與嘗試，在無須增加通州本地系統(tǒng)升級投入的前提下，荔枝云省運營平臺通過賦能模式，在智能化編目、人工智能技術(shù)應(yīng)用、資源共享等多個方面，賦予了通州區(qū)融媒體中心媒資系統(tǒng)更多的融合生產(chǎn)功能，推動了通州媒資由歸檔型系統(tǒng)向融合生產(chǎn)型系統(tǒng)的轉(zhuǎn)型升級。系統(tǒng)自2020年投入使用以來，各項前期目標(biāo)均得到了實現(xiàn)，達到了滿意的預(yù)期效果。隨著媒體平臺協(xié)同能力的提高，賦能升級技術(shù)必將得到更大范圍的推廣應(yīng)用，通州項目的探索與實踐也為賦能升級技術(shù)的應(yīng)用推廣提供了可以借鑒的成功案例。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡