申妙芳
摘要:隨著網絡技術的不斷發(fā)展以及計算機硬件設備的不斷更新,當前計算機信息處理技術也已經正式邁入大數據時代。處在大數據時代背景下,將為計算機信息處理技術的發(fā)展設定更為嚴苛的標準。本文首先分析了計算機信息處理技術處于“大數據”時代背景下所面臨的機遇和挑戰(zhàn),繼而提出了若干有效應用計算機信息處理技術的途徑,同時設計了一套改進后的垂直搜索引擎,以供參考。
Abstract: With the continuous development of network technology and the continuous updating of computer hardware devices, the current computer information processing technology has officially entered the era of big data. In the context of the era of big data, it will set more stringent standards for the development of computer information processing technology. This paper first analyzes the opportunities and challenges faced by computer information processing technology in the context of "big data" era, and then proposes several ways to effectively apply computer information processing technology, and designs an improved vertical search engine for reference.
關鍵詞:大數據;計算機;信息處理技術;垂直搜索引擎;信息安全;數據挖掘;云計算
Key words: big data;computer;information processing technology;vertical search engine;information security;data mining;cloud computing
中圖分類號:TP274 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2019)10-0164-03
0 ?引言
計算機在全球領域的廣泛應用,大幅度提升了信息數據的整體數量,為信息處理工作的順利開展帶來了很大阻礙和困難,因此發(fā)展并有效應用信息處理技術的關鍵在于高效處理大數據[1]。每個企業(yè)日常工作的重要組成部分包含了對數據的處理工作,因此為有效促使信息數據處理工作效率的提升,就十分有必要保證計算機信息處理能力的有效提升,為合理、科學應用各種信息數據提供良好的保障。因此,在開展計算機信息處理創(chuàng)新工作的過程中,需要將更大、更多的人力、物力以及精力投入其中,以有效解決因數據總量不斷增長而產生的諸多問題[2]。
1 ?計算機信息處理技術處于“大數據”時代背景下所面臨的機遇和挑戰(zhàn)
1.1 面臨的機遇
大數據時代的到來有效的解決了企業(yè)在常規(guī)模式下不能合理化、科學化讀取以及管理大量數據的難題,同時解決了無法有效發(fā)掘數據規(guī)律并以最高效能發(fā)揮出數據信息作用的問題[3]。通過準確分析大量數據,借此促使企業(yè)管理人員工作效率的不斷提高,并科學合理的對產生的不同問題加以解決,從而推動企業(yè)的不斷向前發(fā)展。大數據時代背景下,企業(yè)充分整合各項高新技術并加以有效利用,同時將計算機技術、信息傳播技術以及通訊技術各自優(yōu)勢充分發(fā)揮出來[4]。而云服務隨著時代的向前發(fā)展,已經普及到了人們的日常生活以及企業(yè)的日常管理之中,云計算有效集中整個數據資料,通過相應的平臺交換數據信息,為人們的日常生活以及企業(yè)的日常管理提供了越來越多的便利條件。云計算技術的飛速發(fā)展,如果將其同計算機信息處理技術有效的結合在一起,對企業(yè)的深入發(fā)展無疑是有助益良多的。
1.2 面臨的挑戰(zhàn)
大數據時代背景下,計算機信息處理技術的發(fā)展和有效應用所面臨的挑戰(zhàn)以幾下幾點最為突出:其一,分析以及處理信息數據所要求的標準更高。大數據時代最突出的特征之一是信息爆炸,處理數據信息的工作量驟然增大,這不僅對工作者來說是一個挑戰(zhàn),同時對使用者來說也是如此,怎樣有效處理、匯總以及甄別各種信息數據,怎樣將數據信息有效轉化為有用的建議或者決策,這些都是目前迫切需要解決的難題;其二,在大數據時代背景下所面臨的數據信息安全問題更為迫切,怎樣將更加優(yōu)化完善的安全屏障設計出來,并將其提供于對核心信息的保護也是面臨的又一重大挑戰(zhàn)。大數據時代信息安全戰(zhàn)爭在很大程度上取代了政治、經濟等領域的傳統(tǒng)競爭模式。人們往往會利用虛擬的數據庫來儲存種類不一的重要信息,互聯網增加了數據交換便捷性的同時,信息安全同樣也面臨著想當的安全威脅,當收到病毒攻擊或者黑客入侵時,信息安全往往成為了影響企業(yè)生存發(fā)展的關鍵問題[5]。近年間我國的計算機技術取得了卓有成效的發(fā)展,誕生了眾多的自主研發(fā)能力突出的信息企業(yè),同時越來越多的有志青年投身到了計算機領域中。但是不得不說,目前依然缺乏前瞻型、創(chuàng)新型的核心技術人才,這也是制約計算機信息處理技術快速高效發(fā)展的重要挑戰(zhàn)之一。
2 ?改進后的垂直搜索引擎模型設計
2.1 模型概述
在現有模型基礎上改進的垂直搜索引擎模型,融合了用戶要求以及其相應特點,更加深入的對檢索數據加以處理。首先是結構化處理非結構化數據,其次是分為不同的等級處理結構化數據,同時將更為專業(yè)、全面的詞匯添加到專用領域詞典。在網頁抽取模塊運行過程中先基本處理一次數據,直接將有用的數據存儲起來,然后進一步抽取沒有被爬取的信息,促使檢索數據的有效性和全面性得以進一步提升。
2.2 模型分析
主要的改進方案是將二次處理模塊增加到原有模型上(見圖1和圖2),結構化處理信息數據是二次處理模塊的主要功能,包含分類及去重數據,通過對該模塊的應用提升搜索及排序結果的準確度。
定向爬取模塊在采集信息的過程中應用了爬蟲爬取技術,繼而在網頁信息抽取模塊上傳所爬取的信息。網頁信息抽取模塊采用的網絡抽取技術是可管理的、實時聚焦的專業(yè)技術,并在數據庫中存入所抽取的元數據,最終達到更具價值性和針對性的信息抽取目的。該模塊的重點在于分詞模塊和二次處理,數據調整以及模式分離已經存入的網頁信息,分析相關鏈接,在結構化數據的基礎上,進一步對網頁信息加工處理(分類、去重)。將二次處理的信息提供給客戶以實現特定服務,并按照用戶要求將搜索結果成功的反饋給用戶。二次處理結果在很大程度上提高了合法、有效數據的索引和相關性排序,以最為直接的途徑促使檢索結果準確性的有效提高。
比如,在搜索識別人名的時候,會因為高頻字問題出現識別人名困難的情況,對切分準確度造成影響。中文名一般由姓、名、前綴或者后綴組成,組合方式為姓+名、前綴+姓、姓+后綴以及姓+姓+名等。相關統(tǒng)計顯示,漢語姓氏的用字相對更為集中,總數量在1000個左右,更為穩(wěn)定?!巴酢毙帐瞧渲惺褂妙l率最高的姓氏,“王、劉、張、李、陳”五大姓氏達到了32%的覆蓋率,前14個覆蓋率達到了50%左右,前400個則為99%左右。另外,中文名的用字也相對集中,前10個使用頻率最高的字其覆蓋率在14.936%左右,前400個則達到了90%以上。中文名從統(tǒng)計學角度分析是具有顯著規(guī)律性的,利用分詞模塊和二次處理構建人名識別機制,能夠更加準確的進行識別。
3 ?大數據時代背景下計算機信息處理技術有效應用的途徑
3.1 推動計算機網絡逐漸向云計算網絡演進
大數據時代背景下計算機信息處理技術得以有效應用的必然途徑之一就是將計算機網絡與云計算網絡緊密結合在一起,將兩者整合后的作用充分發(fā)揮出來。其中對于計算機硬件設備的不斷更新是保證網絡發(fā)展的前提和保障,隨著高新電子科技的不斷革新和完善,計算機硬件設備的更迭也要與時俱進,否則將難以應對時代發(fā)展的需求,因此也就不能為計算機網絡迅速發(fā)展提供可靠保障。在當前大數據時代背景下,傳統(tǒng)的靠硬件更新來促使計算機網絡的發(fā)展,已然無法滿足其快速發(fā)展的需求,因此,出現了眾多難以解決的問題[6]。而云計算的產生在根本上有效的滿足了網絡發(fā)展的需求,云計算的產生也促成了開放式網絡模式的建立,大眾對于網絡的使用擺脫了網絡中心的局限,云計算的靈活性和開放性更強,并以其自有優(yōu)勢逐漸發(fā)展衍生出了互聯網模式,云計算具備運轉高速以及儲存能力出眾的特點,因而初始信息處理速率得以大大提升。
3.2 對數據挖掘技術加以大力發(fā)展
隨著大數據技術的不斷應用和完善,更多的數據信息經由大數據技術匯集到一起,不同數據之間往往存在著某些內在聯系,對客戶的需求能夠真正有效的加以反應,但是,有部分數據屬于冗余數據的范疇,不被企業(yè)所真正需要,如何在這樣龐大的數據流中將真正的企業(yè)所需的數據找出來,就需要通過對數據挖掘技術的合理應用。該技術指的是利用綜合性的技術對信息加以分析、加工等處理,找到不同數據之間存在的內部聯系,從而將對企業(yè)發(fā)展有用的信息篩選出來。對數據挖掘技術進行大力發(fā)展和優(yōu)化,不光有助于企業(yè)更高效、迅速的將所需數據信息整理出來,同時更加有助于節(jié)約企業(yè)搜索和處理信息的成本,可謂是一舉兩得。
3.3 大力發(fā)展信息安全技術,為信息安全保駕護航
互聯網的首要屬性是開放性,當大眾通過互聯網進行信息搜索和篩選的過程中,不可避免的會將與自己有關的部分信息暴露出來,而不法分子往往會利用這些漏銅竊取用戶的私人信息或者企業(yè)的關鍵性行業(yè)信息,實施侵害行為,從而為用戶帶來程度不一的經濟損失或者精神壓力,為網絡安全帶來了很大的隱患[7]?;ヂ摼W健康發(fā)展的關鍵所在就是絕對保障其安全性,因此網絡安全問題要引起人們足夠的重視。在大數據時代背景下,以往的信息管理系統(tǒng)很難高效的對網絡應用過程中所出現的海量信息進行整理,因此,想要不斷完善和革新信息管理系統(tǒng),需要不斷開發(fā)更具針對性的管理程序為信息安全提供可靠保障。面對當前花樣繁多的惡意網絡攻擊、計算機病毒入侵以及非法捆綁軟件等的威脅,現代企業(yè)如何有效規(guī)避這些潛在威脅對于保證自身信息安全尤為重要,對于此種情形,勢在必行的途徑就是大力發(fā)展防火墻技術。防火墻是一種結合了計算機軟硬件的綜合技術,通過緊密連接公共網與內外網,搭建出一個具備保護功能的完整屏障。通過對該技術的發(fā)展和應用,對諸多不安全的外界因素加以阻擋,避免種類繁多的病毒以及一些不法人員的非法入侵,同時限制未得到相應授權的外網人員的訪問權限。防火墻構建好之后,所有的信息數據均會經由防火墻的安全監(jiān)測,以此來提升企業(yè)內網安全性,因此,有待提高和大力發(fā)展應用該技術,促使信息處理技術的進一步完善。
3.4 積極發(fā)展計算機存儲技術
處理分析計算機數據需在集中獲取大數據的基礎之上,有效集中收集好工作所需數據之后,計算機經由軟件裝置以及相應硬件設備科學操作處理大數據。收集獲取大數據的過程,同時也是歸類整理大數據的過程。經由計算機的有效整理,才能夠合理調整組合龐大雜亂的數據流,繼而通過符合標準的傳輸協(xié)議,將其上傳到網絡終端或者其他服務器之上。然而,從當前的發(fā)展現狀來看,該技術還遠不能滿足規(guī)模日益擴大的數據流。相關統(tǒng)計顯示,中央處理器運行速率的增長速度以每年70%的速度在增長,而其相應存儲技術知識的發(fā)展增速僅為10%,大數據的發(fā)展因這兩種技術不對稱的增速發(fā)展而受到了很大阻礙[8]。因此,對于計算機存儲技術的發(fā)展要加大投入力度,不斷促使內存容量的增長,才能保障信息處理技術整體的健康發(fā)展。
3.5 引進并培養(yǎng)高端人才
計算機信息處理技術基于大數據時代背景下,獲得了良好的發(fā)展,而在發(fā)展的同時相應的對專業(yè)高端人才的需求量也會大幅度增長。有很多企業(yè)的發(fā)展面臨這樣的窘境,雖然自身是大數據市場的一份子,搭建了各種媒體、網站平臺,但是相應的后期維護工作缺乏必要的人才保障,一旦出現比較復雜的問題自己卻束手無策,只好花更高的代價聘請其他專業(yè)人士加以解決,加大了公司資金的投入。從企業(yè)的長遠發(fā)展看,這種方式無疑是不可取的。缺少專業(yè)人才來維護保障信息處理技術的正常運行,就等于沒有了后勤保障,即使技術再先進也都成了擺設,無法發(fā)揮其更為全面的功能,因此,也不利于企業(yè)市場競爭力的有效提高。那么,對于專業(yè)高端人才的引進和培養(yǎng)就顯得異常重要了,高端人才的引進不光可促使企業(yè)對核心技術的進一步開發(fā)利用,另外,從長遠的戰(zhàn)略發(fā)展層面來看,能夠幫助企業(yè)降本縮能,促使其市場競爭力的提高,以高端技術制高點為依托,促使企業(yè)發(fā)展的經久不衰。
4 ?結束語
大數據是人類科技發(fā)展到一定程度必然出現的產物,因此我們需正視其在發(fā)展過程存在的挑戰(zhàn),抓住良好的發(fā)展機遇,以積極向上的態(tài)度應對挑戰(zhàn),以積極進取和持之以恒的理念把握住機遇。同時不斷實施大力改革,對專業(yè)人才加大力度進行培養(yǎng),推動信息技術的發(fā)展和完善,有效應用計算機信息技術,充分發(fā)揮其核心技術優(yōu)勢。
參考文獻:
[1]高沖.“大數據”時代背景下計算機信息處理技術的分析[J].電腦知識與技術,2016,12(5):23-24.
[2]鄭鑫淼.“大數據”時代背景下計算機信息處理技術的分析[J].科技創(chuàng)新導報,2016(17):72-73.
[3]李君芳,徐小亞.大數據時代背景下計算機信息處理技術分析[J].信息與電腦(理論版),2017(2):45-47.
[4]冷鵬.“大數據”時代背景下計算機信息處理技術分析[J].現代商貿工業(yè),2016,37(33):388-389.
[5]梁丁一.“大數據”時代背景下計算機信息處理技術的分析[J].電子測試,2017(9):117-118.
[6]方海諾.“大數據”時代背景下計算機信息處理技術分析[J].科學中國人,2016(17):1-2.
[7]孫玲.大數據時代的計算機信息處理技術分析[J].科技展望,2016,26(26):48-48.
[8]呂晉俐.大數據時代背景下計算機信息處理技術的分析[J].信息與電腦(理論版),2017(10):179-180.