交通運輸部科學(xué)研究院 張蕊
智能搜索系統(tǒng)是政府網(wǎng)站賦能數(shù)字政府的重要手段,交通運輸部政府網(wǎng)站充分利用智能搜索技術(shù),建立了“交通智搜”系統(tǒng),提供了范圍更廣泛、功能更實用、結(jié)果更準(zhǔn)確的搜索服務(wù)。
2022 年,《國務(wù)院關(guān)于加強數(shù)字政府建設(shè)的指導(dǎo)意見》(國發(fā)〔2022〕14 號)正式印發(fā),《意見》指出:到2035 年,與國家治理體系和治理能力現(xiàn)代化相適應(yīng)的數(shù)字政府體系框架更加成熟完備,整體協(xié)同、敏捷高效、智能精準(zhǔn)、開放透明、公平普惠的數(shù)字政府基本建成,為基本實現(xiàn)社會主義現(xiàn)代化提供有力支撐[1]。
數(shù)字政府建設(shè)需要通過對政府?dāng)?shù)據(jù)進行挖掘、分析、融合、共享、開發(fā)、利用,以消除數(shù)字鴻溝,實現(xiàn)各業(yè)務(wù)領(lǐng)域的互聯(lián)互通、協(xié)同聯(lián)動,促進政府治理革新,推進服務(wù)流程優(yōu)化,而數(shù)字政府的對外展示、對外服務(wù)需要依托政府網(wǎng)站。
黨的十八大以來,在政府網(wǎng)站與政務(wù)新媒體檢查、政府網(wǎng)站績效評估等一系列“以評促建”活動的推動下,政府網(wǎng)站建設(shè)工作取得了積極進展,網(wǎng)站建設(shè)規(guī)范、內(nèi)容豐富詳實、功能便捷完善、互動暢通及時,為數(shù)字政府提供了良好的展現(xiàn)平臺。智能搜索系統(tǒng)的建設(shè),不僅可以精準(zhǔn)定位信息和服務(wù),實現(xiàn)“搜索即服務(wù)”,同時也賦能數(shù)字政府的“敏捷高效、智能精準(zhǔn)”服務(wù)。
近些年,依據(jù)《國務(wù)院辦公廳關(guān)于印發(fā)“互聯(lián)網(wǎng)+政務(wù)服務(wù)”技術(shù)體系建設(shè)指南的通知》(國辦函[2016]108號)和《國務(wù)院辦公廳關(guān)于印發(fā)政府網(wǎng)站發(fā)展指引的通知》(國辦發(fā)[2017]47 號)提出的優(yōu)化政府網(wǎng)站搜索功能,開發(fā)模糊搜索、目錄搜索[2]、拼音轉(zhuǎn)化搜索、通俗語言搜索、服務(wù)事項和辦事指南搜索、關(guān)鍵詞推薦、辦事進度和信件回復(fù)情況查詢、錯別字自動糾正、搜索結(jié)果排序、多維度分類展現(xiàn)、聚合相關(guān)信息和服務(wù)等功能,實現(xiàn)“搜索即服務(wù)”[3]的要求,交通運輸部積極推進智能化搜索系統(tǒng)建設(shè),開展集約化搜索應(yīng)用,本著統(tǒng)一性、實用性、安全性、先進性、規(guī)范性、開放性的原則,不斷升級“交通智搜”系統(tǒng),擴大搜索范圍,提升搜索結(jié)果準(zhǔn)確性,豐富搜索結(jié)果展現(xiàn)形式,使用戶可以方便快捷地在交通運輸部政府網(wǎng)站查找所需信息和服務(wù)內(nèi)容,政府的對外服務(wù)形象得到了顯著提高。
“交通智搜”系統(tǒng)通過構(gòu)建集約化搜索引擎應(yīng)用平臺(如圖1 所示)提供交通運輸行業(yè)政府網(wǎng)站跨站點信息搜索服務(wù),搜索引擎與內(nèi)容管理系統(tǒng)之間通過數(shù)據(jù)接口進行信息數(shù)據(jù)傳遞、維護、更新,網(wǎng)站信息經(jīng)分析、處理后索引進入集約化搜索引擎平臺,保障網(wǎng)站信息與搜索信息的及時同步與一致性。
圖1 交通運輸部集約化智能搜索平臺Fig.1 Intensive intelligent search platform of ministry of transport
目前,“交通智搜”的搜索范圍涵蓋了交通運輸部政府網(wǎng)站群(含門戶網(wǎng)站、子站)的全部信息、辦事服務(wù)和互動服務(wù)內(nèi)容、微信公眾號以及交通運輸部海事局、長江航務(wù)管理局、珠江航務(wù)管理局、直屬海事機構(gòu)和地方交通運輸主管部門的政府信息公開內(nèi)容,實現(xiàn)了全行業(yè)政策信息的一站式搜索。
“交通智搜”系統(tǒng)總體技術(shù)架構(gòu)結(jié)構(gòu)分為:基礎(chǔ)設(shè)施層、信息資源層、接口層、搜索應(yīng)用支撐層和搜索功能層,各層通過相應(yīng)的技術(shù)接口進行參數(shù)與數(shù)據(jù)、命令的傳遞。
信息資源層與搜索應(yīng)用支撐層之間通過XML/Web Service 技術(shù)進行網(wǎng)站信息(包括:ID、更新標(biāo)志、時間、內(nèi)容等)的數(shù)據(jù)傳遞、維護與更新,并完成索引工作,保障搜索信息與發(fā)布信息的及時同步與一致性,更新頻率可以根據(jù)業(yè)務(wù)需要自定義(分鐘、小時)等。
搜索應(yīng)用支撐層與搜索功能層之間通過HTTP/XML技術(shù)進行請求提交與數(shù)據(jù)交換,通過JSON/XML 獲得返回的結(jié)果數(shù)據(jù)并包裝成業(yè)務(wù)結(jié)果返回給用戶。即互聯(lián)網(wǎng)用戶通過門戶網(wǎng)站搜索框提交搜索請求后,搜索條件傳遞到集約化智能搜索應(yīng)用中,搜索應(yīng)用將轉(zhuǎn)化后的請求傳遞到分布式搜索引擎中,通過索引庫的搜索返回相關(guān)的結(jié)果列表。
“交通智搜”系統(tǒng)采用分布式控制系統(tǒng)應(yīng)對交通運輸部政府網(wǎng)站群大數(shù)據(jù)量、高并發(fā)、高性能、高可用性的應(yīng)用需求,保證系統(tǒng)的容災(zāi)備份、故障切換和負載均衡。其主要組成模塊包括以下幾個部分:
(1)分布式請求服務(wù)器:使用加權(quán)算法將請求轉(zhuǎn)發(fā)至不同的智能搜索引擎系統(tǒng)上,實現(xiàn)容災(zāi)備份和負載均衡。
(2)分布式索引服務(wù)器:將文檔分別索引至不同的智能搜索引擎系統(tǒng)中,實現(xiàn)故障切換和負載均衡。
(3)分布式管理服務(wù)器:為智能搜索引擎系統(tǒng)各模塊提供關(guān)鍵的維護、管理、控制和監(jiān)測功能,采用統(tǒng)一的方式從中央位置與所有智能搜索引擎系統(tǒng)服務(wù)進行通訊。
為提高搜索引擎的響應(yīng)速度,“交通智搜”系統(tǒng)根據(jù)信息源的范圍,為網(wǎng)站群設(shè)計多個索引庫(即每個站點一個索引庫)來分散搜索引擎的搜索壓力。
針對具體的搜索應(yīng)用,“交通智搜”系統(tǒng)根據(jù)搜索數(shù)據(jù)的特點,采用合理冗余的索引字段設(shè)計方式,提高搜索引擎響應(yīng)時間。例如,日期字段2008-01-09,在索引庫中存儲時,設(shè)計為:
年:2008
月:2008-01
日:2008-01-09
雖然這種設(shè)計會導(dǎo)致索引空間膨脹,但可以提高搜索速度,符合索引系統(tǒng)空間換時間的理念。
通常情況下,在某一時間段內(nèi),80%的用戶搜索請求會集中于某些特定內(nèi)容,在搜索引擎收到相同或相似的搜索請求時,“交通智搜”系統(tǒng)合理采用搜索緩存技術(shù)緩存上個用戶的搜索結(jié)果,以減少服務(wù)器負載及快速返回搜索結(jié)果。
依據(jù)上述合理的技術(shù)應(yīng)用與數(shù)據(jù)庫設(shè)計,交通運輸部政府網(wǎng)站在日均頁面搜索量約1.5 萬的情況下,搜索結(jié)果仍可以快速反饋,服務(wù)穩(wěn)定可靠。
“交通智搜”系統(tǒng)不僅搜索范圍廣泛、響應(yīng)速度快速,其搜索方式和搜索結(jié)果展示也滿足了用戶多樣化的需求。
系統(tǒng)提供了普通搜索、高級搜索、二次搜索(如圖2所示)等搜索方式。
圖2 普通搜索和二次搜索Fig.2 General search and secondary search
(1)普通搜索,用戶僅需輸入搜索詞,點擊搜索按鈕,即可得到相關(guān)的搜索結(jié)果;
(2)高級搜索,可以對關(guān)鍵詞、文檔格式、時間范圍、排序方式、搜索位置等進行設(shè)置;
(3)二次搜索:在第一次搜索的搜索詞后空一格,并繼續(xù)輸入二次搜索的搜索詞,即可對包含某一搜索詞的信息數(shù)據(jù)進行二次搜索,二次搜索的次數(shù)不限,直至搜索到目標(biāo)信息。
系統(tǒng)建立了停用詞、全拼、大眾詞匯、同義詞、行業(yè)相關(guān)主題詞、部門領(lǐng)導(dǎo)人、內(nèi)設(shè)機構(gòu)名稱、直屬機構(gòu)名稱、行業(yè)相關(guān)長尾關(guān)鍵詞、辦事事項、政策、問題等詞典,與網(wǎng)站內(nèi)容管理系統(tǒng)對接,全面提升搜索詞的準(zhǔn)確性以及網(wǎng)站自查和校對能力,針對不同的搜索需求,提供了拼音搜索、模糊搜索等,用戶輸入拼音、同/近義詞、大眾詞匯后,系統(tǒng)會對相關(guān)搜索詞進行提示、智能糾錯,還會推薦其他相關(guān)搜索。
(1)拼音搜索:系統(tǒng)基于漢字注音技術(shù)和多音排歧技術(shù),在大量拼音語料基礎(chǔ)上,統(tǒng)計漢字串的分布規(guī)律、拼音串的分布規(guī)律等,形成了基于上下文的注音算法技術(shù),保證了注音的準(zhǔn)確性。當(dāng)用戶只輸入拼音時,系統(tǒng)可推薦相關(guān)的搜索詞匯,完成搜索。例如,用戶輸入拼音“jiazhao”,系統(tǒng)會返回含有“駕照”和“機動車駕駛證”兩個相關(guān)搜索詞的搜索結(jié)果。
(2)大眾詞匯搜索:系統(tǒng)將白話文/大眾詞匯與專有詞匯、專業(yè)術(shù)語一一對應(yīng),建立了大眾詞匯庫,通過詞庫匹配將其轉(zhuǎn)換為網(wǎng)站中的專業(yè)術(shù)語或準(zhǔn)確表述,并返回相關(guān)搜索結(jié)果。例如,用戶輸入“駕照”時,系統(tǒng)會提示“您是不是要搜索機動車駕駛證或僅搜駕照”,并返回與“駕照”和“機動車駕駛證”相關(guān)的信息。
(3)模糊搜索:系統(tǒng)建立了同義詞庫,用戶輸入的搜索詞有同義詞時,系統(tǒng)會自動按照同義詞進行模糊搜索,并返回相關(guān)搜索結(jié)果。例如,用戶輸入“交費”時,系統(tǒng)會反饋含有“繳費”和“交費”的相關(guān)信息,得到較全面的搜索結(jié)果。
(4)智能糾錯:對于經(jīng)常性輸入錯誤的詞語,系統(tǒng)會提示按正確詞語作為搜索詞進行搜索,以減少重復(fù)輸入操作。例如,用戶輸入“簡歷工程師”就可以得到“監(jiān)理工程師”相關(guān)的結(jié)果。
(5)搜索詞推薦:由于用戶使用的搜索詞不準(zhǔn)確,往往不能得到想要的結(jié)果,系統(tǒng)會在用戶每次搜索時,依據(jù)相關(guān)度算法,自動分析出一系列相似或相關(guān)搜索詞,并在頁面下方按照搜索熱度進行推薦,點擊新搜索詞即可完成相關(guān)搜索。例如,用戶輸入“旅游”后,系統(tǒng)會在搜索結(jié)果列表下方自動推薦“旅游法、云南旅游、旅游公路標(biāo)準(zhǔn)”等相關(guān)搜索詞。
(6)熱搜詞推薦:系統(tǒng)可根據(jù)用戶搜索頻率統(tǒng)計熱門搜索詞的排名,并在搜索框下推薦熱搜詞,用戶可以直接點擊熱搜詞進行搜索。
(1)分類展示:用戶可選擇信息所在板塊(包括交通運輸部門戶、政策、新聞、服務(wù)、數(shù)據(jù)、互動、微信、圖片等)和信息來源(含子站、部管政府網(wǎng)站和地方交通運輸主管部門網(wǎng)站)對搜索結(jié)果進行分類展示。
(2)自定義排序:用戶可按照相關(guān)度、更新時間等自定義搜索結(jié)果的排序方式。
(3)縮小搜索結(jié)果的顯示范圍:用戶可通過設(shè)置搜索詞所在位置(如全文、標(biāo)題)、信息的附件類型、更新時間等進一步縮小搜索結(jié)果范圍。
系統(tǒng)可根據(jù)用戶的搜索詞,在搜索框的下拉框中或搜索結(jié)果列表的右側(cè)按照信息所在板塊智能分類提示相關(guān)搜索結(jié)果(如圖3、圖4 所示)。
圖3 下拉框搜索結(jié)果推薦Fig.3 Drop-down search results recommendation
圖4 搜索結(jié)果列表右側(cè)智能推薦Fig.4 Smart recommendations to the right of the search results list
強大的統(tǒng)計分析功能是智能搜索賦能數(shù)字政府建設(shè)的一個重要表現(xiàn)。系統(tǒng)可進行可靠即時地搜索統(tǒng)計,內(nèi)容包括搜索用戶數(shù)、熱搜詞排名、流量趨勢、用戶來訪地區(qū)等,幫助網(wǎng)站管理者了解用戶搜索行為,為做好服務(wù)型政府網(wǎng)站提供決策性數(shù)據(jù)支撐。
5.1.1 常用搜索詞排名
系統(tǒng)可采集分析站群或某個特定站點的所有搜索詞,并通過柱圖等展現(xiàn)各搜索詞的搜索占比,政府部門可以及時掌握輿情動態(tài)、了解用戶需求。
5.1.2 站內(nèi)搜索詞列表
系統(tǒng)可采集所有搜索詞,并通過列表方式分析展現(xiàn)搜索詞的名稱、搜索次數(shù)、命中次數(shù)、作為二次搜索的次數(shù)、結(jié)果頁瀏覽量、帶來再次搜索的次數(shù)和平均訪問深度等,以幫助系統(tǒng)管理者優(yōu)化搜索詞庫、索引庫和相關(guān)算法等。
5.1.3 搜索詞多維度分析
系統(tǒng)可圍繞用戶輸入的搜索詞提供熱度分析、增長率分析、相關(guān)分析、終端分析等多維度統(tǒng)計,并支持按時段查看,使網(wǎng)站管理者深入了解用戶搜索需求,并進一步分析用戶的主要訴求,為網(wǎng)站的資源組織、信息發(fā)布和其他相關(guān)業(yè)務(wù)開展提供基礎(chǔ)決策支持,以優(yōu)化線上辦事流程、引導(dǎo)社會輿論,從而有效提升政府治理能力。
系統(tǒng)可按照搜索詞和索引量進行統(tǒng)計,分析“0 結(jié)果”的搜索百分比、搜索結(jié)果“0 點擊”的百分比、搜索終端訪問量占比、搜索結(jié)果訪問趨勢等,為系統(tǒng)運維和運營提供客觀可靠的數(shù)據(jù)支持,并進一步開展熱詞、搜索排行榜及特定搜索詞的相關(guān)信息統(tǒng)計。
在未來的發(fā)展上,“交通智搜”還可以探索開展搜索結(jié)果的場景化服務(wù),根據(jù)用戶歷史搜索情況和訪問轉(zhuǎn)化情況,為用戶整合與其搜索內(nèi)容相關(guān)的服務(wù)、信息和互動內(nèi)容,實現(xiàn)千人千面,針對不同用戶提供不同的搜索結(jié)果,以提高用戶的體驗感和獲得感,進一步提升用戶對數(shù)字政府治理能力的滿意度。