国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于手機客戶端與微信小程序的智能問答系統(tǒng)

2019-10-08 08:34李冬芬陳天裕李崢劉劍龍林新城梁家禧蔡麗紫
軟件 2019年7期
關鍵詞:自然語言處理

李冬芬 陳天裕 李崢 劉劍龍 林新城 梁家禧 蔡麗紫

摘? 要: 如何更方便快速地獲取到準確的信息是眾多專家學者研究的課題。立足于微信小程序與手機客戶端平臺,智能問答系統(tǒng)從總體的設計出發(fā),到知識庫的構建,通過對自然語言處理,借用改進的TF-IDF算法提取關鍵字特征,BM25算法計算語素權值,以達到精確快速匹配到最佳答案的目的,從而解決問題。初步測試證明,該系統(tǒng)具有良好的實用性,穩(wěn)定性和可拓展性。

關鍵詞: 智能問答系統(tǒng);自然語言處理;TF-IDF;BM25

中圖分類號: TP3? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2019.07.008

【Abstract】: How to obtain accurate information more conveniently and quickly is a topic studied by many experts and scholars. Based on WeChat Mini Program and mobile client platform, the intelligent question answering system starts from the overall design to the construction of the knowledge base. Through the natural language processing, the improved TF-IDF algorithm is used to extract the keyword features, and the BM25 algorithm calculates the morpheme weight to achieve an accurate and fast match to the best answer for the purpose of solving the problem. Preliminary tests have proved that the system has good practicability, stability and scalability.

【Key words】: Question answering system; Natural language processing; TF-IDF; BM25

0? 引言

在互聯(lián)網(wǎng)信息爆炸性增長的今天,人們對信息的需求日益增多,如何在如此龐大的互聯(lián)網(wǎng)上獲取對用戶有價值的信息成為日益被關注的問題,傳統(tǒng)的問答系統(tǒng)已經無法滿足人們獲取準確信息的需求,用相對簡單的詞語或句子搜索無法準確刻畫用戶的真實需求,導致搜索結果差強人意[1]。智能問答系統(tǒng)與傳統(tǒng)的只依靠關鍵字匹配的搜索引擎相比,能夠更好的理解問題,準確識別人們的意圖,滿足用戶的檢索需求,并且在如今私人定制熱潮的互聯(lián)網(wǎng)環(huán)境下,精準推薦能大大滿足用戶的所需。本系統(tǒng)利用眼下熱門的手機應用軟件與微信小程序作為智能問答系統(tǒng)的主體部分進行開發(fā)與設計,通

過算法實現(xiàn)問題理解與精準推薦,簡化了大部分用戶的操作,極大的方便用戶對精確信息的查找。

1? 系統(tǒng)總體框架設計

1.1? 安卓APP模塊設計

隨著科技發(fā)展,安卓成為了最廣泛的手機系統(tǒng),安卓系統(tǒng)有很多優(yōu)點,并且具有極大的開放性,安卓系統(tǒng)平臺主要由四個組成部分架構起來,利用應用程序層的安卓主件進行首頁、QA頁面、個人頁面、智能超市的開發(fā),主要的主件有Activity、Ser?vice、BroadCastReceiver、ContentProvider以及Intent[2]。

本系統(tǒng)采用MVP開發(fā)模式,以利于解決Activity越來越龐大臃腫和耦合度越來越高的問題,

這些問題會導致后期維護變得困難。在安卓應用開發(fā)將Model層和View層通過Presenter層實現(xiàn)完全分離,主要業(yè)務層在Presenter層實現(xiàn)。這樣的分層大大降低了Model層和View層的耦合度[3]。

1.2? 微信小程序模塊設計

微信小程序自面世以來,其受歡迎程度一直呈增長趨勢,越來越多的開發(fā)者學習微信小程序的開發(fā),越來越多的用戶也在使用微信小程序這個平臺。微信小程序有幾個比較明顯的優(yōu)勢:一、無需安裝,即開即用,輕松方便;二、潛在流量大,微信是現(xiàn)如今發(fā)展最為成熟、使用人數(shù)最多的社交應用軟件,人們能夠利用互聯(lián)網(wǎng)在微信上完成發(fā)送圖片、文字、音頻等操作[4];三、開發(fā)的周期相對較短,成本較低。

基于微信小程序的這些優(yōu)點,智能問答系統(tǒng)也設計了微信小程序版。一方面,為那些不想下載APP版的用戶提供了方便;另一方面,多種形式的應用設計可以為用戶提供多種選擇,這也有利于本應用的推廣,從而擴大用戶群。

2? 知識庫設計

本系統(tǒng)采用Mysql數(shù)據(jù)庫作為系統(tǒng)的知識庫[5]。

2.1? 概念設計

主要數(shù)據(jù)存儲功能,如表1所示。

2.2? 邏輯設計

由實體可確定4張表,以下是每張表字段的設計,如表2-5所示。

3? 系統(tǒng)功能模塊設計

3.1? 理解問題模塊

該模塊使系統(tǒng)更好地理解用戶的提問、意圖,并進行語義的解析、修正,其流程圖如圖1所示。

3.1.1? 同義詞處理

檢索用戶問題時,由于同義詞的存在而導致問答系統(tǒng)的檢索準確率低,在進行特征提取前,先按照同義詞詞典進行同義詞處理,在這里使用Hash散列表的形式表示同義詞的數(shù)據(jù)結構。知識庫中每個詞語對應著唯一一個關鍵碼值:key和它的同義詞序列valueList。如知識庫中詞語為:“程序員”,其在同義詞詞典中對應關鍵碼值:{“程序員”:{“程序猿”, “碼農”, “敲代碼的人”}}。

猜你喜歡
自然語言處理
基于LSTM自動編碼機的短文本聚類方法
自然語言處理與司法案例
基于組合分類算法的源代碼注釋質量評估方法
詞向量的語義學規(guī)范化