李成林,趙珍威,李國厚,侯志松
(河南科技學(xué)院信息工程學(xué)院,河南 新鄉(xiāng) 453003)
農(nóng)業(yè)是國民經(jīng)濟的基礎(chǔ),是人類的衣食之源、生存之本[1].隨著全球人口的不斷增長,糧食供應(yīng)和糧食安全問題變得日益嚴(yán)峻,已成為全球面臨的重要挑戰(zhàn)之一.在農(nóng)業(yè)生產(chǎn)中,種子作為重要的生產(chǎn)資料,直接影響著農(nóng)作物的生長、產(chǎn)量和質(zhì)量[2].因此,在解決糧食供應(yīng)和安全問題的過程中,選用高品質(zhì)的種子,并對其進行科學(xué)的保護和繁育,是確保農(nóng)作物高產(chǎn)優(yōu)產(chǎn)的核心環(huán)節(jié).
隨著基因編輯技術(shù)的發(fā)展,育種效率得到了顯著提高[3].但是,由于市面上農(nóng)作物品種繁多,農(nóng)戶缺乏相關(guān)知識,往往難以選擇適合當(dāng)?shù)厣鷳B(tài)環(huán)境種植的品種.針對這一問題,應(yīng)當(dāng)充分考慮農(nóng)民對農(nóng)作物品種信息獲取的需求,為其提供高效、準(zhǔn)確的信息獲取渠道,以更好地促進農(nóng)業(yè)生產(chǎn)的發(fā)展.傳統(tǒng)的農(nóng)業(yè)信息獲取方式主要通過農(nóng)業(yè)書籍、雜志、報紙等印刷媒體,或者利用搜索引擎、農(nóng)業(yè)網(wǎng)站等網(wǎng)絡(luò)媒體獲取農(nóng)作物品種相關(guān)信息.但是,這些方式在信息獲取效率、實用性、時效性等方面存在一些不足,難以更好滿足農(nóng)民在農(nóng)業(yè)生產(chǎn)過程中的信息需求.隨著信息技術(shù)的發(fā)展,問答系統(tǒng)為農(nóng)民更好地獲取作物品種信息和種植知識提供了新的思路和方法[4].
近年來,在人工智能技術(shù)的支持下,問答系統(tǒng)逐漸應(yīng)用到農(nóng)業(yè)領(lǐng)域.例如,白皓然等[5]提出了一種改進的BiLSTM-CRF(Bidirectional Long Short-Term Memory- Conditional Random Fields,BiLSTM-CRF)模型,設(shè)計并開發(fā)了農(nóng)業(yè)信息智能問答系統(tǒng),實現(xiàn)了農(nóng)業(yè)知識的信息化.薛慧芳[6]采用自然語言處理技術(shù)和機器學(xué)習(xí)技術(shù),通過分析用戶的歷史提問記錄和搜索行為,建立了用戶偏好模型,利用模型對問題進行分類并推薦相應(yīng)的技術(shù).Chen Y 等[7]人利用自然語言處理技術(shù)和深度學(xué)習(xí)技術(shù),自動識別非結(jié)構(gòu)化文本中的農(nóng)業(yè)實體,并構(gòu)建知識圖譜,為農(nóng)業(yè)領(lǐng)域的下游任務(wù)提供了參考依據(jù).在水稻專家的指導(dǎo)下,Wang H 等[8]利用人工收集和公開數(shù)據(jù)兩種方式獲取水稻數(shù)據(jù),并成功構(gòu)建了水稻知識圖譜,為農(nóng)民提供了更加全面的水稻種植技術(shù)指導(dǎo).
雖然問答系統(tǒng)成為人機交互的重要方式,但現(xiàn)有的問答系統(tǒng)大多是基于自然語言處理技術(shù),存在著語義理解和知識表示方面的局限性.相比之下,知識圖譜技術(shù)可以將數(shù)據(jù)和知識以圖譜的形式進行建模和表示,形成結(jié)構(gòu)化、語義化的知識庫,為問答系統(tǒng)提供更加準(zhǔn)確、全面的知識支持.然而,盡管基于知識圖譜的問答系統(tǒng)具有廣闊的應(yīng)用前景和研究價值,但目前在農(nóng)業(yè)相關(guān)研究方面相對較少,需要更多的探索和實踐.因此,本文基于知識圖譜構(gòu)建了一個農(nóng)作物良種問答系統(tǒng),旨在幫助農(nóng)民更好地選擇和種植適宜的農(nóng)作物品種.本文的主要研究內(nèi)容如下:①農(nóng)作物品種知識圖譜的構(gòu)建;②通過問題預(yù)處理模塊、問題分析模塊和問題求解模塊對用戶提出的問題進行分析和返回最佳答案;③農(nóng)作物良種知識問答系統(tǒng)的設(shè)計與實現(xiàn).
Scrapy 是一個基于Twisted 異步網(wǎng)絡(luò)庫的爬蟲框架[9],提供了一組包括調(diào)度器、下載器、爬蟲序列、實體管道等組件.其框架如圖1 所示.
Scrapy 網(wǎng)絡(luò)爬蟲框架各流程功能如下:
Scrapy 引擎:引擎承擔(dān)著整個爬蟲系統(tǒng)的協(xié)調(diào)、調(diào)度和控制任務(wù).它用于控制整個爬蟲系統(tǒng)的數(shù)據(jù)流處理,并觸發(fā)各種事務(wù).
調(diào)度器:調(diào)度器用于管理爬蟲請求的順序、處理重復(fù)請求以及控制爬蟲速度等,通過將爬蟲生成的請求發(fā)送給下載器下載對應(yīng)的頁面.
下載器:下載器是從互聯(lián)網(wǎng)上下載農(nóng)作物品種網(wǎng)頁內(nèi)容,為構(gòu)建農(nóng)作物品種知識圖譜提供數(shù)據(jù)源.
爬蟲序列:爬蟲序列是從特定的網(wǎng)頁中提取所需信息的規(guī)則集合,為爬蟲提供了數(shù)據(jù)抓取和處理的基礎(chǔ).
項目管道:項目管道負責(zé)處理爬蟲從網(wǎng)頁中抽取的項目數(shù)據(jù),為爬蟲的數(shù)據(jù)處理和存儲提供了關(guān)鍵支持.
知識圖譜是一種表示和組織知識的方式,將現(xiàn)實世界中的實體、概念以及它們之間的關(guān)系抽象為可視化形式,從而構(gòu)建一個系統(tǒng)、全面、準(zhǔn)確的知識體系[10].知識圖譜已成為自然語言處理[11-12]、推薦系統(tǒng)[13-14]、智能問答[15-16]等領(lǐng)域中重要的研究方向,引起了學(xué)術(shù)界和企業(yè)界的廣泛關(guān)注.企業(yè)可以利用知識圖譜技術(shù)構(gòu)建本身的知識圖譜,為用戶提供更精準(zhǔn)、更智能的服務(wù).例如,在搜索引擎領(lǐng)域[17],知識圖譜可以提高搜索準(zhǔn)確率和檢索效率,為用戶快速找到自己需要的信息提供幫助.在醫(yī)學(xué)領(lǐng)域[18],知識圖譜可以幫助醫(yī)生快速準(zhǔn)確地了解疾病的診斷、治療和預(yù)后,從而更好地支持臨床決策和醫(yī)療工作.在農(nóng)業(yè)領(lǐng)域[19],農(nóng)業(yè)人員可以獲得全面、精準(zhǔn)、及時的農(nóng)業(yè)知識.
BiLSTM-CRF 應(yīng)用于自然語言處理領(lǐng)域,是一種結(jié)合了雙向長短時記憶網(wǎng)絡(luò)和條件隨機場的神經(jīng)網(wǎng)絡(luò)模型,用于解決序列標(biāo)注任務(wù)[20].BiLSTM-CRF 模型主體包括嵌入層、BiLSTM(Bidirectional Long ShortTerm Memory,BLSTM)層和CRF(Conditional Random Fields,CRF)層,模型圖如圖2 所示.
輸入層:模型的輸入為序列文本,本文使用農(nóng)作物品種的字符序列作為輸入.
嵌入層:嵌入層的工作是將字符序列中的數(shù)據(jù)轉(zhuǎn)換為計算機可以處理的向量表示,為BiLSTM層做序列編碼的鋪墊.
BiLSTM層:BiLSTM層由前向LSTM層和后向LSTM層組成,它可以同時考慮前向和后向的上下文信息,從而更好地捕捉序列中的依賴關(guān)系和語義信息.BiLSTM層輸入的是嵌入層輸出的向量序列,輸出的是一個包含上下文信息的隱藏狀態(tài)序列,可作為CRF 層的輸入.
CRF 層:CRF 層用于對輸入序列進行標(biāo)注,并考慮標(biāo)簽之間的依賴性關(guān)系,以提高標(biāo)注的準(zhǔn)確性和泛化性.
輸出層:輸出層的功能是將BiLSTM層提取的上下文信息和CRF 層建模的標(biāo)簽之間的依賴關(guān)系結(jié)合起來,生成對輸入序列進行標(biāo)注的最終輸出標(biāo)簽序列.
在構(gòu)建農(nóng)作物品種知識圖譜的過程中,通常采用由農(nóng)業(yè)專家設(shè)計的本體模式來描述農(nóng)作物品種的各種屬性和關(guān)系.本文結(jié)合了農(nóng)業(yè)專家的指導(dǎo),參考朱銀等[21]和Jarvis 等[22]在農(nóng)業(yè)領(lǐng)域的工作,并在此基礎(chǔ)上增加了農(nóng)作物品種特有屬性.為了保證知識圖譜的準(zhǔn)確性,本文進行了本體層構(gòu)建、數(shù)據(jù)預(yù)處理、知識抽取和知識融合等步驟.經(jīng)過這些步驟,最終構(gòu)建了農(nóng)作物品種知識圖譜,為下游的問答系統(tǒng)提供了高質(zhì)量的知識支持.農(nóng)作物知識圖譜構(gòu)建流程圖如圖3 所示.
本體構(gòu)建的準(zhǔn)確性和覆蓋性對整個知識圖譜的構(gòu)建至關(guān)重要.本文根據(jù)農(nóng)作物品種關(guān)鍵詞,結(jié)合農(nóng)業(yè)專家的建議,考慮真實情況選出具有代表性的農(nóng)作物品種的核心類目,然后使用本體構(gòu)建工具,采用七步法進行農(nóng)作物品種本體構(gòu)建.具體步驟如下:
(1)確定農(nóng)作物品種本體的構(gòu)建范圍.根據(jù)農(nóng)業(yè)專家的建議和需求分析確定構(gòu)建本體的對象,以中國種業(yè)大數(shù)據(jù)平臺作為數(shù)據(jù)的主要來源,確定以農(nóng)作物品種內(nèi)容要素為研究對象.
(2)考慮復(fù)用現(xiàn)有的本體.在構(gòu)建農(nóng)作物品種本體之前,本文通過研究DBpedia 和Wikidata 中已有的農(nóng)業(yè)本體,并根據(jù)我們的需求和目標(biāo)進行篩選和修改,構(gòu)建農(nóng)作物品種本體.
(3)列出本體所涉及的農(nóng)作物品種的重要術(shù)語.提取農(nóng)業(yè)領(lǐng)域的專業(yè)術(shù)語的路徑主要有3 個:①從農(nóng)業(yè)著作和論文等文獻中進行人工篩選;②從農(nóng)業(yè)詞庫中提取;③從網(wǎng)頁中進行爬蟲.通過以上途徑獲取的專業(yè)術(shù)語經(jīng)過農(nóng)業(yè)領(lǐng)域?qū)<业膶徍撕痛_定,對農(nóng)作物相關(guān)知識進行系統(tǒng)性的分析.
(4)定義分類概念和概念分類層次.本文使用混合的方法構(gòu)建農(nóng)作物品種知識圖譜.
(5)定義屬性和關(guān)系.本文通過定義屬性和關(guān)系,可以更加準(zhǔn)確和詳細地描述農(nóng)業(yè)領(lǐng)域的內(nèi)部結(jié)構(gòu)和成員之間的關(guān)系.
(6)定義本體屬性約束.在將農(nóng)業(yè)加入到本體中時,可以通過定義本體屬性約束限制和規(guī)范農(nóng)業(yè)領(lǐng)域內(nèi)部屬性值的取值范圍和類型,以確保本體的準(zhǔn)確性和一致性.
(7)構(gòu)建農(nóng)作物品種本體實例.完成對農(nóng)作物品種本體類、對象屬性和數(shù)據(jù)屬性的添加,利用本體構(gòu)建工具對農(nóng)作物品種相關(guān)的審定內(nèi)容、特征特性、農(nóng)作物病害等實例和屬性值進行添加,最終形成農(nóng)作物品種知識組織體系,如圖4 所示.
圖4 大豆品種本體建模設(shè)計Fig.4 Design diagram of soybean variety ontology modeling
圖4 為本文構(gòu)建的大豆品種本體建模設(shè)計圖,小麥、玉米、水稻和花生與大豆品種本體建模設(shè)計類似.圖4 展示了每一種農(nóng)作物品種的實體之間的關(guān)系,例如:大豆病害與發(fā)病階段之間存在“發(fā)病”的關(guān)系、審定內(nèi)容與申請者之間存在“審定”關(guān)系等.
2.2.1 數(shù)據(jù)獲取本文通過Scrapy 框架在中國種業(yè)大數(shù)據(jù)平臺獲取了包括小麥、玉米、大豆、棉花和水稻5 種農(nóng)作物在內(nèi)的、共計1 634 個農(nóng)作物品種數(shù)據(jù).不同農(nóng)作物的信息來源和數(shù)量如表1 所示.
表1 農(nóng)作物信息來源和數(shù)量Tab.1 Crop information sources and number of varieties
2.2.2 數(shù)據(jù)預(yù)處理為構(gòu)建農(nóng)作物品種知識圖譜,本文采用爬蟲技術(shù)獲取大量文本數(shù)據(jù).然而,由于這些數(shù)據(jù)存在繁體字、非文本信息、停用詞和單位量詞不統(tǒng)一等問題,因此為提高數(shù)據(jù)質(zhì)量和準(zhǔn)確性,本文對文本數(shù)據(jù)預(yù)處理的具體方法如表2 所示.
表2 數(shù)據(jù)預(yù)處理方法Tab.2 Data processing method
經(jīng)過數(shù)據(jù)預(yù)處理,定義了5 類實體和69 個屬性,具體信息如表3 所示.其中第一行為小麥、玉米、大豆等5 種農(nóng)作物的公共屬性,而第二至第六行分別為這些農(nóng)作物各自的特有屬性.
表3 實體類型及其屬性表Tab.3 Entity types and their attributes
多源異構(gòu)的數(shù)據(jù)源能夠豐富知識圖譜的數(shù)據(jù)量,但數(shù)據(jù)源中經(jīng)常存在許多重復(fù)、異名同義的實體.如果直接使用預(yù)處理后的數(shù)據(jù)構(gòu)建知識圖譜,必然會產(chǎn)生知識沖突與冗余.為保證設(shè)計問答系統(tǒng)的準(zhǔn)確性,需要通過知識融合相關(guān)技術(shù)對數(shù)據(jù)進行處理,獲取后的數(shù)據(jù)可以構(gòu)建知識圖譜的數(shù)據(jù).本文利用規(guī)則和實體對齊方法構(gòu)建了一套農(nóng)作物品種別名實體庫,并在此基礎(chǔ)上通過實體映射融合多源數(shù)據(jù).本文使用的部分實體別名如表4 所示.
表4 部分實體別名表Tab.4 List of partial entity names
為了實現(xiàn)農(nóng)作物品種知識圖譜的查詢和分析,本文采用適當(dāng)?shù)拇鎯凸芾砑夹g(shù).Neo4j 圖數(shù)據(jù)庫是一種高效的知識圖譜存儲和管理技術(shù),可以提高查詢和處理效率,優(yōu)化知識圖譜的可視化效果.
Neo4j 采用Cypher 語言進行數(shù)據(jù)庫管理和查詢.為了構(gòu)建農(nóng)作物品種知識圖譜,將預(yù)處理后的數(shù)據(jù)按照Cypher 語句要求的CSV 格式進行轉(zhuǎn)換.轉(zhuǎn)換完成后,通過Python 的Py2neo 庫將整理好的CSV 文件導(dǎo)入Neo4j 圖數(shù)據(jù)庫中,從而完成農(nóng)作物品種知識圖譜的構(gòu)建.農(nóng)作物品種知識圖譜局部結(jié)構(gòu)圖如圖5 所示.
圖5 農(nóng)作物品種知識圖譜局部結(jié)構(gòu)圖Fig.5 Partial Structure Diagram of Crop Variety Knowledge Graph
圖5 為農(nóng)作物品種知識圖譜局部結(jié)構(gòu)圖.該知識圖譜包含了39 933 個實體節(jié)點,297 308 條關(guān)系.其中,a 為大豆品種,b 為農(nóng)作物審定內(nèi)容,c 為農(nóng)作物特征,d 為種植技術(shù),e 為大豆的特性.農(nóng)作物品種知識圖譜提供了更好地了解農(nóng)作物品種、特征和種植技術(shù)等信息,能夠為農(nóng)業(yè)領(lǐng)域的數(shù)據(jù)分析、知識發(fā)現(xiàn)和智能決策等方面提供強有力的基礎(chǔ)數(shù)據(jù)支持.
本文設(shè)計并開發(fā)的農(nóng)作物良種問答系統(tǒng)總體架構(gòu)圖如圖6 所示,主要包括前端和后端兩大模塊.前端模塊主要包括問題的輸入和答案的輸出;后端模塊主要包括問題預(yù)處理、問題分析和問題求解三部分.首先,對問題進行中文分詞、詞性標(biāo)注和實體識別等預(yù)處理;其次,通過對用戶輸入的問題進行分類,根據(jù)分類的結(jié)果進行問句模板的匹配;最后,將匹配的問句模板,生成查詢語句,在Neo4j 圖數(shù)據(jù)庫中進行答案查詢并返回最終的答案.
圖6 農(nóng)作物良種問答系統(tǒng)架構(gòu)圖Fig.6 Architecture Diagram of Crop Elite Variety Question-Answering System
分詞是中文加工的第一步.它將一段連續(xù)的自然語言文本按照一定的規(guī)則或算法進行切割,將文本劃分為具有語義的單元.中文分詞是自然語言處理中的一個重要環(huán)節(jié),為后面的詞性標(biāo)注、句法分析及文本分析打下堅實的基礎(chǔ).目前常見的分詞工具主要有Jieba、HanLP、NLPIR、LTP、THULAC 等.本文使用由清華大學(xué)自然語言處理與社會人文計算實驗室研發(fā)的THULAC 分詞工具[23]進行中文分詞和詞性標(biāo)注.詞性標(biāo)注示例表如表5 所示.
表5 詞性標(biāo)注示例表Tab.5 Examples of part-of-speech tagging
中文分詞和詞性標(biāo)注后,將標(biāo)注好的數(shù)據(jù)輸入到BiLSTM-CRF 模型中[24].由于BIO 標(biāo)注[25]提供模型需要的真實標(biāo)簽,因此本文采用BIO 標(biāo)注方案對農(nóng)作物品種實體識別進行標(biāo)注,其中B(Begin)代表的是一個實體的開始,I(Inner)代表的是一個實體的中間,O(Other)代表的是非實體.根據(jù)問答系統(tǒng)最后測評的準(zhǔn)確率可以得出還需要進一步改進BiLSTM-CRF 模型.
本文在農(nóng)作物品種實體識別后,使用LTP-parser 對問句依存句法分析,得到問題與實體之間的關(guān)系.LTP-parser 是一種基于語言技術(shù)平臺的詞組分析工具,可以幫助用戶分析句子中的詞組,并獲取詞組的依存句法關(guān)系,從而更好地理解句子的含義.依存句法分析標(biāo)注關(guān)系及含義如表6 所示.
表6 依存句法分析標(biāo)注關(guān)系及含義Tab.6 Dependency parsing tagging relationship and meaning
如問題“中豆49 使用什么藥物來預(yù)防病害?”依存句法分析如圖7 所示.在農(nóng)作物品種命名實體識別之后可得到“中豆49”品種實體,與“中豆49”實體關(guān)聯(lián)的動詞是“使用”,“使用”的賓語是“藥物”.動詞“使用”這個詞使“中豆49”與“藥物”之間建立了關(guān)系,形成了<中豆49,使用關(guān)系,藥物>的三元組.
圖7 依存句法分析Fig.7 Dependency parsing
根據(jù)獲取到的農(nóng)作物品種數(shù)據(jù),本文將常見問題分為四類:審定信息類問題、品種特征類問題、品種病蟲害類和品種種植技術(shù)類問題.審定信息類問題主要回答“品種審定的基本信息”;品種特征類問題主要回答“品種的特性”;品種病蟲害類問題主要回答“品種生長過程中可能有哪些病蟲害”;品種種植類問題主要回答“品種種植過程中的栽培技術(shù)要點”.農(nóng)作物品種問題分類如表7 所示.
表7 農(nóng)作物品種問題分類表Tab.7 Classification of crop varieties
為了在農(nóng)作物品種知識圖譜中查詢到問題的答案,將問題三元組轉(zhuǎn)換為問題類別分別對應(yīng)的Cypher 查詢語句.農(nóng)作物品種部分特征查詢模板如下:
(1)生育期類問題Cypher 查詢模板
MATCH(a:wcros)- [rel:生育期]->(b:wcros_growthperiod)where a.name="{name}" return b.growthperiod'
(2)穗粗類問題Cypher 查詢模板
MATCH(a:wcros)- [rel:穗粗cm]->(b:c_eardiameter)where a.name="{name}"return b.eardiameter'
(3)株高類問題Cypher 查詢模板
MATCH(a:wcros)-[rel:穗位高cm]->(b:c_spikeheight)where a.name="{name}"return b.spikeheight
(4)衣分類問題Cypher 查詢模板
MATCH(a:wcros)-[rel:衣分]->(b:co_ginningoutturn)where a.name="{name}"return b.ginningoutturn
(5)株型類問題Cypher 查詢模板
MATCH(a:wcros)- [rel:株型]->(b:wcros_planttype)where a.name="{name}"return b.planttype
農(nóng)作物品種問答系統(tǒng)利用Py2neo 模塊實現(xiàn)了Neo4j 數(shù)據(jù)庫的查詢接口,并使用Cypher 查詢語句在知識圖譜中查詢相關(guān)的三元組.根據(jù)用戶提出的問題類別,系統(tǒng)選擇不同的查詢模板,并根據(jù)查詢結(jié)果將最佳的答案返回給用戶.
本文面向農(nóng)業(yè)領(lǐng)域開發(fā)了一種基于知識圖譜的農(nóng)作物良種問答系統(tǒng).該系統(tǒng)使用Flask 框架作為Web 框架,Neo4j 作為后端數(shù)據(jù)庫,主要使用Python 語言,可視化界面使用的技術(shù)是HTML、JQuery、CSS.問答系統(tǒng)界面如圖8 所示.用戶可以提問農(nóng)作物品種相關(guān)的問題,系統(tǒng)將自動回答用戶提問的問題.
圖8 問答系統(tǒng)界面Fig.8 Interface of Question Answering System
為了測試農(nóng)作物品種問答系統(tǒng)的準(zhǔn)確性,在專家指導(dǎo)下,設(shè)計了300 個與農(nóng)作物品種有關(guān)的問題作為問答系統(tǒng)的測試數(shù)據(jù),對系統(tǒng)返回的答案進行測評,以檢驗問答系統(tǒng)的性能.本文使用準(zhǔn)確率進行分析.分析見式(1)
式(1)中:P 代表準(zhǔn)確率,t 代表回答正確問題的條數(shù),T 代表測試問句的條數(shù).
農(nóng)作物品種數(shù)據(jù)集下問答系統(tǒng)測評結(jié)果見表8.
表8 農(nóng)作物品種數(shù)據(jù)集下問答系統(tǒng)測評結(jié)果Tab.8 Evaluation results of question and answer system under crop variety data set
通過表8 可知,在專家指導(dǎo)下設(shè)計的4 類問題中,審定信息類問題回答效果最好,品種特征類問題回答效果較差,系統(tǒng)的平均回答準(zhǔn)確率為87.67%.分析得出,本文開發(fā)的問答系統(tǒng)能夠較好地回答農(nóng)作物品種方面的問題.由于數(shù)據(jù)集中品種特征類問題的數(shù)據(jù)存在大量缺失值,因此該類問題的回答準(zhǔn)確率較低.
基于中國種業(yè)大數(shù)據(jù)平臺,通過數(shù)據(jù)預(yù)處理、本體構(gòu)建和知識融合等步驟,本文構(gòu)建了一個農(nóng)作物品種知識圖譜.該知識圖譜包含了審定信息、品種特征、品種病蟲害等信息,結(jié)合BiLSTM-CRF 模型實體識別、LTP-parser 依存句法分析和Cypher 查詢語句等技術(shù)構(gòu)建了一個農(nóng)作物良種問答系統(tǒng).該系統(tǒng)能夠根據(jù)用戶的需求和條件,推薦適合當(dāng)?shù)厣鷳B(tài)環(huán)境的良種.實驗表明,本文構(gòu)建的農(nóng)作物良種問答系統(tǒng)在回答準(zhǔn)確性和推薦效率方面表現(xiàn)優(yōu)異,回答準(zhǔn)確率達87.67%,能夠滿足農(nóng)戶的生產(chǎn)需求.未來的研究工作將進一步完善農(nóng)作物品種知識圖譜,包括擴充數(shù)據(jù)集、增加屬性等.同時,不斷優(yōu)化推薦算法,探索更加精細、個性化的推薦策略,提高系統(tǒng)的推薦準(zhǔn)確性和效率,為提高農(nóng)業(yè)生產(chǎn)效率做出更大貢獻.