国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

健身運動知識表達與智能查詢系統(tǒng)構建

2024-10-31 00:00:00黃濤鄭嘉昕王坤黃楊毅劉逸婷夏澤涵林俊
首都體育學院學報 2024年5期

摘 要 科學健身運動在促進大眾體質健康、心理健康等方面均發(fā)揮著重要作用。在數(shù)智時代背景下,健身運動知識的智能查詢與精準查詢成為延伸全民健身公共服務供給,提高全民健身公共服務質量的重要環(huán)節(jié)。鑒于此,通過知識圖譜與大語言模型的協(xié)同互補,探索構建知識圖譜驅動的健身運動知識智能查詢系統(tǒng),提出涵蓋知識抽取與表達、知識整合與管理、知識查詢與問答于一體的實施方案,進而為實現(xiàn)精準化健身運動知識智能查詢的研究與應用提供參考。

關鍵詞 健身運動知識;知識圖譜;智能查詢;大語言模型

中圖分類號:G804 學科代碼:040302 文獻標志碼:A

DOI:10.14036/j.cnki.cn11-4513.2024.05.003

Abstract Scientific exercise and fitness play an important role in promoting physical health, mental health, and overall development. In the digital intelligence era, the intelligent and precise querying of fitness and exercise knowledge has become a key aspect in expanding the supply and enhancing the quality of public exercise services. Therefore, a study was conducted to construct a knowledge graph-driven intelligent query system for fitness and exercise knowledge, utilizing the complementary strengths knowledge graphs and large language models. An integ-rated implementation approach that encompasses knowledge extraction and representation, knowledge organizat-ion and management, as well as knowledge inquiry and Q&A, was proposed. This will provide support for the development and implementation of intelligent querying in the fitness and exercise knowledge domain.

Keywords fitness and exercise knowledge; knowledge graph; intelligent query; large language model

隨著全民健身國家戰(zhàn)略的實施和主動健康理念的推廣,我國廣大民眾對精準化健身運動知識查詢及個性化健身運動指導的需求日益增長。在數(shù)智時代,搜索引擎仍是大眾在互聯(lián)網(wǎng)上獲取健身運動知識的重要工具。然而,在網(wǎng)絡信息爆炸式增長的態(tài)勢下,傳統(tǒng)搜索引擎的局限逐漸暴露[1]。由于缺乏知識層面的統(tǒng)一描述和概念之間的語義聯(lián)系,傳統(tǒng)搜索引擎的搜索結果精準度不高,用詞習慣不一、詞語概念定義表達不明確、術語間關系界定不清晰等現(xiàn)象普遍存在。這不僅增加了大眾獲取科學健身運動知識的難度,導致出現(xiàn)了“信息迷航”“認知過載”等問題[2],也使得因知識不足、方法不當造成的運動損傷在大眾健身運動實踐過程中頻繁發(fā)生??梢?,實現(xiàn)健身運動知識的高效查詢已經(jīng)成為推動全民健身與全民健康深度融合的途徑之一。然而,如何實現(xiàn)健身運動知識的統(tǒng)一表達、組織整合與智能查詢,滿足大眾多樣化、精準化與個性化的需求,是亟待解決的科學問題。

《全民健身計劃(2021—2025年)》中提出:“提供全民健身智慧化服務”[3]。當前,面臨著信息檢索的挑戰(zhàn),而以知識圖譜為典型的知識工程技術為健身運動知識的有效查詢提供了新視角[4]。知識圖譜(KG)是一種由節(jié)點和邊構成的圖數(shù)據(jù)結構,通常用于描述客觀世界存在的實體概念及其相互之間的關系[5]。知識圖譜的出現(xiàn)使得領域知識的組織整合與管理復用變得方便、快捷,相關技術已經(jīng)在網(wǎng)絡輿情[6]、非遺檔案[7]、醫(yī)療健康[8]等領域應用。此外,作為支撐機器向認知智能轉化的重要基石[9],知識圖譜為實現(xiàn)精準化診斷、開放式問答、個性化推介等智能場景提供了結構化、語義化、邏輯化的知識資源。鑒于知識圖譜相關方法能夠從形式多樣、多源異構的領域知識信息資源中重構其知識層次與概念之間的語義聯(lián)系[10],實現(xiàn)健身運動知識的統(tǒng)一表達和整合,本研究將重點探討知識圖譜驅動的健身運動知識智能查詢模式的構建框架及實施方案,以期為精準化健身運動知識查詢、個性化健身運動指導的實現(xiàn)提供新的思路和參考。

1 健身運動知識智能查詢系統(tǒng)的構建框架

1.1 本體化的健身運動知識表達

健身運動知識的有效查詢和使用有利于科學健身理念和健身運動方法的推廣,幫助健身人群在健身運動實踐過程中獲得針對性的指導,實現(xiàn)相應的健身目標。然而,多源化、碎片化、截面化的健身運動領域知識信息致使語義模糊、多詞同義、信息冗余等問題普遍存在,對健身運動知識的高效查詢造成阻礙。因此,形成系統(tǒng)化、邏輯化的健身運動知識表達方法是解決上述問題的先決條件[11],也是實現(xiàn)健身運動知識智能查詢的重要基礎。

知識表達也稱知識表示,主要作用是將認知對象中的要素與知識進行關聯(lián),便于人們對知識進行認知與理解[12]。當前,學界對知識表達方法進行了較為全面的研究。丁華等學者采用面向認知對象為主、產(chǎn)生式規(guī)則和過程表示為輔的混合知識表示模式,實現(xiàn)了對認知對象信息、設計過程和經(jīng)驗規(guī)則的集中表達,為建立知識庫奠定了良好基礎[13]。劉培奇等學者基于產(chǎn)生式規(guī)則和概念圖的知識表達方法在自然語言理解中存在的問題提出了擴展產(chǎn)生式規(guī)則的知識表達方法,但是關于該方法的推理效率有待進一步提高[14]。李佳靜等學者針對所述知識涉及多重領域、知識間關系復雜等問題,提出基于本體的知識表達方法,并利用本體對跨專業(yè)領域概念的關系進行語義定義,解決了知識表達中概念異構、關系模糊等問題[15]。通過上述方法之間的對比,將基于本體的知識表達法應用于健身運動知識表達是一種較為理想的技術手段。

本體一詞源于亞里士多德對事物存在的本質的研究,在哲學上被定義為存在論,即對客觀存在事物作出的系統(tǒng)性說明[16]。最初是從形而上學的角度,描述或假設物質存在基本范疇和關系,以便在其框架內定義實體及實體類型[17]。隨后,本體逐漸演變成一種數(shù)據(jù)模型,旨在系統(tǒng)地闡述領域概念、術語及其相互之間的關系,并通過類層次結構的形式,對定義的概念進行模塊化呈現(xiàn)[18]。鑒于本體的抽象功能較強,且具備邏輯推理能力,所以基于本體的知識表達方法在應急管理[19]、公共衛(wèi)生[20]、醫(yī)療[21]、文獻遺產(chǎn)[22]等多個領域得以應用。因此,本研究采用基于本體的知識表達方法解決健身運動知識概念異構、信息模糊、關系界定不清晰等問題。首先,通過建立健身運動知識表達框架,從健身人群、健身目的、健身方式、健身補劑、損傷預防、反興奮劑等角度分析大眾在健身運動實踐過程中可能涉及的知識要素。其次,抽取健身運動領域核心知識源中的概念、關系、屬性、規(guī)則等本體構成元素,建立健身運動知識統(tǒng)一表達模型。然后,依托相關軟件(如Protégé等)構建健身運動知識本體。最后,通過對應實例進行本體驗證,以實現(xiàn)本體化的健身運動知識表達。

1.2 知識圖譜支持下的健身運動知識整合

在數(shù)智時代,知識圖譜作為知識整合的重要途徑之一,因其強大的功能,廣泛應用于各個領域的知識服務場景中。例如,在中醫(yī)領域,為實現(xiàn)智能診療,楊濤等學者以知識圖譜為基礎,提出包含知識抽取、知識整合和輔助診療于一體的中醫(yī)智能診療模型及其構建方法[23]。在教育領域,為了實現(xiàn)智慧教學,羅江華等學者探討了多模態(tài)學科知識圖譜的基本內涵、構建框架和應用場景[24]。在航天領域,彭仕鑫等學者利用本體建模、知識抽取、知識融合等方法,通過Neo4j圖數(shù)據(jù)庫構建了知識圖譜可視化系統(tǒng)[25]??梢姡R圖譜為海量、多源的領域知識提供了一種高效的整合和管理方式[26],是實現(xiàn)領域知識集成共享、提高領域知識服務效率的重要技術手段。

鑒于健身運動知識專業(yè)性強、實例數(shù)量大、更新速度快且實體間語義關系復雜,本體化的知識表達成為健身運動知識整合的起始環(huán)節(jié)。健身運動知識本體,不僅可以完成領域概念的分類,避免歧義的產(chǎn)生,還可以通過概念關系形成的語義表達,實現(xiàn)領域知識的總體描述,為知識圖譜提供結構化的基礎[27]。此外,由于概念及概念之間的相互關系在本體中得到了明確的定義,所以健身運動知識圖譜能夠基于健身運動知識本體進行擴展和豐富,并清晰地展示其推理過程,進一步為大語言模型支持下的健身運動知識查詢與問答結果賦予可解釋性。因此,在健身運動知識本體的基礎上,構建健身運動知識圖譜以整合與管理多源異構的健身運動領域知識信息,進而為健身運動知識智能查詢提供基礎支撐。

鑒于健身運動領域知識信息多源化、碎片化和截面化的特點,本研究選用基于圖數(shù)據(jù)庫的知識圖譜技術進行健身運動知識的整合與管理。相較于傳統(tǒng)的關系型數(shù)據(jù)庫,圖數(shù)據(jù)庫采用圖論方式存儲復雜的健身運動知識實體和概念關系,并支持圖算法進行深入分析和挖掘[28]。圖數(shù)據(jù)庫可以實現(xiàn)健身人員所使用的運動項目、運動技術、動作規(guī)范、運動損傷預防、運動補劑等相關知識的靈活存儲,以及健身人群、健身目的、健身方式、健身規(guī)范等不同本體模塊所屬實體之間關系的圖示體現(xiàn)。據(jù)此,大眾可以通過瀏覽健身運動知識圖譜,探究不同類別健身運動知識之間的關聯(lián),并通過搜索功能圍繞概念節(jié)點進行查詢。

1.3 大語言模型支持下的健身運動知識查詢

生成式人工智能(GAI)技術正引領新一輪人工智能研究范式的轉變,并對智能查詢方式產(chǎn)生了深刻影響。隨著以Chat GPT等為典型的生成式人工智能技術的發(fā)展,大語言模型(LLM)可賦能并支持科學健身知識查詢、指導和問答。大語言模型是以Transformer為基礎的特殊深度學習模型[29],其核心技術包括自注意力機制、位置編碼、前饋網(wǎng)絡等。自注意力計算公式如下。

Attention(Q,K,V)=softmax() 1),

式中:Q、K、V分別表示查詢、鍵和值矩陣,由輸入矩陣通過不同的權重矩陣轉換生成;dk表示鍵向量的維度,用于縮放點積,防止點積過大導致softmax函數(shù)進入梯度較小的區(qū)域。然而,由于Transformer模型缺乏循環(huán)或卷積結構,為了確保該模型能夠兼顧序列中詞語的先后順序,需要輸入位置編碼,見式(2)和式(3)。

PE(pos,2i)=sin( pos / 10 000)2),

PE(pos,2i+1)=cos(pos/10 000) 3),

式中:pos表示位置;i表示維度;dmodel 表示模型的維度。通過這種方式,每個位置將被賦予獨特的位置編碼,模型即可利用上述信息捕捉序列中的詞語的相對位置。隨后,在每個Transformer塊內,自注意力層的輸出會被進一步傳遞至一個前饋網(wǎng)絡,并對各個位置的詞語進行獨立的、一致的操作,這一過程如式(4)所示。

FFN(x)=max(0,xW1+b1 ) W2+b2 4),

式中:W1 、W2 、b1和b2均表示網(wǎng)絡參數(shù),使用ReLU作為激活函數(shù)。

在自然語言處理(NLP)技術的持續(xù)演進中,大語言模型的學習機制與決策模式相較于傳統(tǒng)深度學習模型呈現(xiàn)出明顯差異。具體體現(xiàn)在以下2個方面。1)在學習方面,改變傳統(tǒng)有監(jiān)督學習方式,轉而融合自監(jiān)督學習與強化學習策略以增進其性能。具體而言,自監(jiān)督學習輔助大語言模型可以深入洞察文本內在的上下文語義聯(lián)系,而強化學習則通過大語言模型與環(huán)境的動態(tài)交互,在對話系統(tǒng)、文本生成等特定任務中,引導大語言模型學習并采納最優(yōu)決策路徑。2)在決策方面,與傳統(tǒng)的分類或回歸輸出不同,大語言模型采用了生成式的結果輸出方式[30-31],以生成更加豐富和靈活的內容。這種決策模式顯著增強了自然語言處理技術在文本生成、機器翻譯、自動摘要等領域的功能,使其能夠基于上下文生成更加連貫、符合語言習慣的文本[32]。

由于傳統(tǒng)搜索引擎依賴于關鍵詞匹配和排序算法[10],大語言模型則可以彌補傳統(tǒng)搜索引擎的不足,更好地滿足大眾查詢健身運動知識的需求。然而,針對專業(yè)領域知識的查詢與問答,大語言模型則存在不足之處[33-34]。受限于輸入數(shù)據(jù)的質量與范圍,大語言模型生成結果的準確性可能降低。在嘗試填充信息空缺時,大語言模型會依賴內部生成邏輯創(chuàng)造不存在的事實,即“幻覺事實”[35]。例如,當用戶詢問如何進行某項運動時,大語言模型會利用習得的普遍性知識,生成一個看似標準的答案。然而,這種答案缺乏對個體差異的考慮,如身體狀況、運動能力、傷病史等。因此,其生成答案可能并不完全準確或適用于所有個體。此外,基于數(shù)據(jù)更新的頻率和算法的局限性,大語言模型可能無法及時捕捉并反映最新的信息,這將導致大語言模型提供的健身運動建議與最佳實踐成效產(chǎn)生偏差。

為了解決上述問題,引入并應用專業(yè)領域知識圖譜尤為關鍵。作為一種結構化模型,知識圖譜能夠顯示、存儲經(jīng)過嚴格驗證的精確事實性知識[10]?;趯I(yè)領域知識圖譜,大語言模型不僅能夠更好地理解和適應該領域的知識體系和相關術語,生成更具領域針對性的文本內容,還能依托專業(yè)領域知識圖譜的結構進行深度推理,并且可以有效規(guī)避事實性錯誤的風險[36]。此外,專業(yè)領域知識圖譜實時更新的特性有助于大語言模型在文本生成過程中迅速抓取最新信息,進一步提高其輸出內容的準確性和有效性。鑒于此,本研究結合大語言模型與知識圖譜擬構建健身運動知識查詢系統(tǒng)(見圖1),實現(xiàn)健身運動知識的智能查詢。

具體而言,本研究所構建的健身運動知識查詢系統(tǒng)側重于在大眾實踐過程中應用,其目標用戶是有健身指導需求的非體育專業(yè)人群。健身運動知識查詢系統(tǒng)框架如圖1所示,構建流程主要包括以下內容:基于健身運動領域核心知識源數(shù)據(jù)構建系統(tǒng)所需的數(shù)據(jù)集和知識庫,利用自然語言處理技術對數(shù)據(jù)源進行數(shù)據(jù)預處理。在健身運動知識圖譜的基礎上,利用大語言模型補充完善健身人群、健身目的、健身方式、健身規(guī)范等范圍內的實體及實體之間的關系,形成健身運動知識圖數(shù)據(jù)庫。通過大語言模型的快速學習,將健身運動領域專家先驗知識與健身運動領域多源知識相結合,提高健身運動知識查詢與問答的專業(yè)水平與準確率,并設計健身運動知識查詢系統(tǒng)的用戶界面。

2 健身運動知識智能查詢模式的實施方案

為了實現(xiàn)健身運動知識的智能查詢,本研究提出的健身運動知識智能查詢模式構建的實施方案(如圖2所示)包含知識抽取與表達、知識整合與管理、知識查詢與問答三大核心模塊。

如圖2所示:1)知識抽取與表達模塊主要對多源異構的健身運動領域知識信息進行規(guī)?;诰蚺c收集,基于抽取結果建立具有領域共識的健身運動知識統(tǒng)一表達模型,并構建相互依存的健身運動知識本體;2)知識整合與管理模塊主要對健身運動領域知識進行對齊與融合,并以圖數(shù)據(jù)庫作為整合引擎,實現(xiàn)健身運動知識的集中集成、共享分析和管理復用;3)知識查詢與問答模塊主要利用大語言模型的深度推理,生成準確、專業(yè)的問答結果,以實現(xiàn)健身運動知識的智能查詢。

2.1 知識抽取與表達

在技術層面,本體化的健身運動知識表達需建立在知識抽取基礎上。

首先,針對研究目的與應用需求,在參考各國官方身體活動指南、運動科學和生理學相關專業(yè)書籍、中英文體育學權威學術期刊論文的基礎上,梳理健身運動領域知識范圍,確立健身運動領域核心知識源。同時,參考健身運動領域專業(yè)詞表,依照健身運動領域知識本質屬性或其他顯著特征,由健身運動領域專家設計健身運動知識本體分類模塊。

其次,從運動項目、健身器械、損傷類型、身體部位、健身補劑、個體特征、健康特征、環(huán)境特征等方面切入,綜合詞頻、詞義、詞形、用戶使用習慣等多種因素收集健身運動領域核心概念優(yōu)選詞。在完成一定數(shù)量的概念優(yōu)選詞的收集和整理后,對健身運動知識本體分類模塊進行適用性測試,通過知識梳理與識別、知識產(chǎn)生與萃取、知識收集與評審等流程反復測試,促進健身運動知識本體分類模塊的逐步完善。在此過程中,需要評估每個概念的重要性,形成健身運動知識分類詞表,進而結合邏輯分析、語義分析等方法,從本體分類模塊出發(fā),建立包含健身運動領域知識邏輯抽象和本體建模主要過程的健身運動知識表達框架。引入類(或概念)、屬性、關系、函數(shù)、實例和公理6個本體基本構成元素,定義健身運動概念類、健身運動概念類的通用關系和健身運動概念類的通用屬性,構建基于本體的健身運動知識表達模型,其形式化定義如公式(5)所示。

O=< C,R,Ac,AR,H,X > 5),

式中:O表示健身運動知識本體;C表示類的集合(指健身運動知識中的概念、術語的集合);R表示類的關聯(lián)關系集合;Ac表示概念屬性的集合(對健身運動知識中的概念本身的特征進行描述);AR表示關系的屬性集合,H表示實例集(指健身運動知識中的實例的集合);X表示公理(指已有事實,能夠約束類或關系,是健身運動知識推理的基礎約束)。

最后,根據(jù)斯坦福大學醫(yī)學院創(chuàng)設的本體構建“七步法”[37],結合健身運動知識分類詞表,使用軟件“Protégé”為預先設置的健身運動知識表達模型添加實例與屬性,完成健身運動知識本體的構建?;诘聽柗品ǎ瑢∩磉\動知識本體的命名規(guī)則、體系架構及邏輯層次進行評價、修改和完善,以建立本體化的健身運動知識表達標準。

2.2 知識整合與管理

在健身運動知識本體的基礎上構建健身運動知識圖譜,旨在整合與管理健身運動領域知識信息,為健身運動知識查詢系統(tǒng)提供基礎支撐。健身運動知識圖譜的實施方案如下。

首先,對健身運動領域核心知識源語料進行數(shù)據(jù)預處理,包括文本清洗、去噪、格式標準化等流程。其中,標準化處理即將數(shù)據(jù)按照比例縮放,使之處于一個特定區(qū)間。常見的方法有Min-Max標準化和Z-score標準化。公式(6)和公式(7)分別對應Min-Max標準化和Z-score標準化,通過消除錯誤、冗余和非結構化元素,為結構化輸入提供清晰而一致的數(shù)據(jù)基礎。

x'= 6),

式中:x是原始數(shù)據(jù),x'是標準化后的數(shù)據(jù)。

z=7),

式中:μ是數(shù)據(jù)的均值,σ是數(shù)據(jù)的標準差。

其次,利用自然語言處理技術,如命名實體識別(NER)技術,確定構成健身運動知識圖譜的基本元素(包括運動項目、技術要領、比賽規(guī)則、器材裝備、運動場地等)。為了減少命名實體識別的誤差,從數(shù)據(jù)集優(yōu)化、特征表示優(yōu)化、模型參數(shù)調整、外部知識引入、反饋機制建立等方面入手,綜合應用上述技術方法,持續(xù)增強其在識別準確性、召回率、處理速度、泛化能力等方面的功能。

再其次,采用實體對齊、屬性融合、關系匹配等方法,對多源異構的健身運動領域知識信息進行整合、消歧、加工等知識融合處理。同時,利用大語言模型,通過在預訓練過程中設定特定任務,如關系預測、知識補全等任務,提高健身運動知識注入的效率及準確性。

最后,根據(jù)所抽取數(shù)據(jù)的性質和特點,選用適合的圖數(shù)據(jù)庫(如Neo4j等),對健身人群、健身目的、健身方式、健身規(guī)范等不同本體模塊所屬實體、屬性及其之間的關系進行導入,構建成健身運動知識圖譜。進而定期對其進行維護和更新,以反映健身運動知識領域的最新變化。

基于圖數(shù)據(jù)庫可視化功能形成的健身運動知識圖譜是健身運動知識查詢系統(tǒng)實現(xiàn)知識傳播的關鍵部分??梢暬侵附∩磉\動領域知識信息的可視化,該功能可使健身運動領域核心知識源的復雜的實體與不同的健身運動方式產(chǎn)生聯(lián)系,并轉換成直觀的圖形界面,諸如個體特征、健康特征、環(huán)境特征及健身目的。與此同時,該功能還為健身運動領域知識信息的動態(tài)展示提供了技術支持。用戶可以根據(jù)個性化查詢觀察所需健身運動知識節(jié)點的變化與比較結果。

2.3 知識查詢與問答

在健身運動知識圖譜的基礎上,大語言模型被用于補充完善實體及其之間的關系,以形成全面和完善的健身運動知識圖數(shù)據(jù)庫。此外,為了應對大語言模型固有的黑箱特性,可通過向量知識庫、詞條關系數(shù)據(jù)庫及圖數(shù)據(jù)庫的協(xié)同應用,增強大語言模型在健身運動知識查詢與問答任務中的解釋性和靈活性。

具體而言,向量知識庫作為存儲向量化知識數(shù)據(jù)的載體,可涵蓋健身運動領域核心知識源文本內的專業(yè)術語、相關概念、運動項目類型、動作要領等。運用詞嵌入等向量化方法可以使健身運動領域知識間的相似性與關聯(lián)性得以高效度量,進而對向量相似度進行深入分析,能夠顯著增強大語言模型的可解釋性,從而提升其在健身運動知識查詢系統(tǒng)中應用的可信度和有效性。向量空間模型的靈活性賦以向量知識庫擴展性和更新能力,這一特性使得向量知識庫能夠兼容多種類型的知識表示和查詢,以滿足健身運動知識查詢系統(tǒng)用戶的多樣化的場景需求。

詞條關系數(shù)據(jù)庫則基于健身運動知識本體的存儲和詞條關系、屬性的管理而形成。其主要功能在于存儲詞條的關聯(lián)信息,包括同義詞、反義詞、上下位概念關系等多種類型。在大語言模型的訓練過程中,結合詞條關系數(shù)據(jù)庫,可以引入詞匯關系約束,進一步優(yōu)化大語言模型對健身運動領域相關詞匯和短語的識別與生成能力。同時,詞條關系數(shù)據(jù)庫能夠針對用戶的查詢進行語義層面的深入擴展與精確修正,進而顯著增強健身運動知識問答系統(tǒng)的精確度和魯棒性。

如前文所述,圖數(shù)據(jù)庫主要用于表達健身運動領域實體間的關系,并描述健身運動領域關鍵事件的演進歷程。通過運用圖算法,大語言模型能夠深入剖析健身運動領域知識的內在結構和深層聯(lián)系,并且圖數(shù)據(jù)庫具有的可視化功能,可以使大語言模型在回答問題時的推理路徑得以清晰展現(xiàn)。

綜上所述,向量知識庫、詞條關系數(shù)據(jù)庫、圖數(shù)據(jù)庫與大語言模型的緊密協(xié)作,為健身運動知識問答系統(tǒng)功能模塊的形成提供了強有力的支撐。通過構建知識問答、知識查詢及知識探究三大功能模塊,該系統(tǒng)能夠以更加智能、高效的方式處理與展示健身運動知識,并為用戶提供豐富的探究體驗。具體而言,健身運動知識問答模塊旨在回答用戶關于健身運動領域的各類開放式問題。健身運動知識查詢模塊包含健身人員在健身運動過程中需運用的運動項目、運動技術、動作規(guī)范、運動損傷預防、運動補劑、興奮劑防范等相關知識。健身運動知識探究模塊通過直觀描述健身運動領域知識信息的復雜關系,輔助用戶探究并理解不同類別健身運動知識間的聯(lián)系。

有關健身運動知識查詢系統(tǒng)的智能問答功能設計,主要注重建立閉環(huán)的學習系統(tǒng)。該功能運用多項技術實現(xiàn)對用戶問題的精準回答,并通過持續(xù)學習可以不斷地提供更優(yōu)質的答案。首先,當用戶提出問題時,該系統(tǒng)通過向量知識庫進行初步搜索,將用戶問題與核心知識源范圍內的內容進行匹配和聚焦,以確保與問題的相關性和適用性。若問題與其中的內容高度相關,系統(tǒng)將利用向量表示的高相似性,將信息輸入至大型語言模型進行深度推理?;谏疃葘W習等技術,大語言模型能夠理解開放式問題的語義含義,并可以生成答案。據(jù)此,健身運動知識查詢系統(tǒng)將以較為完善的語言回答用戶的問題,并提供相應的健身運動知識。用戶得到答案后,該系統(tǒng)允許用戶提供反饋。用戶反饋的結果將被納入大語言模型的學習過程,以此優(yōu)化大語言模型,提高健身運動知識回答的準確性和科學性。這一循環(huán)過程使得健身運動知識查詢系統(tǒng)可以持續(xù)改進,并為用戶提供更為精準和全面的健身運動知識。

健身運動知識查詢系統(tǒng)的智能查詢功能同樣建立循環(huán)式學習機制。首先,當用戶提出問題時,該系統(tǒng)通過查詢健身運動知識圖數(shù)據(jù)庫,搜索與問題相關的詞條、概念關系和屬性,從圖數(shù)據(jù)庫中獲取可能與用戶問題相關的知識片段。其次,隨著健身運動領域知識的持續(xù)更新以及詞條、概念關系的變化,健身運動知識查詢系統(tǒng)的智能查詢功能需要保持與圖數(shù)據(jù)庫的同步更新。因此,在通過查詢健身運動知識圖數(shù)據(jù)庫獲得初始信息之后,該系統(tǒng)憑借實時數(shù)據(jù)同步機制,可以確保所提供的答案屬于最新的領域知識。最后,該系統(tǒng)將這些答案反饋給用戶,同時也允許用戶提供反饋。這種循環(huán)式學習機制有助于健身運動知識查詢系統(tǒng)更為精準地滿足用戶對健身運動個性化和多樣化知識的需求。

3 結束語

當前,大眾對健身運動知識和科學鍛煉方法的需求日益凸顯,數(shù)字技術和人工智能技術的發(fā)展為科學健身運動知識和方法的查詢提供了新的思路和視角。為了實現(xiàn)健身運動知識的智能查詢,助力全民健身國家戰(zhàn)略的實施,本研究對知識圖譜驅動的健身運動知識智能查詢系統(tǒng)進行了探索,提出了涵蓋知識抽取與表達、知識整合與管理、知識查詢與問答于一體的實施方案。然而,在實施技術路線和方法等方面,仍面臨一些挑戰(zhàn)和問題。因此,需要進一步探究如何更高效、精準地整合與管理健身運動領域知識信息,進而為健身運動知識智能查詢的實施提供基礎和參考。

參考文獻:

[1] 郭衛(wèi)寧,司莉. 國外語義搜索引擎調查與分析[J]. 圖書館情報工作,2013, 57(23): 121-129.

[2] KAMILARIS A, YUMUSAK S, ALI M I. WOTS2E: A search engine for a semantic web of things [C]//2016 IEEE 3rd World Forum on Internet of Things (WF-IoT). VA: IEEE, 2016: 436-441.

[3] 國務院關于印發(fā)全民健身計劃(2021—2025年)的通知 [EB/OL]. (2021-08-03)[2024-03-30]. http://www gov.cn/zhengce/content/2021-08/03/content_5629218.htm.

[4] 劉鵬,葉帥,舒雅,等. 煤礦安全知識圖譜構建及智能查詢方法研究[J]. 中文信息學報,2020,34(11): 49-59.

[5] 劉嶠,李楊,段宏,等. 知識圖譜構建技術綜述[J]. 計算機研究與發(fā)展,2016,53(3):582-600.

[6] 婁國哲,王蘭成. 基于知識圖譜的網(wǎng)絡輿情知識組織方法研究[J]. 情報理論與實踐,2019,42(1):58-64.

[7] 趙雪芹,路鑫雯,李天娥,等. 領域知識圖譜在非遺檔案資源知識組織中的應用探索[J]. 檔案學通訊,2021,3: 55-62.

[8] 韓普,葉東宇,陳文祺,等. 面向多模態(tài)醫(yī)療健康數(shù)據(jù)的知識組織模式研究 [J]. 現(xiàn)代情報,2023,43(10):27-34, 151.

[9] 李振,周東岱,王勇. “人工智能+”視域下的教育知識圖譜:內涵、技術框架與應用研究[J]. 遠程教育雜志,2019,37(4): 42-53.

[10] 張鶴譯,王鑫,韓立帆,等. 大語言模型融合知識圖譜的問答系統(tǒng)研究[J]. 計算機科學與探索,2023,17(10): 2377-2388.

[11] 柯慶鏑,孫伯驁,薛冰,等. 產(chǎn)品性能關聯(lián)下綠色設計知識表達及獲取方法 [J]. 中國機械工程,2022,33(22):2717-2726.

[12] 李勇, 楊思敏, 郭尚窈, 等. “物-工藝-基因”三維視角下手工藝類非遺的本體知識表達研究[J]. 圖書情報工作, 2023,67(6):137-148.

[13] 丁華,常琦,楊兆建. 基于混合知識表示模型的采煤機規(guī)則庫構建與應用 [J]. 機械設計與制造,2016(5): 204-207.

[14] 劉培奇, 李增智, 趙銀亮. 擴展產(chǎn)生式規(guī)則知識表示方法[J]. 西安交通大學學報, 2004(6): 587-590.

[15] 李佳靜,黎榮,武浩遠,等. 面向多領域的轉向架知識本體表達及重用研究 [J]. 機械設計與制造,2019(4): 55-58.

[16] STUDER R, BENJAMINS V R, FENSEL D. Knowledge engin-eering: Principles and methods[J]. Data & Knowledge Engin-eering, 1998, 25(1/2): 161-197.

[17] CARDOSO S D, DA SILVEIRA M, PRUSKI C. Construction and exploitation of an historical knowledge graph to deal with the evolution of ontologies[J]. Knowledge-Based Systems, 2020, 194: 1-10.

[18] MAEDCHE A, STAAB S. Ontology learning for the semantic web[J]. IEEE Intelligent Systems, 2001, 16(2): 72-79.

[19] 王芳,楊京,徐路路. 面向火災應急管理的本體構建研究[J]. 情報學報,2020,39(9):914-925.

[20] 宋培彥,王晉明. 公共衛(wèi)生領域多本體知識融合方法及其實證研究[J]. 圖書與情報,2021(5):39-45.

[21] 許冬冬,林惠,段會龍,等. 健康行為改變干預本體的構建與應用[J]. 中國生物醫(yī)學工程學報,2023,42(1): 74-81.

[22] 陳曉婷, 毛太田. 文獻遺產(chǎn)本體構建——以《中國檔案文獻遺產(chǎn)名錄》為例 [J]. 圖書館論壇,2023,43(9):120-131.

[23] 楊濤,漆雋之,胡孔法,等. 知識驅動的中醫(yī)智能診療研究思路與方法[Z/OL].(2023-12-11)[2024-03-30]. http://kns.cnki.net/kcms/detail/21.1546.R.20231130.1320.002.html.

[24] 羅江華, 張玉柳. 多模態(tài)大模型驅動的學科知識圖譜進化及教育應用[J]. 現(xiàn)代教育技術,2023,33(12):76-88.

[25] 彭仕鑫, 肖彪, 趙正彩, 等. 航天復雜薄壁零件加工工藝知識圖譜構建及其應用[J]. 機電工程, 2024 , 41(4): 709-719.

[26] 趙一鳴. 知識圖譜是一種知識組織系統(tǒng)嗎? [J]. 圖書情報知識,2017(5): 2.

[27] 李愛華,徐以則,遲鈺雪. 本體構建及應用綜述[J]. 情報理論與實踐,2023,46(11):189-195.

[28] 王飛,易綿竹,譚新,等. 基于Neo4j對涉藏領域本體的存儲方法研究[J]. 鄭州大學學報(理學版), 2019, 51(2): 60-65.

[29] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// NIPS'17: Proceedings of the 31st Internatio-nal Conference on Neural Information Processing Systems. New York: Curran Associates Inc., 2017: 6000-6010.

[30] GUU K, LEE K, TUNG Z, et al. Retrieval augmented language model pre-training [C]// Proceedings of Machine Learning Re-search. Vienna: International Conference on Machine Learni-ng, 2020: 3929-3938.

[31] CHOWDHERY A, NARANG S, DEVLIN J, et al. Palm: Scalin-g language modeling with pathways[J]. Journal of Machine Learning Research, 2023, 24(240): 1-113.

[32] 車萬翔,竇志成,馮巖松,等. 大模型時代的自然語言處理:挑戰(zhàn)、機遇與發(fā)展[J]. 中國科學(信息科學),2023,53(9):1645-1687.

[33] 張鶴譯,王鑫,韓立帆,等. 大語言模型融合知識圖譜的問答系統(tǒng)研究[J]. 計算機科學與探索,2023, 17(10): 2377-2388.

[34] OUYANG L, WU J, JIANG X, et al. Training language models to follow instructions with human feedback[J]. Advances in Neural Information Processing Systems, 2022, 35: 27730-27744.

[35] AZAMFIREI R, KUDCHADKAR S R, FACKLER J. Large language models and the perils of their hallucinations[J]. Critical Care, 2023, 27(1): 120.

[36] PAN S, LUO L, WANG Y, et al. Unifying large language mode-ls and knowledge graphs: a roadmap[J]. IEEE Transactions on Knowledge and Data Engineering, 2024, 36(7): 3580-3599.

[37] NOY N F, MCGUINNESS D L. Ontology development 101: A guide to creating your first ontology[J]. International Journal of Engineering and Technology, 2001, 3(1): 1-9.

兴文县| 鹤岗市| 米易县| 雷州市| 孟津县| 双鸭山市| 明星| 宣化县| 息烽县| 闸北区| 和平县| 平利县| 庆云县| 西畴县| 华池县| 贵南县| 大化| 千阳县| 湾仔区| 北辰区| 土默特左旗| 兰西县| 河北省| 西宁市| 镇坪县| 尼木县| 永嘉县| 平罗县| 潜江市| 保德县| 上蔡县| 白朗县| 巴彦县| 广宁县| 榆中县| 拜泉县| 平武县| 巨鹿县| 富川| 施秉县| 剑河县|