国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語料的腦卒中護理領域本體的構建

2023-01-09 10:58韓世范崔曉芳朱瑞芳
護理研究 2022年23期
關鍵詞:詞表語料護理學

張 映,韓世范,*,曹 妍,薛 佳,崔曉芳,朱瑞芳

1.山西醫(yī)科大學,山西 030001;2.山西醫(yī)科大學第一醫(yī)院;3.山西醫(yī)學期刊社有限責任公司

腦卒中又稱為腦中風,其發(fā)病率、致殘率、致死率、復發(fā)率、經(jīng)濟負擔方面等均較高[1],而我國在世界范圍內屬于腦卒中患病率、發(fā)病率和死亡率較高的國家之一[2]。目前,醫(yī)療信息化建設在我國已經(jīng)得到了廣泛且快速的發(fā)展,許多研究者將腦卒中與大數(shù)據(jù)結合進行了相應研究,如劉盾等[3]采用K-means 聚類算建立了腦卒中病人并發(fā)相關肺炎的預測模型。醫(yī)療信息系統(tǒng)的廣泛建立、大數(shù)據(jù)信息的產(chǎn)生與收集、數(shù)據(jù)挖掘技術的發(fā)展使護理研究成了護理實踐過程中發(fā)現(xiàn)問題重要工具,通過超級計算機、機器語言的開發(fā)使收集到的數(shù)據(jù)指標通過系統(tǒng)、科學的研究方法和專業(yè)化的研究評價該問題,直接或間接指導護理實踐,改進護理工作,提高護理質量[4]。如今的信息產(chǎn)生迅速,大部分信息都是用非結構化的方式存儲的。數(shù)據(jù)庫來自不同的生產(chǎn)商,其網(wǎng)絡環(huán)境和檢索功能各不相同,護理科研人員在獲取文獻的過程中不僅需要經(jīng)常反復在各數(shù)據(jù)庫之間切換,還要熟悉各數(shù)據(jù)庫的收錄范圍和檢索方法,致信息檢索不便[5]。大量的專業(yè)人員開始進行探索和研究,試圖尋找一種合適的數(shù)據(jù)模型提高對自然語言的語義分析、特征提取算法,由此“本體”被引入了計算機領域。本體相當于一種知識的組織形式和表現(xiàn)形式,可以展示某一領域的概念和詞匯,還可以展示這些概念和詞匯之間的邏輯關系,并且可以外延出概念間、關系間之外的新的規(guī)則[6],所以本體在計算機技術的發(fā)展中發(fā)揮著重要的作用,研究人員也都探討將一個領域的知識及詞語間的關系建成一個本體,利用本體進行語義分析,提高信息檢索的查全率和查準率[7]。目前,國內外已經(jīng)建立了很多疾病本體運用于疾病監(jiān)測、科學決策、生活指導等多個方面,如囊性纖維化本體[8]、肝炎本體[9]、2 型糖尿病生活干預本體[10],但這些本體的構建都是從醫(yī)學角度進行分析,護理內容較少。國際公認的護理系統(tǒng)也有很多,如美國護理協(xié)會認可的護理干預分類系統(tǒng)、家庭保健分類系統(tǒng)、奧馬哈系統(tǒng)等,這些系統(tǒng)主要依靠簡單的枚舉或組合方法構建,但很多詞匯與本體論有一定差異,單詞派生的不同、顆粒度級別的差異導致這些系統(tǒng)中擁有的相似之處無法被利用。臨床與科研是相輔相成、渾然一體的。護理科研的發(fā)展來源于臨床護理實踐[11],課題應來源于臨床實踐,護理研究的成果應用于指導護理實踐。所以,本研究旨在從護理角度構建腦卒中護理領域本體,從而設計護理領域本體構建模型,以便多個系統(tǒng)之間的術語能交互使用。

1 研究方法

1.1 語料收集與分類建模

1.1.1 原始語料來源 本研究原始語料來源廣泛、形式多樣,從臨床實踐經(jīng)驗到護理學教材,從紙質版教材到XML 文件。在計算機領域專家的建議下,經(jīng)過團隊討論,以研究者在神經(jīng)內科、神經(jīng)外科臨床實踐過程中獲得的腦卒中護理相關知識為基礎,從《內科護理學(第6 版)》《外科護理學(第6 版)》《護理學基礎(第6版)》《健康評估(第6 版)》等教材中選取關于腦卒中護理的相關知識,包括《外科護理學(第6 版)》中第十五章第一節(jié)腦卒中護理學知識,《內科護理學(第6 版)》第十章神經(jīng)系統(tǒng)疾病病人的護理中第五節(jié)關于腦梗死、腦出血、蛛網(wǎng)膜下腔出血病人的護理知識。在全國圖書館參考咨詢聯(lián)盟中以“腦卒中護理”“書名”O(jiān)R“腦卒中護理”“主題詞”O(jiān)R“腦卒中護理”“全部字段”為檢索詞進行檢索,經(jīng)過去重后獲得書籍21 本,經(jīng)小組討論,將無法獲取電子版的書籍進行排除,最終獲得14本腦卒中護理書籍。由研究人員詳細閱讀每本書籍內容,根據(jù)內容詳細程度、結構化程度進行討論,選取《腦卒中高級護理臨床實踐》《腦卒中康復護理》《腦卒中中醫(yī)特色康復護理規(guī)范》《腦卒中專科護理》《社區(qū)腦卒中病人康復護理技術》《腦卒中的康復護理》《急性腦卒中護理》7 本作為原始資料。此外,還選取《神經(jīng)內科護理手冊(第2 版)》[12]關于腦卒中護理的內容進行補充。通過上述語料收集到眾多腦卒中病人常見的護理診斷,查閱《護理診斷、結局與措施》尋找每項護理診斷所對應的護理結局名稱和護理措施名稱,參考《北美護理診斷協(xié)會(NANDA)-Ⅰ護理診斷》補充每個護理診斷的內容,參考《護理措施分類(第5 版)》收集相應的護理措施,參考《健康評估(第6 版)》收集含有該項護理診斷的評估項目,護理目標來源于《護理結局分類(第3 版)》中原有的組織化結構。本研究以臨床實踐中獲取到的腦卒中病人常用藥物為基礎,選取《臨床藥物手冊(第5 版)》對其進行補充和擴展,從內科、外科角度出發(fā)收集腦卒中病人用藥。

1.1.2 原始語料收集方法 采用文獻回顧法,由研究者系統(tǒng)回顧全國高等教育護理學教材、神經(jīng)內科護理手冊、神經(jīng)外科護理手冊、腦卒中護理書籍、護理診斷、護理結局等文獻中關于腦卒中護理的相關知識,了解腦卒中護理現(xiàn)狀。同時,計算機檢索國內外腦卒中相關網(wǎng)站中的腦卒中指南,并收集腦卒中護理知識。以臨床實踐中收集到的腦卒中護理知識為基礎,對其進行內容、結構化和屬性特征分析,選取最具有結構化和屬性特征的內容。最后,將所有XML、PDF、EXCEL等形式的原始資料轉換為Word 格式的文本,并對其內容采用人工方式一一進行校對。

1.2 屬性字段標注 語義分析對原始語料進行精加工的過程,通過對原始語料進行屬性標注,形成屬性詞表,并構建數(shù)據(jù)庫字段結構,同時也方便后續(xù)的語料解析。屬性字段是指一段文本所要闡述的內容,通過屬性字段觀察即可了解到該段問題主要簡述的內容,為了便于計算機識別和分析,需要對收集的所有腦卒中護理的資料進行屬性字段設置。根據(jù)護理學教材、腦卒中護理的相關書籍、現(xiàn)有的藥物本體、臨床藥物手冊、神經(jīng)內科護理手冊、神經(jīng)外科護理手冊等廣泛收集護理常用的屬性字段,并分析概念、屬性字段、文本內容之間的三元組關系,通過語義分析將收集到的腦卒中護理原始資料進行屬性字段的設置。由小組另一個成員對所設置的屬性字段進行檢查,發(fā)現(xiàn)同一性質的內容不同的文件庫中的屬性設置不同,在計算機專家的建議下,需對具有相同性質的屬性字段名稱進行分析和統(tǒng)一。

1.3 分類建模 在本體構建中,分類的目的是基于資源構建層級的概念模型,目前已有眾多的分類方法,包括中圖法、MeSH 詞表、護理診斷分類、護理措施分類、護理結局分類[13]等,這些分類方法都為腦卒中護理領域本體構建的分類提供了借鑒。本研究采用混合性方法將上述獲得的腦卒中護理的相關知識進行分析,在中圖法、MeSH 詞表、護理程序等中檢索其所在的位置,尋找上級類目和下級類目,根據(jù)上級類目進行尋根,找出其所在的護理領域范圍,查看其下級類目或子類,判斷哪些護理學知識可以作為其下級類目。如果中圖法和MeSH 詞表的護理部分對某些護理內容并沒有進行類目設置,本研究將參考醫(yī)學中的類似名稱的類目體系進行護理類目級別的新增,以盡量全面涵蓋腦卒中護理的相關知識。

1.4 Word 文檔解析入Solr 庫 XML Schema[14]可以通過定義所收集文檔中的元素、屬性、子元素、子元素的次數(shù)和數(shù)目、元素是否為空或包括文本、元素和屬性的數(shù)據(jù)類型、默認值和固定值來定義文檔的合法構建模塊?;贘AVA 環(huán)境,使用開發(fā)工具IDEA 或Eclipse,將進行標注后的Word 文檔運用XML Schema的描述語言,通過預先規(guī)定XML 的元素和屬性,定義XML 文檔的結構和內容,運用解析插件,遵循一定的開發(fā)規(guī)范編寫,形成結構化的XML 代碼,實現(xiàn)了從原始Word 文檔到再生資源的轉換。腦卒中疾病護理中,先定義元素“nursing routing”,將其注釋為“疾病護理”,再將其設置為復合元素類型,復合元素是指該元素之下還包括其他元素或屬性。護理實踐庫內容龐大,包括多種類型的護理,各類型原始資料之間有很多相同的屬性名稱,所以先在護理實踐中引用共有的屬性類別,然后再將各復合元素獨有的屬性類別分別進行引用設置,之后再將各個元素的注釋一一進行編寫。運用XMLSpy 軟件作為Schema 的開發(fā)環(huán)境。在Solr數(shù)據(jù)庫中進行索引配置與解析。

1.5 Sorl 庫索引庫抽檢 入庫的過程中或許因為代碼編寫錯誤、字段設置或系統(tǒng)等問題出現(xiàn)入庫不全、資料解析不全或位置錯誤等問題,為保障資料的合理性,采用人工的方法對入庫后的內容進行抽檢,從每個文件中隨機選取2 個及以上的標題內容進行人工檢驗與核對。如護理常規(guī)選取的“腦出血”“腦梗死”“缺血性腦血管病護理”,檢索式為:“type:護理疾病”AND“title:腦出血OR 腦梗死OR 缺血性腦血管病護理”。將抽檢到的問題進行匯總,與相關技術人員進行討論交流,依次對問題進行解決,然后再進行抽檢,直至無誤。

1.6 詞表構建

1.6.1 概念詞表構建 采用人工詞表構建的方法將原始資料中所涉及的概念名詞按照文件分類的方法進行等級劃分和概念收集。解剖部分的概念名詞則直接運用現(xiàn)有的本體MeSH 詞表,因MeSH 詞表既具有一定的權威性且各概念名詞之間形成了嚴格的等級結構,可以為本研究的解剖部分直接使用,也符合本體構建過程中復用現(xiàn)有本體的理念。在概念收集的過程中難免出現(xiàn)重復的情況,需要進行合并去重、整合去重[15]。

1.6.2 屬性詞表本體關聯(lián)構建 屬性詞表主要包括概念類別(定義域)、屬性名稱、屬性類別、值域、取值資源、檢索字段、返回字段。概念類別,即定義域,是指腦卒中護理領域中的概念大類,例如概念詞表的“疾病”“護理診斷”“操作護理”“康復護理”等均為概念類別,每個概念類別均需對其進行屬性設置,為避免遺漏,本研究將所有的概念類別進行列舉,之后再對其進行屬性設置。屬性類型包括固有的基礎屬性和專業(yè)屬性?;A屬性是指固定、確定的或具有專業(yè)認同性、公認性的,不會因某些因素的變化而發(fā)生改變的屬性,或者可以自身獨立,與其他概念類別之間無需關聯(lián)的概念類別;專業(yè)屬性是指可以使兩組概念之間產(chǎn)生關聯(lián)的屬性名稱。

1.6.3 同義詞詞表構建 同義詞詞表分為兩種,一個為概念同義詞詞表,另一個為屬性同義詞詞表。概念可以反映某一事物具有的本體屬性或特有屬性,某一個概念可能具有不同的叫法,即術語,一種對概念的語言指稱[16]。為了擴大知識獲取范圍,尤其是為了獲得盡可能多的語料,將設置相應的概念同義詞詞表,如“CVC”是“中心靜脈置管”簡稱,可以將“CVC”認為是“中心靜脈置管”的同義詞。

1.7 專家咨詢 為了保證本體關聯(lián)的科學性,研究過程中不斷進行文獻研討、小組討論和專家咨詢,進行評價和修改。本研究是對腦卒中護理領域的本體構建研究,所以經(jīng)過團隊成員的反復討論、修改,認為該本體必須突出護理特色,圍繞護理理論開展腦卒中護理,所收集的概念術語必須有所屬類目。將概念詞表和屬性詞表采用面對面的方式與小范圍的護理專家進行咨詢。專家入選標準[17]:副高級及以上職稱;從事本專業(yè)工作≥10 年;本科及以上學歷;具有嚴謹求實的科研工作態(tài)度,自愿參與;前3 條符合2 條即可。于2022 年1 月向山西省14 名、上海市1 名護理學專家進行咨詢,專家年齡(46.07±6.76)歲,從事神經(jīng)內科、神經(jīng)外科、急診、重癥監(jiān)護、護理教育工作多年,具有豐富的科研、臨床、管理、教學經(jīng)驗。因概念詞表內容過多,所以在進行專家咨詢問卷制作時對一級類目、二級類目進行了全部展示,為便于了解二級類目下的內容,因此保留了部分三級類目。交談過程中先從研究背景、目的、研究過程、詞表來源等多個方面對本研究進行了詳細介紹,然后由專家查閱詞表,及時反饋專家提出的問題,并將建議及時準確地進行記錄。

2 結果

2.1 原始語料收集結果 經(jīng)過大量的文獻回顧和小組討論后,最終獲得的腦卒中護理資料主要包括管路護理要點、護理操作并發(fā)癥的預防處理、常用操作流程、腦卒中疾病的內科外科護理常規(guī)、腦卒中并發(fā)癥護理、危急值管理、分級護理制度、護理敏感指標、適用于腦卒中病人的一般性評估量表和專科評估量表、專科檢查護理、體格檢查、常見合并癥及并發(fā)癥康復護理、常見康復護理操作技術、康復工程-常用康復工具的使用、常見功能障礙康復護理、社區(qū)康復護理指導、運動護理、中醫(yī)康復護理技術、作業(yè)治療護理、心理分期護理、中醫(yī)心理護理、三級預防護理、藥物治療護理、腦卒中神經(jīng)介入治療的護理、外科手術護理、特殊治療操作護理、腦卒中危重癥的主要監(jiān)測項目、腦卒中危重癥病人的護理、重癥監(jiān)護技術、腦梗死、腦出血全責護理規(guī)范及工作流程、健康教育、腦血管解剖結構、飲食護理、腦卒中常見護理診斷、護理結局評價、護理措施等眾多腦卒中護理資料。

2.2 分類建模結果 根據(jù)上述分類方法,結合計算機專家醫(yī)學領域本體構建的經(jīng)驗,經(jīng)過團隊多次的討論、修改,最終將腦卒中護理領域資料進行了以下分類:以腦卒中護理為中心分為疾病護理、藥物治療護理、護理實踐和解剖四大類。

2.3 專家基本信息及權威程度 專家基本信息見表1。專家權威程度用權威系數(shù)(Cr)表示[18],由專家判斷依據(jù)和熟悉程度計算而來,本研究專家的判斷依據(jù)為0.92,專家熟悉程度為0.68,專家權威系數(shù)為0.80。

表1 專家基本信息(n=15)

2.4 本體構建結果 根據(jù)專家意見,研究團隊進行了詳細討論,最終形成概念類別20 個,概念共1 917 個,屬性關聯(lián)詞表共獲得154 條。概念類別中含屬性名稱最多的為“疾病和癥狀”,共19 個屬性名稱,占12%,其次為康復護理,含有17 個屬性名稱,占11%,說明在資料收集和屬性標注過程中疾病、癥狀收集的資料相對較全,屬性標注的較為細致;康復護理因包括操作、訓練、中醫(yī)、社區(qū)、工具等多種護理類型,所以其屬性名稱也較多。屬性詞表中概念類別情況見表2。

表2 屬性詞表中概念類別情況

3 討論

3.1 腦卒中護理原始語料收集 在原始資料收集過程中雖然研究人員已經(jīng)從教材、腦卒中護理書籍、護理手冊、臨床實踐、護理學詞典等多個領域廣泛收集腦卒中護理領域的相關資料,但因本研究需提供Word 文檔,必須將所有資源進行格式轉換和文本校對,需耗費大量的人力、物力和財力資源[19]。加之研究時間有限,無法完全收集到所有關于腦卒中護理的資料,存在一定的遺漏現(xiàn)象。隨著醫(yī)療技術的不斷發(fā)展、新藥物的研發(fā),會有很多新概念詞的出現(xiàn),所以本體是一個隨著時代的發(fā)展而不斷完善的過程[20]。并且該本體系統(tǒng)具有自學習機制,所以在后續(xù)的研究中將繼續(xù)收集腦卒中護理的相關語料,對現(xiàn)有的本體進行擴充。

3.2 腦卒中護理相關量表 本研究在前期資料收集過程中通過臨床實踐和相關數(shù)據(jù)獲得30 余個腦卒中病人常用量表,但因系統(tǒng)問題,無法進行表格識別和解析,所以在后續(xù)解析入庫中并未將量表進行解析,因此在本體驗證階段會出現(xiàn)某些概念或屬性無法識別的現(xiàn)象,在后續(xù)的研究中將考慮改進系統(tǒng)或進行格式轉換,努力實現(xiàn)表格文本的解析入庫。

3.3 機器學習 目前,機器學習算法在漢語方面的研究已經(jīng)取得不錯的成績,但因數(shù)據(jù)量比較低,中文分詞在漢語言的處理上較難[21],從而導致機器學習的效果并不是很好,可能是因為機器學習其本體是建立在大量的數(shù)據(jù)基礎之上的,數(shù)據(jù)量越大,其學習效果越佳,準確度越高。對腦卒中護理知識進行本體構建之前,需要對腦卒中護理書籍進行數(shù)據(jù)挖掘,即運用現(xiàn)代科學的技術手段對腦卒中護理內容進行深度加工和整理,此過程非常復雜且十分困難,在概念自動獲取和領域概念屬性關系自動獲取方面具有很大的挑戰(zhàn)性,希望相關學者在后續(xù)研究過程中不斷進行完善和改進。

4 小結

經(jīng)過專家咨詢和系統(tǒng)展示,本研究通過語料建立了概念詞表、屬性詞表和本體關聯(lián),遴選的專家積極性和權威性都較好,研究結論可靠。本研究從腦卒中護理為切入點,通過腦卒中疾病的護理建立模型和本體,嘗試構建出其他疾病也適用的模型構建方法、模型構建結果及本體構建方法,為后續(xù)護理領域本體的構建提供參考。

猜你喜歡
詞表語料護理學
基于VOLT的藏漢雙向機器翻譯
《護理學報》第六屆編輯委員會成員名單
基于歸一化點向互信息的低資源平行語料過濾方法*
《護理學報》舉辦“護理科研與論文寫作”高峰論壇的第二輪通知
《護理學報》舉辦“護理科研與論文寫作”高峰論壇的第二輪通知
《護理學雜志》稿約
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
近十年國內外專業(yè)學術詞表建立文獻綜述*
瀕危語言與漢語平行語料庫動態(tài)構建技術研究
國內外語用學實證研究比較:語料類型與收集方法