国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

自然語言的發(fā)展與研究

2016-06-25 18:57賀召華
科教導刊·電子版 2016年14期
關(guān)鍵詞:研究方向發(fā)展

賀召華

摘 要 自然語言理解是人工智能研究重要的領(lǐng)域之一,同時也是目前前沿的難題之一。它研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法,是未來人工智能的核動力。因此理解自然語言理解以及自然語言理解技術(shù)的含義,闡述自然語言理解的研究及其相關(guān)應(yīng)用,綜述自然語言理解技術(shù)研究方向變化并對自然語言理解的發(fā)展前景進行分析和展望,是十分有意義的。

關(guān)鍵詞 自然語言 發(fā)展 研究方向

中圖分類號:TP391.1 文獻標識碼:A

自然語言俗稱人機對話,是人工智能的分支學科。研究用電子計算機模擬人的語言交際過程,使計算機能理解和運用人類社會的自然語言如漢語、英語等,實現(xiàn)人機之間的自然語言通信,以代替人的部分腦力勞動,包括查詢資料、解答問題、摘錄文獻、匯編資料以及一切有關(guān)自然語言信息的加工處理。自然語言理解是一門新興的邊緣學科,內(nèi)容涉及語言學、心理學、邏輯學、聲學、數(shù)學和計算機科學,而以語言學為基礎(chǔ)。自然語言理解的研究,綜合應(yīng)用了現(xiàn)代語音學、音系學語法學、語義學、語用學的知識,同時也向現(xiàn)代語言學提出了一系列的問題和要求。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現(xiàn)自然語言通信的計算機系統(tǒng),特別是其中的軟件系統(tǒng)。因而它是計算機科學的一部分。

1自然語言的特征

用自然語言與計算機進行通信,這是人們長期以來所追求的。因為它既有明顯的實際意義,同時也有重要的理論意義:人們可以用自己最習慣的語言來使用計算機,而無需再花大量的時間和精力去學習不很自然和習慣的各種計算機語言;人們也可通過它進一步了解人類的語言能力和智能的機制。實現(xiàn)人機間自然語言通信意味著要使計算機既能理解自然語言文本的意義,也能以自然語言文本來表達給定的意圖、思想等。前者稱為自然語言理解,后者稱為自然語言生成。因此,自然語言處理大體包括了自然語言理解和自然語言生成兩個部分。歷史上對自然語言理解研究得較多,而對自然語言生成研究得較少。但這種狀況近年來已有所改變。

自然語言處理,即實現(xiàn)人機間自然語言通信,或?qū)崿F(xiàn)自然語言理解和自然語言生成是十分困難的。造成困難的根本原因是自然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性。但從計算機處理的角度看,我們必須消除歧義,而且有人認為它正是自然語言理解中的中心問題,即要把帶有潛在歧義的自然語言輸入轉(zhuǎn)換成某種無歧義的計算機內(nèi)部表示。歧義現(xiàn)象的廣泛存在使得消除它們需要大量的知識和推理,這就給基于語言學的方法、基于知識的方法帶來了巨大的困難。

2自然語言的發(fā)展

60年代至70年代初期,研究工作一直停留在單詞的語音識別上,進展不大。直到70年代中期才有所突破,建立了一些實驗系統(tǒng),能夠理解連續(xù)語音的內(nèi)容,但是還限于少數(shù)簡單的語句。用文字輸入,使計算機“看懂”文字符號,也用文字輸出應(yīng)答。這方面的進展較快,70年代初期取得突破,中期以后又有所發(fā)展。目前已能在一定的詞匯、句型和主題范圍內(nèi)查詢資料,解答問題,閱讀故事,解釋語句等,有的系統(tǒng)已付諸應(yīng)用。由于絕大多數(shù)語種使用的是拼音文字,計算機識別拼音字母已無問題,而輸入又是按單詞分別拼寫,因此書面理解一般沒有切分音節(jié)和單詞的問題,只需直接分析詞匯、句法和語義。但是漢語用的是漢字,無論是用漢字編碼輸入還是將來計算機能直接認識漢字,都要首先解決切分單詞的問題,因為輸入就是一連串漢字,詞和詞之間沒有空隔。書面理解的基本方法是:在計算機里貯存一定的詞匯、句法規(guī)則、語義規(guī)則、推理規(guī)則和主題知識。語句輸入后,計算機自左至右逐詞掃描,根據(jù)詞典辨認每個單詞的詞義和用法;根據(jù)句法規(guī)則確定短語和句子的組合;根據(jù)語義規(guī)則和推理規(guī)則獲取輸入句的含義;查詢知識庫,根據(jù)主題知識和語句生成規(guī)則組織應(yīng)答輸出。目前已建成的書面理解系統(tǒng)應(yīng)用了各種不同的語法理論和分析方法,如生成語法、系統(tǒng)語法、格語法、語義語法等等,都取得了一定的成效。

3自然語言的研究方向

大約90年代開始,自然語言處理領(lǐng)域發(fā)生了巨大的變化。這種變化的兩個明顯的特征是:

(1)系統(tǒng)輸入:要求研制的自然語言處理系統(tǒng)能處理大規(guī)模的真實文本,而不是如以前的研究性系統(tǒng)那樣,只能處理很少的詞條和典型句子。只有這樣,研制的系統(tǒng)才有真正的實用價值;

(2)系統(tǒng)輸出:鑒于真實地理解自然語言是十分困難的,對系統(tǒng)并不要求能對自然語言文本進行深層的理解,但要能從中抽取有用的信息。關(guān)于自然語言真正理解的研究目前已取得進展。

語言是人類區(qū)別其他動物的本質(zhì)特性。在所有生物中,只有人類才具有語言能力。人類的多種智能都與語言有著密切的關(guān)系。人類的邏輯思維以語言為形式,人類的絕大部分知識也是以語言文字的形式記載和流傳下來的。因而,自然語言理解也是人工智能的一個重要核心部分。

參考文獻

[1] 黃培紅.自然語言理解的機器認知形式系統(tǒng)[J].湖南:計算機工程與科學,2007,29(6):l13-l16.

[2] 王小捷,常寶寶.自然語言處理基礎(chǔ)[M].北京郵電大學出版社,2002.

猜你喜歡
研究方向發(fā)展
邁上十四五發(fā)展“新跑道”,打好可持續(xù)發(fā)展的“未來牌”
從HDMI2.1與HDCP2.3出發(fā),思考8K能否成為超高清發(fā)展的第二階段
砥礪奮進 共享發(fā)展
改性瀝青的應(yīng)用與發(fā)展
大學生同輩群體研究的三個基本方向
數(shù)學教學離不開生活化課堂
“會”與“展”引導再制造發(fā)展
攜手同行 共建共享:怎么看我國發(fā)展不平衡
阿克陶县| 林周县| 双柏县| 卓尼县| 南澳县| 白沙| 汪清县| 中江县| 斗六市| 佳木斯市| 小金县| 沙河市| 文水县| 正蓝旗| 建德市| 金溪县| 固镇县| 沙河市| 家居| 武邑县| 永济市| 湟中县| 石泉县| 株洲市| 东宁县| 新绛县| 轮台县| 团风县| 大洼县| 天水市| 商南县| 赤峰市| 长岭县| 大竹县| 涿州市| 德兴市| 六盘水市| 白朗县| 志丹县| 夹江县| 奉贤区|