国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“采訪”的詞類標注問題探討
——一項基于雙層詞類范疇化理論的實證研究

2019-12-03 08:18
關鍵詞:采訪詞類規(guī)約

吳 銘

(四川外國語大學 研究生院,重慶400031)

兼類指一個多義的概括詞或詞項在社群語言系統詞庫層面擁有兩個及以上詞類范疇的語法多功能現象。動名兼類詞兼屬名詞和動詞兩個詞類。在詞典配例或釋義中,只表示一個詞性,如名詞或動詞;但在詞目詞中卻能同時兼屬名詞和動詞兩個詞性,表現為動名兼類詞。判斷一個詞目詞是否是動名兼類詞或其他兼類詞,可依據王仁強等人[1]基于雙層詞類范疇化理論提出的四個標準進行判斷,對于現代漢語而言,一般以前兩個標準為基礎,需考慮在整個社群語言系統中達到規(guī)約化或相變的詞以及這些詞的個例頻率與類型頻率,而且,應當基于語料庫的使用模式調查進行探索。

身處人工智能時代,運用語料庫大數據的方法進行語言學研究勢不可擋[2]。不過,由于人力、物力的限制,書本詞典更新速度較慢,記錄的詞一般為高度規(guī)約化的詞,對于舊詞新意或新造詞的記錄可能不如語料庫中的索引行中的示例句更新得快。

現代漢語由于詞(或字)與詞之間缺乏明確的界限,不同于英語,詞之間無空格隔開,所以對詞語的切分較為困難。另一方面,英語等印歐語的形態(tài)變化較為豐富,如動詞的過去式一般可用“-ed”表示,進行式可用“-ing”表示;而漢語則只能用諸如“著、了、過”等的詞進行標記,從形式上難以區(qū)分。因而,詞性標注也是中文信息處理領域較為困難的一個基礎環(huán)節(jié),尤其是對諸如“研究”“選擇”等動名兼類詞的處理更為困難。

詞性標注作為中文信息處理領域的基礎環(huán)節(jié),是后續(xù)如機器翻譯、命名識別等更高一級別的處理的研究基礎。所以,探討詞典中的詞類標注與語料庫的詞性標注是否一致,一方面,有助于打牢中文信息處理領域的基礎;另一方面,有助于幫助以漢語為外語的二語學習者學好漢語,尤其是將漢語詞典作為學習工具的學習者。

1 研究問題

1.1 理論基礎

詞類標注作為詞的句法功能的分類,在詞典編纂中極為重要。然而,一些主流的、權威的與漢語相關的詞典,如《現代漢語詞典》等,采用“簡約原則”指導詞類標注,堅持“兼類要盡可能少的原則”,在詞典編纂過程中,刪去了某些兼類詞的詞類標注。如“滑雪”這一概括詞在《現代漢語詞典》(第 5 版)的標注中是動名兼類詞(【滑雪】huáxuě①動腳蹬滑雪板,手撐滑雪杖在雪地上滑行。②名 體育運動項目之一。比賽分為高山滑雪、跳臺滑雪和花樣滑雪等)。但是,在第6和第7版中,卻刪去了名詞詞性的標注,只保留了動詞詞性(【滑雪】huáxuě①動 腳蹬滑雪板,手撐滑雪杖在雪地上滑行。②體育運動項目之一。比賽分為高山滑雪、跳臺滑雪和花樣滑雪等)。

現代英語中數量眾多的動名詞兼類詞的存在卻并未影響英語語法的描寫[3],在《現代漢語詞典》的編纂卻要對兼類詞堅守“奧卡姆剃刀原理”(Occam’s Razor),對兼類詞的詞性標注“簡單、粗暴”地刪減,這樣的詞典編纂理論值得商榷。而雙層詞類范疇化理論自提出以來就受到了各界學者的關注,但遺憾的是,基于該理論進行的實證研究還相對欠缺。因此,本研究為考察動名兼類詞的詞類歸屬問題,擬以“采訪”一詞為例,以雙層詞類范疇化理論模型為指導,考察《現代漢語詞典》(第5/6/7版)中對類似的動名兼類詞的詞類標注與語料庫的詞性標注是否一致,以期為動名兼類詞的詞類歸屬提供相關啟發(fā),為“采訪”一詞在現代漢語詞典中的詞類標注問題提供建議。

1.2 問題的提出

“采訪”一詞是不是動名兼類詞呢?這三則新聞標題中“采訪”詞例的詞類是如何呢?

(1)15次春節(jié)期間深入基層采訪 踐行 “四力”就要深入再深入(2019-02-12 來源:中國新聞出版廣電報)

(2)凌晨兩點來青島試戲,《流浪地球》主演屈楚蕭接受采訪,分享在青拍戲經歷 (2019-02-12來源:半島網)

(3)蔡徐坤不懼流言,其實看他的微博和采訪,他一直都在保護粉絲?。?019-02-15 來源:迷妹看娛樂)

國家語委現代漢語語料庫對“采訪”一詞的詞性標注均為動詞,但在(2)(3)中“采訪”一詞是動詞嗎?(3)中的“采訪”與“微博”處于并列關系,“他的”來修飾這兩個詞,是典型的名詞用法。“采訪”的動詞和名詞用法是否達到了規(guī)約化呢?

經過查詢,在《現代漢語》(第5/6/7版)中,“采訪”標注相同,標注如下。

【采訪】cǎifǎnɡ 動 搜集尋訪;調查訪問:~新聞|加強圖書~工作|記者來~勞動模范。

這樣人們對于詞的主觀理解和詞典編纂的標注出現了矛盾,那如何解決這一問題。

1.3 研究方法

語言使用理論(Usage-based Theory)認為,語言從本質上講是一個復雜適應系統,語言結構始終處于動態(tài)變化之中,語言結構是在使用中涌現出來的,而使用頻率在語言結構的固化和規(guī)約化過程中扮演著重要角色。規(guī)約化指存在于一個語言社團全體成員腦子里的模式和常規(guī),而規(guī)約化程度可通過語料庫方法進行檢測。

“簡約原則”只側重于語言層面詞庫中的詞類和言語層面句法中的詞類一方面。郭銳[4]認為詞匯層面的詞性就是詞語固有的詞性,需要在詞典中標明,句法層面的詞性是詞語在使用中產生,需要句法控制,但割裂了兩者之間的聯系。王仁強[1]指出,詞匯層面的詞類源于句法層面的詞類,但后者不等于前者,只有在句法中體現了規(guī)約化的句法屬性才等同于詞庫的詞類。而詞匯常規(guī)用法,只有在規(guī)模語料庫分析中方能發(fā)現。

王仁強的“雙層詞類范疇化”的理論模型是基于復雜適應系統的語言觀和語料庫的使用模式調查提出的。該理論指出:詞類范疇化發(fā)生在兩個層面,即言語層面詞庫中的詞類范疇化和社群語言層面詞庫中的詞類范疇化,前者是詞在言語層面不同句法位置上詞例的詞類范疇化,是說話者對包括指稱、陳述、修飾等命題言語行為功能的表達過程。后者體現為語言詞典中的詞類標注,是一個言語社群集體的自組織過程,其核心是規(guī)約化。概括詞的詞類屬性是會隨著詞例在言語中反復使用而發(fā)生演變的。根據這一模型,判斷一個詞的詞類屬性,首先要判斷它在言語層面中的詞類屬性是否達到規(guī)約化,從而進入到語言系統層面的詞庫中。判斷詞類的標準要從個例頻率、類型頻率、歷史分布和語域分布出發(fā)。其中最為明顯的是個例頻率和類型頻率。因此,筆者將通過這一模型,通過國家語委現代漢語語料庫進行檢索,運用命題言語行為功能(指稱和陳述)來分析“采訪”的個例頻率和類型頻率,觀察該詞的名詞用法情況。

2 研究結果與分析

2.1 研究結果

2.1.1 個例頻率

在國家語委現代漢語語料庫中,未標注詞性的“采訪”一詞共有417條索引行。其中,標注為名詞詞性的例句僅4條,占總數的0.96%;而標注為動詞詞性的例句高達413條,占總數的99.04%。雖然國家語委現代漢語語料庫將“采訪”一詞標注為名詞詞性的索引行較少,但并不表示不存在,4條例句如下。

第98條索引:在/p弄清/v新聞/n報道/v中/nd的/u思維/n活動/v形式/n以后/nt,/w記者/n就/d能/vu自覺/a地/u積極/a地/u運用/v它/r來/vd為/p采訪/n服務/v了/u。/w

第102條索引:我國/n記者/n邵飄萍/nh就/d有/v這樣/r一/m段/q采訪/n故事/n。/w

第138條索引:新聞/n的/u采訪/n、/w編輯/n、/w評論/n、/w寫作/n等/u是/vl新聞/n學/k中/nd的/u應用/v部分/n,/w它們/r有/v什么/r基本/a要求/n?/w目前/nt有/v什么/r新/a的/u發(fā)展/v?/w

第392條索引:《/w救亡/v日報/n》/w不/d登/v中央社/n和/c外國/n通訊社/n的/u消息/n,/w也/d不/d登/v廣告/n,/w它/r是/vl一/m張/q???v特寫/n、/w評論/n、/w實際/a采訪/n以及/c文藝/n作品/n為/vl內容/n的/u小報/n,/w這/r是/vl它/r的/u一個/mq重要/a特色/n。/w

對上述4條索引行進行全樣本分析后,發(fā)現一些類似的用法卻并未標注為名詞。鑒于樣本量不是太大,因此,以雙層詞類范疇化理論[1]為指導,通過命題言語行為功能進行了重新標注,研究結果發(fā)現“采訪”一詞表示指稱功能,具有名詞屬性的索引行共240條,占總數的57.55%;表陳述功能,具有動詞屬性的索引行共177條,占總數的 42.45%??梢姡安稍L”一詞在國家語委現代漢語語料庫中標注為名詞詞性的索引行多于標注為動詞詞性的。

2.1.2 類型頻率

“采訪”表指稱功能的用法模式共五種:“VP+采訪”“采訪(的)+NP”“采訪+VP”“量詞+采訪”和“Adj+采訪”,如表1所示;表陳述功能的用法模式共四種:“VP+采訪”“采訪+NP”“介詞+采訪”和“Adv+采訪”,如表 2所示。

表1 國家語委語料庫中“采訪”的指稱用法在各結構中的分布情況

表2 “采訪”的陳述用法

2.2 結果分析

2.2.1 個例頻率

國家語委語料庫中,標注為名詞詞性的共占總數的57.55%;標注為動詞詞性的共占總數的42.25%,動詞詞性所占比例少于名詞詞性所占比例。動詞的用法已收錄進紙質詞典,可見動詞的用法頻率達到了規(guī)約化的程度。然而,相較于動詞用法而言,“采訪”一詞作為名詞的頻率較高,超過了動詞的規(guī)約化程度。

2.2.2 類型頻率

在指稱用法模式中“采訪(的)+NP”“Adj+采訪”類型所占的比例大,各占64.58%和23.75%,“~(的)對象”“記者(的)~”等符合語言的使用模式,且在生活中較為常見,結構類型突出。就個例頻率和類型頻率來看,“采訪”的名詞性用法在詞典中應標注為動名兼類詞,具體應為:【采訪】cǎifǎnɡ 動、名 搜集尋訪;調查訪問:~新聞|加強圖書~工作|記者來~勞動模范。

3 討論

基于雙層詞類范疇化理論,以“簡約原則”為詞類標注的黃金準則似乎存在一些問題:對于概括詞和個體詞(詞例)的不同詞類范疇并未進行較好地區(qū)分。而雙層詞類范疇化理論關注語言和言語兩個層面,運用大型語料庫進行檢索分析,注意到了“簡約原則”忽視的言語層面,分析數據的方法較為科學。但是就“采訪”的詞類標注,本文存在著一些不足之處:一方面,本文只對國家語委現代漢語語料庫進行檢索,樣本的選取可能只關注于某一領域,可能某種類型模式多,從而導致其類型頻率多,致使其詞類范疇所占的比例大,使數據存在偶然性。所以“采訪”的詞類標注還要借助其他大型語料庫的語料。另一方面,頻率的高低并不是規(guī)定規(guī)約化程度的最重要的唯一標準,判斷詞類的標準要從個例頻率、類型頻率、歷史分布和語域分布出發(fā),所以雙層詞類范疇模型的運用從這四個方面進行調查研究將更加科學,更具有說服力。

4 結語與展望

綜上所述,不少學者割裂了詞匯層面的詞性和句法層面的詞性,采用“語義不變,詞類不變原則”和“簡約原則”。《現代漢語詞典》中的兼類詞,特別是動名兼類詞只保留其動詞詞類,導致人們對詞典中的詞類編纂產生疑惑。

鑒于此,本文基于國家語委現代漢語語料庫,采用雙層詞類范疇化理論對“采訪”的詞類標注進行重新判定,研究結果發(fā)現“采訪”表指稱類結構多樣,某些種類模式在生活中頻繁出現,在語言層面已達到規(guī)約化模式,因此,在社群語言系統層面應屬于動名兼類詞。

基于雙層詞類范疇模型理論和語料庫的調查模式可能有助于克服“簡約原則”的不足,遵循語言的事實。但對詞類的判斷應當綜合多個方面,從個例頻率、類型頻率、歷史分布和語域分布出發(fā)(現代漢語一般以前兩個為主),同時結合多個大型語料庫進行調查分析,以使詞典編纂更符合語言使用事實。

猜你喜歡
采訪詞類規(guī)約
傳統自然資源保護規(guī)約的民俗控制機制及其現實意義
基于無線自組網和GD60規(guī)約的路燈監(jiān)控系統的設計
用詞類活用法擴充詞匯量
基于語料庫“隱秘”的詞類標注初步探究
從成語中學習詞類活用
一種在復雜環(huán)境中支持容錯的高性能規(guī)約框架
一種改進的LLL模糊度規(guī)約算法
基于“字本位”理論再談漢語詞類問題
美媒估計《采訪》虧了3000萬
漾濞| 沅陵县| 通道| 五莲县| 平和县| 上饶县| 沁水县| 乐至县| 新民市| 双峰县| 鞍山市| 杂多县| 绥化市| 盈江县| 墨玉县| 昌乐县| 义马市| 桃源县| 都匀市| 普定县| 永仁县| 黔江区| 衡南县| 资兴市| 宿州市| 新巴尔虎右旗| 来凤县| 靖江市| 东乌珠穆沁旗| 抚松县| 黄大仙区| 沅陵县| 通化县| 石嘴山市| 通江县| 连州市| 双辽市| 广德县| 长沙县| 岑溪市| 筠连县|