国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

小學語文教學語料庫的設計與開發(fā)

2015-11-05 20:03:04李艷芳
課程教育研究·學法教法研究 2015年22期
關鍵詞:設計與開發(fā)語料庫小學語文

李艷芳

【摘要】采用建立語料庫的方式對提高小學語文教學質(zhì)量有一定積極意義。但是需要在充分了解建立小學語文教學語料庫的目的與大致方向的基礎上進行設計與開發(fā),才能夠充分保證其完成建設后的作用的發(fā)揮。本文以小學語文教學語料庫的設計與開發(fā)為中心,在完成設計的基礎上進行開發(fā),旨在為實際的小學語文教學提供切實可行的理論基礎。

【關鍵詞】小學語文;語料庫;設計與開發(fā)

【中圖分類號】G623.2

0.引言

小學語文教學語料庫的設計與開發(fā)是以電子形式保存的語言材料,借助相關的技術(shù)手段,充分以小學語文教學為基石,有效解決在小學語文教學中存在的各種問題,特別是解決語文閱讀資源的篇章檢索、詞語檢索和句子檢索。

1.小學語文教學語料庫的設計

1.1小學語文教學語料庫的設計原則

本次建立的小學語文教學語料庫是以人教版小學語文教科書為基礎,充分以小學生的認知水平與閱讀角度建立,在體現(xiàn)出一定的閱讀趣味性的基礎上充分貼合學生,因此在設計過程中語料庫的建立收納的內(nèi)容主要以趣味性較強的兒童文學作品為主,例如各種兒歌,順口溜,童話故事等等。各種材料的收集均體現(xiàn)出以學生為主的設計原則與設計理念[1]。另外在建立語料庫時,需要充分結(jié)合資料的多樣性,因為多樣性的文學材料才能夠更好的激發(fā)學生閱讀興趣[2]。另外,從語料庫的容量、形式以及樣本處理上都需要充分結(jié)合人教版小學語文語料庫的教學與研究需求。后期為了能夠方便檢索,達到最佳的檢索效果,需要將每一個收錄進語料庫的樣本當做一條數(shù)據(jù)記錄保存在數(shù)據(jù)庫中,如此一來就十分方便后續(xù)的查找,甚至利用一條句子就能夠進行全文的檢索。

1.2語料庫設計的容量

充分結(jié)合人教版的教科書,確定語料庫中需要包含多少個詞匯。由于在設計語料庫的過程中不同的設計原則、設計方式其最終的語料庫在內(nèi)容、形式上都會不同。本次在設計的過程中,考慮到人教版小學語文教科書特點,將原始預料全部切分成為長度在2500-6000字次之內(nèi)的一個片段,并以此作為樣本。同時也考慮了實用整個原始文本作為樣本的方式,但是考慮到后期的檢索方式,因此暫不考慮[3]。考慮到本次語料庫的建設主要是以后期的小學語文的拓展閱讀提供良好的閱讀資源,因此檢索得到的結(jié)果一定要是一個完整的文本。所以綜合性考慮,檢索功能中使用關鍵詞的方式,在結(jié)合人教版小學語文教科書特點的基礎上設計語料庫。

1.3語料庫設計的形式

分析人教版小學語文教科書中的教學內(nèi)容,考慮語文教學的特性。由于此次語料庫的建設其內(nèi)容全部都是屬于文學一類,而文學類的內(nèi)容其形式比較多樣,而這一點也正好符合了小學語文教學與建立語料庫的特點,形式的選擇可以將趣味性比較豐富的兒歌、順口溜、詩歌、童話、謎語、寓言故事等等收錄其中。

1.4語料庫設計的處理

本次的語料庫的樣本處理由于僅針對人教版的小學語文教科書,因此采用的是人工標注的形式,將收錄的樣本按照詞性、語法、語義、語用等不同標簽進行標注。另外考慮到語料庫的檢索功能的需求,此次語料庫建設過程中采用了兩種不同的檢索方式,進行樣本的處理。一種是將確定收錄進語料庫的樣本劃分成為一個一個的句子,然后將每一個句子以數(shù)據(jù)記錄的方式輸入進語料庫中,利用檢索工具使用關鍵詞進行檢索。另外一種則是將每一個語料樣本作為一個數(shù)據(jù)記錄輸入進語料庫中,同樣利用檢索功能使用關鍵詞進行檢索,最終目的是得到一個對全文的搜索。

2.小學語文教學語料庫的開發(fā)

首選理清開發(fā)的過程,包含了采集語料、加工語料庫、開發(fā)語料庫的檢索功能等。同時配備一定的技術(shù)手段,進行開發(fā)。

2.1開發(fā)第一步——采集語料

(1)可以直接從互聯(lián)網(wǎng)上下載各種現(xiàn)成的資料,同樣利用關鍵詞搜索方式在百度上進行搜索,將需要的各種資料下載下來,作為語料庫中的主要內(nèi)容。

(2)將從互聯(lián)網(wǎng)上下載的所有資源進行處理,選擇合適的文本形式,參考標準的格式本文進行所有資源的整理。

2.2開發(fā)第二步——加工語料庫

對語料庫進行加工實際上就是對語料庫內(nèi)容的加工,而根據(jù)語料庫中的不同形式的內(nèi)容其加工主要是針對句子的加工與篇章的加工。

(1)針對句子的加工,主要是利用正則表達式將篇章劃分為若干個句子,確定每個句子的長度并將劃分好的句子輸入進劃定的句子數(shù)據(jù)庫中。一般,判斷是否為一個句子一般是看句子后面是否有“?!薄埃俊薄?!”之類的符號,如果是英文中那就是“.”“?”“!”。

(2)針對對一個篇章的加工,為了能夠方便檢索,需要對每一篇收錄的文章進行關鍵詞標注,這種標注可以采用人工標注或者自動標注的形式。兩種標注形式都有其利弊[4]。人工標注其得到的結(jié)果更加容易理解,但是比較費時費力,另外準確率低于自動標注。而自動標注結(jié)果雖然可能不容易理解,但是十分適用于內(nèi)容含量較大的語料庫,十分省時省力,準確率一般會高于人工標注,并且這種標注是來源自真實文本,可信度較高。兩者對比分析發(fā)現(xiàn),利用計算機進行語料庫的加工會更加有效。

2.3開發(fā)第三部——開發(fā)語料庫的檢索功能

(1)句子檢索。句子檢索可以使用關鍵詞進行檢索,利用某個關鍵詞,另外設定跨距來限定關鍵詞的左右語境范圍。如果需要得到更多的檢索結(jié)果需要擴大檢索的上下文語境的范圍。通過這種方式能夠?qū)崿F(xiàn)對關鍵詞、短語等句子的檢索,同時得到的檢索結(jié)果使用者可以隨意的復制與保存。

(2)文章檢索。文章的檢索則包含了文章的作者、標題、出處甚至是整個文章的全文等等。針對標題、作者等可能重復性較高的可以使用模糊匹配功能,這點以輸入法中的模糊音設置有一定的相似性。

3.結(jié)語

小學語文教學的語料庫的設計目的在于為小學生提供適合不同年級的各種符合其認知水平的兒童文學作品,在豐富的小學語文教材資料的基礎上幫助提高小學語文教學質(zhì)量。這種通過書面語或者口語的樣本匯集起來的實際上就是語文語言中的一種。不斷的積累與匯集能夠反映出小學語文在實際教學與應用中的情況,對我國小學語文教學的發(fā)展是很有積極作用的。

【參考文獻】

[1]魏順平,何克抗.小學語文教學語料庫的設計與開發(fā)[J].中國電化教育,2007,13(06):66-69.

[2]黃梅紅.試析小學語文教學語料庫的設計與開發(fā)[J].現(xiàn)代閱讀(教育版),2013,19(10):220.

[3]楊紅.學語文教學語料庫的設計與開發(fā)[J].課外語文(初中),2013,11(02):56.

[4]馬曉霞.淺議小學語文教學語料庫的設計與開發(fā)[J].課程教育研究,2013,51(19):45-46.

猜你喜歡
設計與開發(fā)語料庫小學語文
《語料庫翻譯文體學》評介
把課文的優(yōu)美表達存進語料庫
淺談高中生物教學中微課程的設計與開發(fā)
文理導航(2016年32期)2016-12-19 21:53:57
信息化在《Flash動畫制作》課程中的設計與應用研究
優(yōu)化朗讀技巧,提升語文實效
淺談如何培養(yǎng)學生的閱讀興趣
讓多媒體課件為閱讀教學助力
撥動情感之弦,讓語文課堂綻放精彩
基于WebGL的三維物理模型設計與開發(fā)
增強現(xiàn)實技術(shù)在移動學習中的應用芻議
元阳县| 开江县| 龙门县| 德江县| 曲麻莱县| 合阳县| 兰西县| 盐源县| 镇平县| 苍南县| 盐边县| 普兰店市| 泊头市| 鞍山市| 烟台市| 广饶县| 平远县| 布拖县| 平安县| 西城区| 平泉县| 深水埗区| 赤峰市| 肥乡县| 永寿县| 青川县| 马山县| 长汀县| 长治县| 广安市| 壶关县| 榕江县| 磐安县| 敦煌市| 阳西县| 甘德县| 庐江县| 衡南县| 巴南区| 合作市| 武清区|