陶晨 楊劍平 蘇淼 魯佳亮
摘要: 為解決目前對于“潮”文化的特征缺乏完整闡釋的問題,文章利用文化計算方法進(jìn)行潮文化的特征采集、計算與分類。利用網(wǎng)絡(luò)爬蟲技術(shù)進(jìn)行基于互聯(lián)網(wǎng)的潮文化語料大數(shù)據(jù)采集,并通過中文分詞與過濾處理獲得潮文化的特征詞;然后通過詞頻統(tǒng)計進(jìn)行特征量的計算,實(shí)現(xiàn)特征強(qiáng)度的量化,并提取了前100個特征供后續(xù)分析;接著分別采取基于詞義、詞頻的分類,梳理出潮文化的五個特征子集,并提取了潮文化的核心,針對特征子集進(jìn)行闡述和分析,展現(xiàn)了潮文化的內(nèi)涵與形式。探討了潮文化的特征結(jié)構(gòu),揭示了潮文化與大眾時尚的辯證關(guān)系,有助于理解當(dāng)下時尚文化的多樣性及動態(tài)規(guī)律。
關(guān)鍵詞: 文化計算;潮文化;大數(shù)據(jù);流行;時尚;特征;量化
中圖分類號: TS941.13;G202文獻(xiàn)標(biāo)志碼: A文章編號: 10017003(2020)02004106
引用頁碼: 021108DOI: 10.3969/j.issn.10017003.2020.02.008
Computation and classification of tide culture features based on corpus big data
TAO Chen1, YANG Jianping1, SU Miao2, LU Jialiang2
(1.College of Textile and Garment, Shaoxing University, Shaoxing 312000, China; 2. International Silk Institute,
Zhejiang SciTech University, Hangzhou 310018, China)
Abstract: Aiming at the issue of lacking comprehensive elaboration on the features of the tide culture, this study employs the method of culture computation to carry out feature collection, calculation and classification for the tide culture. First of all, the web crawler technology was used to conduct the corpus big data collection from the Internet, and the feature words were obtained by Chinese word segmentation and filtration. Then, the feature quantity was calculated by word frequency statistics to achieve the quantification of the feature intensity. Besides, the first 100 features were extracted for followup analysis. Next, feature classifications based on word meaning and word frequency were performed respectively to comb out the five feature subsets plus one core subset of the tide culture. Elaboration and analysis were carried out for these subsets, and the connotation and form of the tide culture were exhibited. This study has inquired the structure of the tide culture and investigated the dialectical relationship between the tide culture and the mass fashion, contributing to the understanding of diversity and dynamic law of todays fashion culture.
Key words: culture computation; tide culture; big data; trend; fashion; feature; quantification
近年來,“潮人”“潮裝”“潮品”“潮牌”等一些詞匯流行起來,并逐漸成為服飾流行與時尚的尖端部分。然而“潮”作為一種文化現(xiàn)象目前還處于亞文化或次文化地位[1],對潮文化的考察構(gòu)成了中國時尚文化研究的獨(dú)特視角。中國潮文化的源頭可追溯到20世紀(jì)八九十年代日本原宿地區(qū)新浪潮藝術(shù)家們的時尚態(tài)度[2],而后陸續(xù)傳入韓國及中國港臺地區(qū),在21世紀(jì)初開始進(jìn)入中國除港臺以外的其他地區(qū)。有研究認(rèn)為潮文化是街頭文化在新時期的體現(xiàn)[3],通過“潮裝”表現(xiàn)來自日韓和西方的人文、地域、種族概念,將原本出現(xiàn)在街頭角落的事物(如HipPop、涂鴉、滑板運(yùn)動等)帶入主流時尚界,形成了獨(dú)特的自下而上的發(fā)展模式。對香港潮文化的考察表明,“潮品”是符合流行循環(huán)規(guī)律、走在社會思潮前端的一類原創(chuàng)品牌,而本土文化元素是其獨(dú)特的表達(dá)形式[4]。相關(guān)研究還考察了陜西關(guān)中地區(qū)傳統(tǒng)文化元素[5]、佛教道教繪畫圖案[6]及傳統(tǒng)紋樣與波普藝術(shù)的結(jié)合[7]在中國“潮牌”服飾設(shè)計中的體現(xiàn),探討了歐美、日本及中國TShirt潮品在設(shè)計元素和設(shè)計理念上的異同[8]。
另一方面,時尚文化元素的朝夕變換,使得以社會調(diào)查、資料搜集和知識整理為手段的傳統(tǒng)方法,在潮文化的內(nèi)涵與表現(xiàn)形式上,難以得出全面的、與時俱進(jìn)的結(jié)果。而隨著互聯(lián)網(wǎng)和社交媒體的不斷深入,海量時尚文化信息在網(wǎng)絡(luò)上積聚,形成了巨大的、公開的、不斷更新的大數(shù)據(jù)源,為實(shí)施潮文化計算創(chuàng)造了基礎(chǔ)條件。文化計算就是利用現(xiàn)代計算方法,從文化載體(文字、圖像、視頻等)上提取數(shù)字化特征,并進(jìn)行分析、重建和展示的過程[9]。文化計算領(lǐng)域最近一次重大進(jìn)展是哈佛大學(xué)的Aiden和Michel對谷歌數(shù)字圖書數(shù)據(jù)進(jìn)行的研究[10],該研究通過海量文本中單詞或人名隨時間變化的頻率,推導(dǎo)出了一些重要?dú)v史文化事件和趨勢,證明了利用大數(shù)據(jù)處理手段篩選出文化特征的可行性。
文化計算領(lǐng)域取得的成果,為潮文化的計算和分析提供了基本方法和工具,而傳統(tǒng)研究考察了潮文化的源頭和傳播路徑、與街頭文化的關(guān)系及與傳統(tǒng)文化的結(jié)合等方面,形成了對潮文化的基本認(rèn)知,為開展潮文化的特征計算與分析提供了先驗(yàn)知識。本研究在文化計算框架內(nèi),通過互聯(lián)網(wǎng)進(jìn)行文化大數(shù)據(jù)的采集,進(jìn)而實(shí)施潮文化特征的計算與分類,以便闡釋當(dāng)下潮文化的內(nèi)涵和結(jié)構(gòu)。本研究的總體技術(shù)路線如圖1所示。
由圖1可見,本研究首先采集互聯(lián)網(wǎng)上潮文化語料文本,形成潮文化的語料大數(shù)據(jù);然后從語料庫中提取特征詞,并通過詞頻計算將其轉(zhuǎn)化為量化的文化特征;最后結(jié)合潮文化的先驗(yàn)知識,對文化特征進(jìn)行梳理與分類,得到潮文化的特征子集,形成潮文化的特征體系。
Computation and classification of tide culture features based on corpus big data基于語料大數(shù)據(jù)的“潮”文化特征計算與分類
1語料采集
一般地,某一主題下的語料文本可以使用人工方式從書籍、報紙、電視、網(wǎng)絡(luò)等媒體上采集,當(dāng)采集到的語料達(dá)到一定的規(guī)模,能夠基本覆蓋或代表人們在某一主題上產(chǎn)生的所有言論,就形成了該主題下的語料庫??紤]潮文化的特點(diǎn),它是一種走在潮流前端、嬗變中的時尚文化,其時尚屬性與即時性特點(diǎn)不容忽略。當(dāng)今時代,互聯(lián)網(wǎng)已成為全球第一媒體,亦是流行與時尚的策源地,因而潮文化的語料采集必得以互聯(lián)網(wǎng)為首要信息來源,并使用高效的自動化采集手段以滿足數(shù)據(jù)的即時性要求。本研究利用主題網(wǎng)絡(luò)爬蟲技術(shù)[11],以國內(nèi)知名門戶網(wǎng)站為起點(diǎn),實(shí)施潮文化語料的大規(guī)模采集。
類似于使用搜索引擎,使用主題網(wǎng)絡(luò)爬蟲的關(guān)鍵是提供一個或多個主題詞,主題詞的選擇對語料采集的結(jié)果有很大影響。在本研究中,最容易想到的是以“潮文化”作為主題詞,但實(shí)際在有關(guān)“潮”現(xiàn)象的各種描述中,多數(shù)不會將其上升到文化層面或提及“潮文化”,另外“潮文化”還指“潮汕文化”“錢江潮相關(guān)歷史及文化”等與本研究無關(guān)的內(nèi)容。因此,若以“潮文化”為主題詞,一是所獲語料將不能取得對既定主題的高覆蓋率,二是可能引入大量與本研究無關(guān)的語料,從而削弱語料庫的針對性。同樣地,也不能以“潮”作為主題詞,因?yàn)椤俺薄庇兄谋疽猓ㄈ绯彼?、漲潮),也有本意基礎(chǔ)上的引申意(如學(xué)潮、思潮、寒潮),這兩類用法在有關(guān)“潮”的詞語中占據(jù)很大的比例,然而都不是本研究意欲采集的對象。
因此,要選擇合適的主題詞,必須對潮文化具有一定的了解,知曉潮文化的呈現(xiàn)途徑或方式。就目前而言,潮文化主要是通過“潮人”“潮裝”“潮品”“潮牌”這四種途徑呈現(xiàn)的,它們是提到各種“潮”現(xiàn)象時難以回避的詞語。本研究將這四個詞語作為語料采集的主題詞,以新浪、網(wǎng)易、搜狐三個國內(nèi)門戶網(wǎng)站的時尚頻道(分別為fashion.sina.com.cn、fashion.163.com、fashion.sohu.com)為起點(diǎn),利用網(wǎng)絡(luò)爬蟲技術(shù)進(jìn)行多線程大規(guī)模主題文本的采集,共爬取21568個網(wǎng)站的735542個有效網(wǎng)頁,獲取文本94411兆字節(jié)(MB),構(gòu)建起潮文化的語料大數(shù)據(jù),如圖2所示。
語料庫中語料需要進(jìn)行預(yù)處理,才能為下一環(huán)節(jié)中文化特征的提取所用[12]。預(yù)處理的目的是從語料文本中提取有意義的詞語,預(yù)處理的過程主要包括分詞[13]和停用詞過濾[14]兩個步驟。圖2中的示例是利用Jieba分詞工具和百度停用詞表對語料文本進(jìn)行處理的結(jié)果。分詞是中文語料處理的特有技術(shù),由于不存在類似英文句子中單詞之間的空格,從中文句子中提取詞語要借助分詞技術(shù)。該技術(shù)是通過統(tǒng)計字與字相鄰共現(xiàn)的頻率或概率,計算成詞的可信度,作為詞語分割的依據(jù)。常見的中文分詞工具包括開源的Jieba分詞軟件、清華大學(xué)的THULAC分詞系統(tǒng)、北京理工大學(xué)的NLPIR分詞系統(tǒng)等,本研究采用了開源的Jieba分詞工具。分詞完成后,語料文本轉(zhuǎn)變?yōu)樵~語集合,還需要對詞語集合進(jìn)行過濾,以去除其中的量詞、連詞、介詞、語氣詞、標(biāo)點(diǎn)符號等意義不大的詞(或稱為“停用詞”)。詞語過濾依據(jù)一個中文停用詞表(Stopword table),該表中記錄所有的中文停用詞。常用的停用詞表有百度停用詞表、哈爾濱工業(yè)大學(xué)停用詞詞庫、四川大學(xué)機(jī)器學(xué)習(xí)智能實(shí)驗(yàn)室停用詞庫等,考慮到潮文化的當(dāng)下性,本研究采用了更新頻率較高的百度停用詞表。
2特征提取與量化
在本研究中,利用語料庫中的詞語來代表潮文化的特征,并將特征的強(qiáng)弱進(jìn)行量化。在上述經(jīng)預(yù)處理的潮文化語料庫中,對各個詞語出現(xiàn)的次數(shù)進(jìn)行統(tǒng)計與歸一化處理,并根據(jù)下式計算其詞頻(F)。
F/%=NNmax×100(1)
式中:N是該詞語在語料庫中出現(xiàn)的次數(shù),Nmax對應(yīng)語料庫中出現(xiàn)次數(shù)最多的詞語。
詞頻越高則認(rèn)為該詞語與潮文化的關(guān)聯(lián)度越高。在這里,語料庫中所有詞語都看作是潮文化的特征,沒有特征與非特征之分,但各個特征有強(qiáng)弱之別。排除“潮人(Fmax=1)”“潮裝(0.4726)”“潮品(0.4027)”“潮牌(0.6483)”四個主題詞,得到詞頻最高的前100個特征詞為:自我(0.9192)、日韓(0.9064)、個性(0.8687)、年輕(0.8676)、時尚(0.8399)、韓國(0.7928)、女裝(0.7857)、卷邊褲(0.7571)、CLOT(07395)、男裝(0.7364)、中性(0.6976)、品牌(0.6967)、衛(wèi)衣(06895)、多元(0.6871)、牛仔褲(0.6721)、混搭(0.6569)、日本(06466)、小眾(0.6410)、原創(chuàng)(0.5995)、00后(0.5959)、直播(0.5959)、風(fēng)衣(0.5944)、率性(0.5912)、潮男(0.5856)、嘻哈(0.5679)、Real(0.5625)、自然(0.5484)、95后(0.5251)、自信(0.5087)、Bape(0.5071)、炫酷(0.5005)、Supreme(04752)、粉絲(0.4527)、Large(0.4526)、Boylish(0.4396)、市場(0.4380)、EVISU(0.4344)、非主流(0.4293)、游戲(04235)、寶寶(0.4210)、二次元(0.4165)、中國(0.4142)、暴力熊(0.414)、兔公爵(0.4066)、牛津鞋(0.4032)、Gentlewomen(0.3962)、街拍(0.3901)、ACEG(0.3836)、大眾(03814)、風(fēng)格(0.3764)、LILBETTER(0.3674)、美顏(03602)、叛逆(0.3577)、設(shè)計(0.3541)、耳飾(0.3443)、自黑(0.3408)、快閃(0.3391)、態(tài)度(0.3377)、拽貓(0.3271)、死忠(0.3192)、90后(0.3013)、Oversize(0.2983)、姿態(tài)(02956)、滑板(0.2927)、文化(0.2777)、變革(0.2742)、經(jīng)歷(0.2616)、限量(0.2501)、派對(0.2472)、男友式(0.2392)、涂鴉(0.2351)、THETHING(0.2234)、歐美(0.2216)、生命(02191)、街頭(0.2122)、香港(0.2091)、80后(0.1984)、臺灣(0.1982)、開端(0.1966)、路人(0.1951)、VisVim(01593)、交集(0.1559)、消費(fèi)(0.1510)、自行車(0.1033)、高級(00964)、妖孽(0.0963)、話題(0.0706)、前端(0.0677)、話語(0.0507)、鏡頭(0.0306)、服裝(0.0301)、達(dá)人(0.0250)、卡通(0.0228)、Undefeated(0.0202)、StayReal(0.0190)、社會(0.0169)、亮點(diǎn)(0.0149)、目光(0.0126)、風(fēng)景(0.0077)、傳統(tǒng)(0.0045)。根據(jù)其詞頻大小置于相應(yīng)半徑的圓周上,生成潮文化的詞云圖,如圖3所示。
在圖3的云圖中,圓心位置代表“潮文化”,特征詞的半徑與其詞頻反相關(guān),即詞頻越高則特征詞到圓心的距離越小。詞云圖可看作文化特征的可視化形式,它直觀地揭示了潮文化的特征(詞語)及這些特征的強(qiáng)度(詞頻)。
3特征梳理與分類
根據(jù)特征詞涵義和特征量大小,本研究對潮文化的特征進(jìn)行梳理和分類,得到潮文化的特征子集,建立潮文化的特征體系。
3.1特征詞梳理
根據(jù)特征詞涵義,從上述100個特征詞中可梳理出五個特征子集,如表1所示。一個特征子集代表某一類文化特征,描述潮文化的某一個方面,所有特征子集構(gòu)成了潮文化的特征體系。
表1梳理出了“精神內(nèi)涵”“年齡結(jié)構(gòu)”“載體形式”“文化生態(tài)”和“商業(yè)品牌”五個特征子集。由表1可見,潮文化其背后的精神主要是表達(dá)自我、追求率真、反大眾化,其中特征詞“自我”擁有最大的特征量0.9192。潮文化尚未取得與主流時尚同等的被接受程度,導(dǎo)致其現(xiàn)階段最大的訴求是“發(fā)聲”或“自我表現(xiàn)”,強(qiáng)烈的自我表達(dá)愿望也印證了其目前的亞文化或次文化地位。如今流行與時尚被商業(yè)操控已是不爭的事實(shí),大眾時尚的本性是“逐利”而非“求真”,時尚的逐利性使得時尚背后寶貴的精神要素(如永不停留、永不滿足)常被剝離從而服從于商業(yè)目的,而當(dāng)下潮文化最引入注目的閃光點(diǎn)正是其求真(率性0.5912、Real 0.5625)的本性。理所當(dāng)然地,潮文化也就成了反大眾化的典型,對大眾時尚的對抗既是其追求率真的結(jié)果,也是其表現(xiàn)自我的手段??傊?,“表達(dá)自我”是訴求、“追求率真”是本性、“反大眾化”是手段,當(dāng)前潮文化與主流時尚的相對地位,既限定了它的影響與邊界,也培育了它獨(dú)特的個性。
在年齡結(jié)構(gòu)上,顯然潮文化是年輕人的文化,其擁躉主要為00后、95后和90后(00后、95后、90后、80后的特征量之比約為6︰5︰3︰2),其消費(fèi)能力不及30周歲以上的中青年人,因而難以追隨主流時尚,但卻因此創(chuàng)造了屬于年輕人自己的時尚文化。在載體形式上,其最主要的文化載體是服裝服飾,并且崇尚混搭、中性化、原創(chuàng)性,服裝服飾以外的潮文化載體形式還包括直播、嘻哈、二次元、街拍、快閃等。值得注意的是,“男裝(0.7364)”和“女裝(0.7857)”的特征量幾乎不相上下,在“潮男(0.5856)”的詞頻半徑內(nèi),沒有對等的第二性別特征詞,這暗示了性別平等的、甚至是男性主導(dǎo)的時尚,在現(xiàn)代流行文化史上獨(dú)樹一幟。這一點(diǎn)在女裝中性化傾向中亦可得到印證,前100特征詞中提及兩種中性化風(fēng)格,即“Boylish(0.4396)”和“Gentlewomen(0.3962)”?!癇oylish”亦稱“Street Boylish”或“男友式”,指年輕女性模仿街頭男孩或男友裝扮而形成的著裝風(fēng)格;“Gentlewomen”指成熟、優(yōu)雅、紳士化的青年女性裝扮及精神氣質(zhì)。這二者都是帶有男性特征的風(fēng)格,但在“Boylish”“Gentlewomen”及“男友式”的詞頻半徑內(nèi)沒有對等的第二性別特征詞,再次證明了潮裝和潮文化的男性傾向。
在文化生態(tài)方面,考察潮文化與其他文化對象的關(guān)系,可以發(fā)現(xiàn)其主要受日韓青年文化的影響。中國傳統(tǒng)文化元素在前100個特征詞中沒有得到體現(xiàn),在100個特征詞之外,存在“臉譜(0.0124)”“功夫(0.0104)”“書法(0.0101)”“詩詞(0.0047)”等特征詞,表明現(xiàn)階段潮文化還未能與中國傳統(tǒng)文化深度結(jié)合。
在商業(yè)品牌方面,前100個特征詞中提及時尚品牌共15個,反映了潮文化已在一定程度上被商業(yè)化。前10大潮牌中,國產(chǎn)品牌占6個(其中香港2個),反映國產(chǎn)時尚品牌在潮文化市場中占據(jù)主導(dǎo)地位。潮牌的興起預(yù)示著潮文化被商業(yè)接受、被大眾時尚同化的命運(yùn),這既是潮文化的內(nèi)在訴求得到滿足的過程,也將是失去其獨(dú)特性、淪為消費(fèi)時尚的過程。
總之,從詞義的角度進(jìn)行特征詞的梳理和歸類,可得到潮文化的若干個特征子集。必須承認(rèn),判斷一個特征詞屬于哪個特征子集,具有一定的主觀成分,有時是沒有標(biāo)準(zhǔn)答案的。表1給出的特征體系僅是一種可能的情況,或相對合理的分類。若要回避主觀判斷,則可通過特征量聚類來提取特征子集。
3.2特征量聚類
通過聚類分析來考察特征詞自然成類的情況,圖4給出了對前30個特征量利用分層法進(jìn)行系統(tǒng)聚類過程中形成的樹狀圖,其橫軸是特征詞序號,縱軸代表歸一化的分類距離。由圖4可見,在虛線a所示的位置上存在可信度較高的自然二分類,在虛線b所示的位置上存在自然三分類,在虛線c所示的位置上存在五分類。
從考察二分類的情況看,由圖4可看出特征詞“1自我”“2日韓”“3個性”“4年輕”“5時尚”為一類,其余為另一類,因此可得到兩個特征子集。結(jié)合潮文化詞云圖(圖3),可確認(rèn)前一子集為潮文化的核心子集,從而潮文化的文化核心可表述為“一種受日韓文化影響的、追求個性和自我的青年時尚文化”。
也可在虛線b、c位置上進(jìn)行三分類或五分類,來劃分更多的特征子集。這樣得到的特征子集和前文中通過特征詞梳理得到的特征子集有所不同,前者是基于詞義的劃分,而后者是基于詞頻的。在基于詞頻的劃分中,各特征子集之間存在不斷接近潮文化核心的遞進(jìn)關(guān)系。
4結(jié)語
本研究利用“潮人”“潮裝”“潮品”“潮牌”四個主題詞進(jìn)行基于互聯(lián)網(wǎng)的潮文化語料大數(shù)據(jù)采集,獲得了高質(zhì)量的潮文化語料庫;從語料庫中提取特征詞,并通過詞頻反映文化特征的強(qiáng)弱,實(shí)現(xiàn)了文化特征的量化;通過基于詞義的梳理,得到潮文化的五個特征子集,揭示了潮文化“表達(dá)自我、追求率真、反大眾化”的精神內(nèi)涵、與當(dāng)前大眾時尚的相互作用和關(guān)系,及其在服裝服飾載體上的表現(xiàn)形式及特點(diǎn)等;通過基于詞頻的聚類和分類,獲得了潮文化的核心子集,將潮文化的核心凝練為“一種受日韓文化影響的、追求個性和自我的青年時尚文化”。本研究從不同角度提取潮文化的特征子集,形成潮文化的特征體系,闡釋了潮文化的內(nèi)涵與形式,可為理解當(dāng)下時尚與流行的發(fā)生及演變提供重要的參考。
參考文獻(xiàn):
[1]張淼. “潮牌”服飾文化現(xiàn)象解析[D]. 長春: 長春工業(yè)大學(xué), 2012.
ZHANG Miao. The Culture of Fashion Wearing [D]. Changchun: Changchun University of Technology, 2012.
[2]田一汐. 試析日本文化多樣性在原宿文化中的體現(xiàn)[J]. 學(xué)園·教育科研, 2012(13): 3738.
TIAN Yixi. A trial analysis on the Japanese cultural diversity in the Harajuku culture [J]. Academy·Educational Research, 2012(13): 3738.
[3]郭城城. 我國街頭服飾的流行與發(fā)展研究[D]. 西安: 西安工程大學(xué), 2012.
GUO Chengcheng. Study on the Spreading and Development of the Street Fashion in the Country [D]. Xian: Xian Polytechnic University, 2012.
[4]卜憧. 香港潮牌文化探析[D]. 北京: 北京服裝學(xué)院, 2016.
BU Tong. A Research on Hong Kongs Tide Brand Culture [D]. Beijing: Beijing Institute of Fashion Technology, 2016.
[5]黃騰. 關(guān)中地區(qū)文化元素在潮流服飾設(shè)計中的應(yīng)用研究[D]. 西安: 西安工程大學(xué), 2014.
HUANG Teng. Study on Applications of the Guanzhong Area Culture Elements in the Tide Fashion Design [D]. Xian: Xian Polytechnic University, 2014.
[6]李猛. 佛教道教繪畫圖案在潮牌服裝圖案設(shè)計中的應(yīng)用研究[D]. 西安: 西北大學(xué), 2013.
LI Meng. Applications of Duddhist and Taoist Paintings in the Pattern Design of the Tide Fashion Brands [D]. Xian: Northwest University, 2013.
[7]趙晨卉. 基于傳統(tǒng)紋樣的波普藝術(shù)與潮牌服飾設(shè)計的應(yīng)用研究[D]. 杭州: 浙江理工大學(xué), 2015.
ZHAO Chenhui. Applications of the Traditional PatternBased Pop Art in the Tide Fashion Design [D]. Hangzhou: Zhejiang SciTech University, 2015.
[8]徐欣怡. 國內(nèi)外潮牌T恤設(shè)計對比研究[D]. 上海: 東華大學(xué), 2013.
XU Xingyi. A Comparative Study of Chinese and Foreign Fashion Brand TShirt Design [D]. Shanghai: Donghua University, 2013.
[9]趙海英, 賈耕云, 潘志庚. 文化計算方法與應(yīng)用綜述[J]. 計算機(jī)系統(tǒng)應(yīng)用, 2016, 25(6): 18.
ZHAO Haiying, JIA Gengyun, PAN Zhigeng. Review on the methods and applications in cultural computing [J]. Computer Systems & Applications, 2016, 25(6): 18.
[10]MICHEL J B. Quantitative analysis of culture using millions of digitized books [J]. Science, 2011, 331(6014): 176182.
[11]于娟, 劉強(qiáng). 主題網(wǎng)絡(luò)爬蟲研究綜述[J]. 計算機(jī)工程與科學(xué), 2015, 37(2): 231237.
YU Juan, LIU Qiang. Survey on topicfocused crawlers [J]. Computer Engineering and Science, 2015, 37(2): 231237.
[12]苗奪謙, 衛(wèi)志華, 張志飛. 中文信息處理原理及應(yīng)用[M]. 北京: 清華大學(xué)出版社, 2015.
MIAO Duoqian, WEI Zhihua, ZHANG Zhifei. The Theory and Applications of Chinese Information Processing [M]. Beijing: Tsinghua University Press, 2015.
[13]黃昌寧, 趙海. 中文分詞十年回顧[J]. 中文信息學(xué)報, 2007, 21(3): 819.
HUANG Changning, ZHAO Hai. Chinese word segmentation: a decade review [J]. Journal of Chinese Information Processing, 2007, 21(3): 819.
[14]化柏林. 知識抽取中的停用詞處理技術(shù)[J]. 現(xiàn)代圖書情報技術(shù), 2007, 2(8): 4851.
HUA Bolin. Stopword processing technique in knowledge extraction [J]. New Technology of Library & Information Service, 2007, 2(8): 4851.
收稿日期: 20190327; 修回日期: 20191206
基金項目: 浙江省哲學(xué)社會科學(xué)規(guī)劃項目(19NDJC128YB);浙江省軟科學(xué)研究計劃項目(2020C35024)
作者簡介: 陶晨(1981),男,講師,主要從事絲綢文化計算與大數(shù)據(jù)分析的研究。通信作者:蘇淼,副教授,52478223@qq.com。