唐文輝 劉國華 王國棟
摘 要:隨著“工業(yè)4.0”概念的提出和實施以及C2M互聯(lián)網(wǎng)商業(yè)模式的興起,傳統(tǒng)紡織行業(yè)正面臨著向智能化、服務(wù)化轉(zhuǎn)型的難題。本文將傳統(tǒng)紡織印染行業(yè)與網(wǎng)絡(luò)信息技術(shù)相結(jié)合,以報價服務(wù)為切入點,應(yīng)用深度學(xué)習(xí)以及有限狀態(tài)自動機(jī)理論,基于微服務(wù)架構(gòu),設(shè)計了一套印染需求智能分析系統(tǒng)。為紡織企業(yè)的印染報價服務(wù)提供了一套高效、智能的解決方案。
關(guān)鍵詞: 工業(yè)4.0;C2M模式;結(jié)構(gòu)化數(shù)據(jù)提取;深度學(xué)習(xí);有限狀態(tài)自動機(jī)
文章編號: 2095-2163(2019)03-0103-04 中圖分類號: TP311.5 文獻(xiàn)標(biāo)志碼: A
0 引 言
隨著“工業(yè)4.0”概念的提出與實施,全球制造業(yè)開始了新一輪的改革。在這樣的時代背景下,越來越多的企業(yè)陸續(xù)采用C2M(Customer-to-Manufactory)商業(yè)模式。印染行業(yè)作為中國傳統(tǒng)制造業(yè),已然進(jìn)入了新的發(fā)展階段,其面臨的困擾正日益突顯,諸如企業(yè)運營成本的不斷提高,以及客戶的個性化、小批量、多品種的新需求,企業(yè)的生存壯大也不可避免地會受到?jīng)_擊與挑戰(zhàn)。當(dāng)前,互聯(lián)網(wǎng)技術(shù)、智能技術(shù)的進(jìn)步,為企業(yè)的轉(zhuǎn)型升級帶來了有利契機(jī)。
客戶需求的結(jié)構(gòu)化、規(guī)范化,是印染企業(yè)營銷過程中實現(xiàn)快速準(zhǔn)確報價的前提。傳統(tǒng)的報價形式普遍存在處理效率低下、信息數(shù)據(jù)不規(guī)范、詢價過程記錄缺失等問題。所以,提升和保證報價功能的效率及規(guī)范性已然成為印染行業(yè)在結(jié)構(gòu)轉(zhuǎn)型中亟需解決的重要問題。由此,本文設(shè)計開發(fā)了印染需求智能分析系統(tǒng)。本系統(tǒng)將深度學(xué)習(xí)、文本預(yù)處理以及有限狀態(tài)自動機(jī)理論等計算機(jī)理論和技術(shù)與業(yè)務(wù)實踐相結(jié)合,并基于微服務(wù)架構(gòu),為用戶搭建了需求分析服務(wù)平臺,實現(xiàn)了對用戶需求的快速精確獲取。
1 相關(guān)技術(shù)
1.1 Seq2Seq
Seq2Seq的研發(fā)主要是為了解決傳統(tǒng)RNN結(jié)構(gòu)的輸入和輸出必須要等長,無法實現(xiàn)翻譯功能及聊天機(jī)器人等服務(wù)。Seq2Seq 是一個Encoder-Decoder結(jié)構(gòu)的網(wǎng)絡(luò),其輸入和輸出都是序列,Encoder 中將一個可變長度的信號序列變?yōu)楣潭ㄩL度的向量表達(dá),Decoder 將這個固定長度的向量變成可變長度的目標(biāo)的信號序列。
Seq2Seq模型的基本思想是通過使用一個循環(huán)神經(jīng)網(wǎng)絡(luò)讀取輸入句子,將整個句子的信息壓縮到一個固定維度的編碼中;再使用另一個循環(huán)神經(jīng)網(wǎng)絡(luò)讀取這個編碼,將其解壓為目標(biāo)語言的一個句子。
1.2 有限狀態(tài)自動機(jī)
有限狀態(tài)自動機(jī)是為研究有限內(nèi)存的計算過程和某些語言類而抽象出的一種計算模型。模型中擁有有限數(shù)量的狀態(tài),每個狀態(tài)可以遷移到零個或多個狀態(tài),輸入字串決定執(zhí)行哪個狀態(tài)的遷移。用形式化的語言表示,有限狀態(tài)自動機(jī)可以被表示為一個5-元組(Q,Σ,δ,q0,F(xiàn)),設(shè)計構(gòu)成為:狀態(tài)的有限集合Q、輸入符號的有限集合Σ、轉(zhuǎn)移函數(shù)δ:Q×Σ→P(Q)、初始狀態(tài)q0,q0∈Q、接受狀態(tài)的集合F,F(xiàn) Q。
1.3 微服務(wù)架構(gòu)
微服務(wù)架構(gòu)是一種架構(gòu)概念,其主要作用是將功能分解到離散的各個服務(wù)當(dāng)中,從而降低系統(tǒng)的耦合性,并提供更加靈活的服務(wù)支持。究其本質(zhì)而言,就是用一些功能比較明確、業(yè)務(wù)比較精煉的服務(wù),去解決更大、更實際的問題。
2 系統(tǒng)設(shè)計
根據(jù)對印染行業(yè)用戶報價的需求分析,將印染需求智能分析系統(tǒng)分為三大模塊,研究得到的功能模塊設(shè)計如圖1所示。在此,關(guān)于各模塊主要功能可分述如下。
(1)資訊瀏覽模塊。該模塊分為最新動態(tài)和文章瀏覽,用戶可以在最新動態(tài)子模塊下瀏覽企業(yè)動態(tài)、新推出的產(chǎn)品、咨詢企業(yè)文化等,在文章瀏覽子模塊中,通過技術(shù)、咨詢、發(fā)展等標(biāo)簽將印染領(lǐng)域相關(guān)文章做出分類,以隨機(jī)推薦的形式展示給用戶進(jìn)行閱讀。
(2)用戶模塊。該模塊主要管理用戶的基本操作,包括用戶登錄注冊、修改個人信息及密碼等,同時對用戶進(jìn)行身份權(quán)限管理,對不同身份權(quán)限的用戶開放不同的功能模塊。
(3)報價模塊。通過新技術(shù)與傳統(tǒng)報價流程相結(jié)合,為用戶創(chuàng)建智能化的報價體驗??杉?xì)分為如下4個功能:通過深度學(xué)習(xí)Seq2Seq模型訓(xùn)練的智能機(jī)器人客服為用戶提供24 h印染領(lǐng)域問答服務(wù);基于WebSocket搭建的人工客服交流平臺,用戶可以與人工客服在此平臺實時交流,進(jìn)行產(chǎn)品答疑、需求描述、訂單確認(rèn)等操作;基于有限狀態(tài)自動機(jī)的報價需求提取服務(wù),配合文本預(yù)處理等技術(shù),為用戶提供了智能、高效的自動化需求提取流程;最后將提取出的用戶結(jié)構(gòu)化需求列表以及客服報價結(jié)果整理成表單,以可視化形式反饋給用戶。
3 數(shù)據(jù)庫設(shè)計
本系統(tǒng)采用MongoDB數(shù)據(jù)庫。MongoDB是一個基于分布式文件存儲的開源數(shù)據(jù)庫系統(tǒng),在高負(fù)載的情況下,添加更多的節(jié)點,可以保證服務(wù)器性能。MongoDB旨在為Web應(yīng)用提供可擴(kuò)展的高性能數(shù)據(jù)存儲解決方案。關(guān)于重要數(shù)據(jù)表功能,研究中可做概述如下。
(1) 用戶信息表。主要用來記錄用戶個人信息,包括用戶名、密碼、手機(jī)號、電子郵箱等信息,其中用戶名為主鍵。
(2) 最新動態(tài)表。主要用來保存企業(yè)相關(guān)的最新動態(tài),涉及企業(yè)新聞、最新產(chǎn)品、企業(yè)文化等內(nèi)容。包括動態(tài)的標(biāo)題、內(nèi)容、附圖URI路徑、發(fā)布時間等字段。
(3) 文章信息表。主要用來保存印染行業(yè)的一些相關(guān)文章,供用戶瀏覽。包括文章的標(biāo)題、內(nèi)容、發(fā)布時間、作者以及文章標(biāo)簽類型等字段。
(4) 報價信息表。主要用來記錄每個用戶的歷史報價信息及報價結(jié)果。包括用戶編號、報價產(chǎn)品的型號、外觀及內(nèi)在質(zhì)量要求、執(zhí)行標(biāo)準(zhǔn)、包裝要求等產(chǎn)品需求信息、報價結(jié)果、處理客服編號等字段。
4 系統(tǒng)架構(gòu)與功能實現(xiàn)
4.1 系統(tǒng)架構(gòu)
系統(tǒng)基于微服務(wù)架構(gòu),通過前后端分離模式進(jìn)行開發(fā)。與傳統(tǒng)的MVC開發(fā)模式不同,前后端分離模式大大降低了前端和后端的耦合性,把后端根據(jù)業(yè)務(wù)劃分成若干個服務(wù)組件,前、后端之間通過API網(wǎng)絡(luò)通信進(jìn)行數(shù)據(jù)交互,提升了系統(tǒng)的可維護(hù)性、開發(fā)效率、以及綜合性能等。
4.2 智能機(jī)器人客服
系統(tǒng)報價模塊中,智能機(jī)器人客服為用戶提供24 h印染領(lǐng)域?qū)I(yè)問答服務(wù)。主要以2種方式配合實現(xiàn),對此可得闡釋解析如下。
(1)通過深度學(xué)習(xí)Seq2Seq模型訓(xùn)練的基于生成的聊天機(jī)器人。首先進(jìn)行數(shù)據(jù)預(yù)處理,目前網(wǎng)絡(luò)上流行的中文問答語料庫在質(zhì)量上參差不齊,且對話也存在噪音等,需要引入文本預(yù)處理,去除一些聊天噪音以及無意義對話等,對處理后的問答數(shù)據(jù)進(jìn)行中文分詞,并以統(tǒng)一的格式整理成所需的語料庫。使用Keras初始化Seq2Seq模型并設(shè)定模型參數(shù)。再將預(yù)期準(zhǔn)備的語料庫送入模型中進(jìn)行訓(xùn)練。最終實驗結(jié)果由語料庫質(zhì)量以及訓(xùn)練時間而定。通過該聊天機(jī)器人可以實現(xiàn)基礎(chǔ)對話的問答交流。
(2)鑒于訓(xùn)練后的機(jī)器人并不能保證回答內(nèi)容的專業(yè)性,因而需要預(yù)先設(shè)定印染專業(yè)領(lǐng)域問答庫,根據(jù)閾值匹配問句,繼而反饋對應(yīng)的答句。研究中,需整理出印染專業(yè)領(lǐng)域問答,將問句和答句一一對應(yīng)保存起來,當(dāng)智能客服獲取用戶輸入時,就會將用戶輸入與預(yù)設(shè)的問句進(jìn)行相似度匹配,當(dāng)相似度到達(dá)所設(shè)的閾值時,即向用戶反饋問答庫中與該問句對應(yīng)的答句。從而實現(xiàn)印染領(lǐng)域的專業(yè)問答。
4.3 人工客服交流平臺
系統(tǒng)除了配備智能機(jī)器人客服進(jìn)行專業(yè)問答之外,也為用戶提供了人工客服交流平臺。該平臺基于WebSocket進(jìn)行通信。WebSocket是一種在單個TCP連接上進(jìn)行全雙工通信的協(xié)議,可使得客戶端和服務(wù)器之間的數(shù)據(jù)交換變得更加簡單,允許服務(wù)端主動向客戶端推送數(shù)據(jù)。在WebSocket API中,瀏覽器和服務(wù)器只需要完成一次握手,兩者之間就直接可以創(chuàng)建持久性的連接,并進(jìn)行雙向數(shù)據(jù)傳輸。
本系統(tǒng)通過服務(wù)器同時與用戶端和客服端進(jìn)行WebSocket通信,當(dāng)用戶請求人工客服服務(wù)時,會通過調(diào)度算法為該用戶實時分配當(dāng)前最空閑的客服,并在服務(wù)器中保存該用戶和客服的連接,由服務(wù)器來處理用戶和客服的交流。
4.4 報價需求提取流程
本文通過有限狀態(tài)自動機(jī)作為報價需求提取流程的理論基礎(chǔ),通過模擬真實報價需求提取流程,定義出對應(yīng)的有限狀態(tài)自動機(jī),該自動機(jī)及其形式化定義如圖2、圖3所示。
在本方法中,用戶的合理需求是一個正則語言,需要解決的理論問題為:用戶的輸入串是否屬于這個正則語言。該自動機(jī)一開始運行即進(jìn)入初始狀態(tài),等待用戶輸入串,每次讀入輸入串就會根據(jù)狀態(tài)轉(zhuǎn)移函數(shù)得出下一個狀態(tài),直到進(jìn)入接受狀態(tài),則代表準(zhǔn)確的結(jié)構(gòu)化需求數(shù)據(jù)采集完畢,退出采集流程。
4.5 系統(tǒng)實現(xiàn)
印染需求智能分析系統(tǒng)通過前后端分離模式進(jìn)行開發(fā)。其中,前端由React Native來操控視圖展示,由Mobx來管理前端狀態(tài);后端基礎(chǔ)模塊通過基于Node.js的Express框架進(jìn)行開發(fā)并封裝成接口供前端調(diào)用;深度學(xué)習(xí)部分通過Keras進(jìn)行聊天機(jī)器人模型的訓(xùn)練。前端視圖捕獲到用戶的輸入后會進(jìn)行對應(yīng)的邏輯處理,如果需要與后端發(fā)生交互,則通過Ajax調(diào)用Express以及Keras封裝好的Restful API進(jìn)行數(shù)據(jù)交互,獲取到后端返回的數(shù)據(jù)后,再通過可視化的形式展示給用戶。
5 結(jié)束語
在新的時代背景下,隨著數(shù)據(jù)量的不斷擴(kuò)大以及移動化聯(lián)網(wǎng)技術(shù)不斷走向成熟,新的電子互聯(lián)網(wǎng)商業(yè)模式必將興起,作為中國的傳統(tǒng)制造業(yè),紡織行業(yè)也必須隨之進(jìn)行技術(shù)改造來推動自身向高端化、智能化、綠色化、服務(wù)化的轉(zhuǎn)型。本文通過需求分析、系統(tǒng)設(shè)計、數(shù)據(jù)庫設(shè)計以及對有限狀態(tài)自動機(jī)理論的研究等,將技術(shù)與理論相融合,實現(xiàn)了印染需求智能分析系統(tǒng)。通過本系統(tǒng),用戶可以簡潔方便地滿足產(chǎn)品報價需求,同時還可以瀏覽印染行業(yè)資訊文章;有了智能機(jī)器人客服以及自動化采集報價需求流程,可以大大提升人工客服的工作效率,為用戶高效準(zhǔn)確地做出報價;用戶的歷史報價信息也可以被規(guī)范統(tǒng)一地加以整理,便于后續(xù)查詢或分析。為印染行業(yè)報價服務(wù)提供了一套智能、高效的解決方案。
參考文獻(xiàn)
[1]SIPSER M. Introduction to the theory of computation[M]. 3rd ed. USA:Cengage Learning,2012.
[2]FAMILIAR B. Microservice architecture[M]//Microservices, IoT, and Azure. Berkeley, CA:Apress,2015:21-31 .
[3]SRIRAM A, JUN H, SATHEESH S, et al. Cold fusion:Training Seq2Seq models together with language models[J].arXiv preprint arXiv:1708.06426,2017.
[4]LIU Tianyu, WANG Kexiang, SHA Lei, et al. table-to-text generation by structure-aware Seq2seq learning[J]. arXiv preprint arXiv:1711.09724,2017.
[5]DENG Li, YU Dong. Deep learning: Methods and applications[J]. Hanover, MA, USA:Now Publishers Inc., 2014.
[6]張曙. 工業(yè)4.0和智能制造[J]. 機(jī)械設(shè)計與制造工程, 2014,43(8):1-5.
[7]GERS F A, SCHMIDHUBER J, CUMMINS F. Learning to forget: Continual prediction with LSTM[J]. Neural Computation,2000,12(10):2451-2471.
[8]GRISHMAN R. Information extraction[M]//MITKOV R. The Oxford Handbook of Computational Linguistics . New York: Oxford University Press,2003:545-559.
[9]李向陽, 苗壯. 自由文本信息抽取技術(shù)[J]. 情報科學(xué), 2004, 22(7):815-821.
[10]HOLTGRAVES T, HAN Tailin. A procedure for studying online conversational processing using a chat bot[J]. Behavior Research Methods, 2007, 39(1):156-163.
[11]BRAND D, ZAFIROPULO P. On communicating finite-state machines[J]. Journal of the ACM, 1983, 30(2):323-342.
[12]劉曉慧, 鄭廣澤. C2M模式下服裝智能個性化定制的優(yōu)勢及發(fā)展[J]. 服裝學(xué)報, 2016, 1(5):477-481.
[13]李晗. 面向個性化定制的智慧服裝生態(tài)系統(tǒng)若干問題研究[D].? 北京: 北京交通大學(xué),2017.
[14]賈艷玲, 郭偉, 李瑞華. 紡織企業(yè)實施大規(guī)模定制生產(chǎn)模式的研究[J]. 紡織科學(xué)研究, 2005(4):36-40.
[15]曾婷婷, 李輝. 面向電子商務(wù)的產(chǎn)品報價系統(tǒng)研究與設(shè)計[J]. 微計算機(jī)信息, 2008, 24(30):137-138, 136.
[16]徐廣林, 林貢欽. 工業(yè)4.0背景下傳統(tǒng)制造業(yè)轉(zhuǎn)型升級的新思維研究[J]. 上海經(jīng)濟(jì)研究, 2015(10):107-113.