涂娟,邱武,胡曦*
(1.江漢大學人工智能學院;人工智能研究院,湖北武漢430056;2.湖北瀛通通訊線材股份有限公司,湖北咸寧437400)
制造業(yè)是國家經濟的主體,隨著近些年物聯(lián)網、云計算、大數(shù)據(jù)、人工智能等技術引領工業(yè)4.0的到來,為把握時代契機,搶占國家競爭力的戰(zhàn)略制高點,我國發(fā)布了《中國制造2025》等一系列重大戰(zhàn)略方針,推動信息化、網絡化、智能化的深度融合,推動國家經濟的跨越式發(fā)展,從而實現(xiàn)制造業(yè)“大國”向“強國”的轉型升級[1-2]。管理和生產的信息化是未來企業(yè)智能制造的重要組成部分,對生產大數(shù)據(jù)的自動提取和存儲依賴于數(shù)控生產設備、傳感器、監(jiān)控設備、生產執(zhí)行系統(tǒng)(manufacturing execution system,MES)的普及使用[3-4]。商業(yè)智能系統(tǒng)作為現(xiàn)代企業(yè)信息化的重要方法之一,已在零售[5]、銀行[6]、醫(yī)療[7]、交通[8]等行業(yè)得到廣泛應用,成為企業(yè)革新經營管理、解決復雜問題的必要方法,從數(shù)據(jù)中獲取商業(yè)規(guī)律和價值,加速企業(yè)提高效益。然而,我國制造企業(yè)信息化發(fā)展水平各行業(yè)間的差距明顯,行業(yè)占比較低的計算機、通信等高新技術產業(yè)信息化水平較高,而行業(yè)占比高的農副食品加工、服裝紡織等傳統(tǒng)行業(yè)信息化水平低。當今我國傳統(tǒng)制造業(yè)依然局限于大量人工生產檢測工段,采用以項目為中心、按工序組織的離散制造形式,其生產大數(shù)據(jù)具有不連續(xù)、復雜、規(guī)模小等特點。同時,大多數(shù)企業(yè)缺乏科學、現(xiàn)代化的數(shù)據(jù)采集、管理、挖掘機制,商業(yè)智能系統(tǒng)在傳統(tǒng)制造業(yè)的應用相對滯后[9-10]。
本文針對上述局限性問題,設計了一種基于Python及其相關生態(tài)庫構建的商業(yè)智能系統(tǒng),可滿足制造業(yè)車間生產過程中手工記錄的制造、檢測數(shù)據(jù)的自動化分析和監(jiān)測。針對其串行處理、地域局限性的不足,對系統(tǒng)的實際使用效果進行了數(shù)據(jù)跟蹤分析,提出了基于云端的高效架構設計。
為保護企業(yè)信息,本文涉及的生產數(shù)據(jù)均經過處理,并非真實車間生產數(shù)據(jù)。
1.1.1 自動核算,操作簡單我國的傳統(tǒng)制造業(yè),尤其是勞動密集型企業(yè)存在兩方面的不足:一方面,生產人員的技能水平相對較低,對現(xiàn)代管理軟件的操作能力較弱;另一方面,工廠對提高生產力的不懈追求迫使其不斷提高生產的信息化水平,對相應的生產人員提出更高的技能要求。因此,應用于制造業(yè)大數(shù)據(jù)分析的商業(yè)智能系統(tǒng)首先需自動核算不同類型的數(shù)據(jù),做到完全替代低效率的手工核算,這是基本要求。其次,由于傳統(tǒng)的商業(yè)智能系統(tǒng)包括ETL(extract-trans?form-load)技術、數(shù)據(jù)倉庫、聯(lián)機分析處理、數(shù)據(jù)挖掘、數(shù)據(jù)展示等技術,需要掌握相關技術的各種復雜工具軟件[11],其對專業(yè)技能要求高,很難契合一線車間生產管理人員的基本情況。這就要求系統(tǒng)的操作流程必須簡單,并且能夠快速被掌握和使用。
1.1.2 同時輸出數(shù)值統(tǒng)計和可視化分析結果現(xiàn)有車間生產采用原始的手工記錄和核算方法,再以小白板或PPT的形式在日、周、月等會議上呈現(xiàn)人工分析生產數(shù)據(jù)的結果,呈現(xiàn)的形式僅限于簡單的數(shù)值結果或統(tǒng)計圖。此方式需要檢測人員、項目文員和各級管理層,逐級重復核算、分析、匯報生產數(shù)據(jù)。效率極低、結果呈現(xiàn)差、數(shù)據(jù)挖掘的價值小。針對以上缺點,本系統(tǒng)在自動完成各級數(shù)據(jù)統(tǒng)計核算后,自動給出各生產層級的日、周、月等可視化分析結果,以交互式圖表的方式直觀呈現(xiàn)。
1.1.3 對關鍵生產指標能夠監(jiān)測預警本系統(tǒng)為了監(jiān)測生產情況,對關鍵的生產指標給出預警,以此向生產管理人員給予決策支持,提高制造生產的管理效率和效益,而不僅是簡單記錄數(shù)據(jù)。
1.1.4 靈活適用于不同行業(yè)或項目制造業(yè)行業(yè)分類較多,單一行業(yè)生產形式多樣,同一工廠接收的生產項目多變。同時,單一生產項目為契合不同的供應需求經常調配不同的生產工段和流水線。這對商業(yè)智能系統(tǒng)的靈活性提出了較高要求,其必須能適用于不同類型的行業(yè)和項目的變化。以上處理的變動對系統(tǒng)提出多方面要求,包括:系統(tǒng)使用的工具簡單、應用范圍廣;分析流程和計算模型被各行業(yè)認可和采用;呈現(xiàn)的圖表結果被普遍采納。
軟件的框架如圖1所示,其包括5個模塊,分別是源數(shù)據(jù)、數(shù)據(jù)整理、數(shù)據(jù)庫、數(shù)據(jù)分析和數(shù)據(jù)展示。其中,源數(shù)據(jù)模塊主要加載每日生產記錄表;數(shù)據(jù)整理模塊完成數(shù)據(jù)清洗、拆分信息,對部分數(shù)據(jù)進行格式檢測,最后整合每一條生產線的制造檢測數(shù)據(jù);數(shù)據(jù)庫模塊負責存儲細化的項目生產數(shù)據(jù);數(shù)據(jù)分析模塊完成分級數(shù)據(jù)的整理合并;數(shù)據(jù)展示模塊以可視化報表完成,以圖表等直觀的形式呈現(xiàn)生產的多維分析結果。
圖1系統(tǒng)架構Fig.1 System architecture
1.2.1 源數(shù)據(jù)源數(shù)據(jù)模塊負責加載每日生產記錄表。在自動化分析之前,其首先將當日各生產線的制造檢測數(shù)據(jù)錄入生產記錄表。圖2為XLSX格式生產記錄表,此表格形式廣泛被制造業(yè)采用,具有很大的適用性。一個XLSX文件裝載一個工段的數(shù)據(jù),每一張sheet表格裝載一條生產線的數(shù)據(jù),僅需載入對應的不良項和產量數(shù)據(jù),以及其他附加生產信息,系統(tǒng)將自動核算對應的不良數(shù)量及不良率。
圖2生產記錄表Fig.2 Table of production record
1.2.2 數(shù)據(jù)庫數(shù)據(jù)庫模塊承擔項目生產數(shù)據(jù)的存儲任務。針對制造業(yè)項目靈活多變、Microsoft Office軟件的普及性和易操作性、工廠生產數(shù)據(jù)的保密性、單個項目數(shù)據(jù)量相對較低等實際情況和相關需求,本系統(tǒng)選用XLSX本地文件作為數(shù)據(jù)庫,其容量能夠滿足單個項目的數(shù)據(jù)存儲需求。同時,數(shù)據(jù)入庫存儲過程中,系統(tǒng)自動檢測各項生產數(shù)據(jù)的正確性和完整性,并報告相應的錯誤。
1.2.3 數(shù)據(jù)分析和展示數(shù)據(jù)分析模塊完成分級數(shù)據(jù)的整理合并。綜合考慮功能性和易操作性,對不同層級、維度的數(shù)據(jù)分析結果,本系統(tǒng)采用兩種展示形式,即PDF圖表格式和HTML交互式網頁格式。不同于傳統(tǒng)圖表以相對靜態(tài)的形式來表現(xiàn)數(shù)據(jù),只能實現(xiàn)簡單的顯示、打印和數(shù)據(jù)導出功能,現(xiàn)代商業(yè)智能系統(tǒng)要求更直觀的數(shù)據(jù)分析和表達方式。交互式圖表使數(shù)據(jù)分析和展示盡可能動態(tài)化,實現(xiàn)業(yè)務分析的智能化,從而提升圖表的實際價值。本系統(tǒng)以HTML交互式網頁展示了各生產層級數(shù)據(jù)分析結果,每一層級包括日、周、月多時間維度。
本系統(tǒng)以Python語言實現(xiàn)。系統(tǒng)的數(shù)據(jù)處理部分,比如清洗、去重、排序、合并、核算等,主要通過調用Numpy和Pandas第三方庫實現(xiàn),其中Pandas擅長于二維數(shù)據(jù)表的處理,對制造生產部門廣泛使用的XLSX文件的讀取和保存簡單便捷。
本系統(tǒng)的可視化分析部分調用Matplotlib實現(xiàn)PDF圖表的結果輸出;調用Bokeh實現(xiàn)HTML交互式圖表的結果輸出。Matplotlib作為Python的2D繪圖庫,可靈活生成出版質量的圖片,包括直方圖、功率譜、條形圖、散點圖等。Bokeh生成交互式可視化Web網頁的效果簡潔漂亮,對大型的數(shù)據(jù)集也能夠高效互動,對創(chuàng)建交互式的圖表、控制面板及數(shù)據(jù)應用程序的過程簡單快速。
2.2.1 PDF圖表格式PDF文件主要展示各時間維度的生產數(shù)據(jù)分析結果,根據(jù)“拉線-工段-項目”逐級按“日-周-月”維度進行可視化分析。圖3展示了某“工段”級別下“日”維度的PDF分析報表。對應各生產時間段,其分析結果包括:(一天)不良數(shù)量隨生產時間段變化情況;(一天)不良率隨生產時間段變化情況;(一天)比較不同類型的不良數(shù)量隨生產時間段變化情況;(一天)比較不同類型的不良率隨生產時間段變化情況;(一天)總的產量、不良數(shù)量、不良率隨生產時間段變化情況;(一天)不同因素導致的不良數(shù)量排名;含各項具體數(shù)據(jù)的生產記錄表;分析表相關的其他附加信息。以堆疊圖、條形圖、折線圖、表格、文字方式,從不同角度細化展示生產情況。
圖3分析結果的PDF展示Fig.3 PDF display of analysis results
2.2.2 HTML交互式頁面HTML頁面展示不同生產層級在“日-周-月”時間線下的生產情況,使用交互式折線圖。圖4為某工段的“日-周-月”線的數(shù)據(jù)分析結果。各時間線的分析結果以文件夾的形式分別展示“產量,不良率”和“各不良項目情況(%)”。用戶只需點擊對應的子文件夾標簽即可切換。將鼠標放在圖中對應的時間節(jié)點上,則自動顯示當前時間節(jié)點上所有的生產數(shù)據(jù)。為了向生產管理人員及時給予警示和預測,系統(tǒng)通過自動計算分析得到不良率變化最大的前4個數(shù)值,并通過不同的顏色顯示出來,如圖中“日線”的“各不良項目情況(%)”子圖提示2019年06月28日相對上一個生產日變化最大的不良項是偏位、假焊、斷銅、反線,相關生產管理人員可依此監(jiān)控和調整崗位。同時,整個網頁上方放置了交互式展示工具欄,用戶可以自由選擇工具進行放大、縮小、拖動、刷新等操作。
圖4分析結果的HTML交互展示Fig.4 HTML interactive display of analysis results
將系統(tǒng)應用于某加工制造企業(yè)的實際生產,并進行跟蹤監(jiān)測,對其性能進行分析,結果如圖5所示。其中,圖5(a)展示了2019年5月到6月期間系統(tǒng)每日分析的報表文件總數(shù)和對應的分析總時長。在此項目上,系統(tǒng)每天平均分析輸出29份報表文件,平均需要189 s分析時長。圖5(b)展示了系統(tǒng)分析時長相對分析文件數(shù)量的分布情況。利用一元線性回歸模型擬合,兩者接近y=15.9x-278的線性關系,即除了跟計算機性能有關,系統(tǒng)所需的分析時長隨著分析報表文件的增多而相應延長。
圖5系統(tǒng)的性能分析Fig.5 Performance analysis of the system
通過圖5的分析結果可看出系統(tǒng)較好地適應了加工制造項目的靈活變化,給予數(shù)據(jù)分析和存儲的更新支持,并快速給出豐富、細致、可靠的分析報表。但此系統(tǒng)的分析時長會隨著分析報表的任務量近似線性增長,這是由于系統(tǒng)架構的串行處理的邏輯,因此此系統(tǒng)更適合一般項目級別的數(shù)據(jù)管理。同時,面對多地域多廠區(qū)分布的企業(yè)生產數(shù)據(jù)的整體分析和展示的需求,可采用基于云端的跨地域數(shù)據(jù)聯(lián)結形式,如圖6所示,對于分立的企業(yè)或廠區(qū),使用當前系統(tǒng)能較好滿足其生產數(shù)據(jù)的細化分析需求,給出PDF、HTML不同形式的報表展示,并將更新的項目數(shù)據(jù)庫實時推送到云端的總數(shù)據(jù)庫。企業(yè)再通過選擇在線的或桌面的、商業(yè)的或個人設計的商業(yè)智能軟件,幫助其定制個性化的數(shù)據(jù)分析看板,以此完成信息的縱向深度集成,展現(xiàn)全局生產情況。其結構可較好地克服數(shù)據(jù)量和地域限制,且實時動態(tài)更新。
圖6基于云端的系統(tǒng)改進Fig.6 System improvement based on network cloud
基于傳統(tǒng)制造業(yè)的特點和需求,本文設計了一套簡易型商業(yè)智能系統(tǒng),系統(tǒng)通過了實際生產應用的驗證,相較于大型商業(yè)智能系統(tǒng)對數(shù)字化工廠的硬性依賴,此系統(tǒng)簡單、靈活且高效,可以規(guī)避傳統(tǒng)制造業(yè)數(shù)控設施配備較低的短板,從而滿足制造車間對數(shù)據(jù)分析、管理、監(jiān)測的要求。手工數(shù)據(jù)與基于RFID(radio frequency identification)等技術的自動采集數(shù)據(jù)結合,將極大地完善制造企業(yè)的信息管理水平[12]。系統(tǒng)串行分析的形式限制了數(shù)據(jù)處理規(guī)模,針對更高級的跨地域生產大數(shù)據(jù)的集合分析和實時更新的需求,可使用基于云端的架構達成較低成本的實現(xiàn),這將在以后的研究中更深入地進行探討。