国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在投標報價評審中的應用

2017-05-30 14:15:34劉智煥
關鍵詞:串通評標報價

摘要:

以廣州某建設工程交易中心部分項目投標文件中工程量清單的報價數(shù)據(jù)為案例,主要運用聚類分析方法,對處理后的數(shù)據(jù)運用數(shù)據(jù)挖掘技術(shù)分析其相似度和差異度,一方面嘗試根據(jù)投標報價的相似度進行串通投標判別,另一方面嘗試根據(jù)投標報價的差異度進行風險預警,希望能為提高經(jīng)濟標評審的科學性帶來一些幫助。

關鍵詞:

數(shù)據(jù)挖掘;聚類分析;投標報價;串通投標;不平衡報價

中圖分類號:TP31113

文獻標識碼:A

文章編號:1000-5099(2017)06-0060-05

國際DOI編碼:10.15958/j.cnki.gdxbshb.2017.06.12

近幾十年來,伴隨著信息技術(shù)及數(shù)據(jù)庫技術(shù)的迅猛發(fā)展,數(shù)據(jù)挖掘技術(shù)廣泛應用于通訊數(shù)據(jù)管理、金融服務及網(wǎng)絡監(jiān)測等項目中,旨在對數(shù)據(jù)中隱含的規(guī)律進行挖掘,從而解決一些實操問題,優(yōu)化工作效率。然而,縱觀數(shù)據(jù)挖掘技術(shù)應用的范圍發(fā)現(xiàn),其主要集中在計算機領域或互聯(lián)網(wǎng)金融領域,而應用在工程報價分析方面所見的文獻不多,目前搜集到的文獻主要應用一些統(tǒng)計分析知識對選取的一些工程樣本指標進行分析:有些機構(gòu)應用投標文件編制系統(tǒng)硬件和軟件特征碼及投標文件內(nèi)部數(shù)據(jù)規(guī)律性等識別技術(shù),有些則通過選取的數(shù)據(jù)樣本,運用運籌學及函數(shù)關系建立相應的模型設想,如一些經(jīng)濟學家針對當前經(jīng)濟標評審中出現(xiàn)的串標行為,提出過“不同樣本選擇策略,對所有數(shù)據(jù)求期望值偏差的自動評標模型”[1]等論斷。本研究主要基于廣州某建設工程交易中心部分項目投標文件中工程量清單數(shù)據(jù)的分析。在分析過程中,首先把往年收到的投標報價數(shù)據(jù)按照項目的工程類別進行分類,并存入數(shù)據(jù)庫中,然后對相關數(shù)據(jù)進行深度挖掘和分析,找出彼此有一定關聯(lián)性的數(shù)據(jù),再將關聯(lián)關系中共同點較多的部分歸成一個類,并建立類庫,標記其主要關聯(lián)關系。通過對這些關聯(lián)數(shù)據(jù)分析后所得出的結(jié)果,希望能幫助評標專家對工程報價中的串通投標及不均衡報價行為進行科學分析和初步判斷,并為今后實際評標中幫助專家快速識別這些現(xiàn)象提供切實可行的參考依據(jù),最終達到快速準確、公正高效評標的目的。

一、數(shù)據(jù)挖掘的特征及主要流程

數(shù)據(jù)挖掘的最大優(yōu)勢就是讓決策者、領導者對歷史和當前數(shù)據(jù)進行分析比對、計算建模,從而探尋背后隱藏的內(nèi)在聯(lián)系,達到科學預測和決策未來的目的,因此,經(jīng)常被稱為是數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge ̄Discovery in Databases)或data mining technology,主要是通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)和模式識別等方法對目標數(shù)據(jù)進行內(nèi)容規(guī)律的探索和模式的歸納總結(jié),在剖析內(nèi)在原因的基礎上為未來的可行性決策提供科學和嚴密的指導。所以,數(shù)據(jù)挖掘作為一種知識發(fā)現(xiàn)技術(shù)或數(shù)據(jù)挖掘技術(shù),呈現(xiàn)出以下特征:(1)數(shù)據(jù)挖掘所處理的數(shù)據(jù)規(guī)模十分巨大,一般為GB級,甚至TB級;(2)數(shù)據(jù)挖掘產(chǎn)生的規(guī)則是動態(tài)的,既要發(fā)現(xiàn)潛在規(guī)則,還要管理和維護規(guī)則;(3)傳統(tǒng)的數(shù)據(jù)庫查詢一般生成嚴格的結(jié)果集,但數(shù)據(jù)挖掘可能并不生成嚴格的結(jié)果集,可能會產(chǎn)生大量規(guī)則。[2]

一般而言,數(shù)據(jù)挖掘流程主要包括數(shù)據(jù)準備、數(shù)據(jù)挖掘、結(jié)果解釋和評價3個階段,如圖1所示:

結(jié)合圖1可以發(fā)現(xiàn),在數(shù)據(jù)準備階段,原始數(shù)據(jù)的獲得和目標數(shù)據(jù)的提取是數(shù)據(jù)挖據(jù)的基礎,而數(shù)據(jù)預處理則是數(shù)據(jù)準備階段的關鍵步驟(如缺失數(shù)據(jù)的推測、數(shù)據(jù)的降維、縮減及類型的縮減),直接關乎數(shù)據(jù)的準確度及有效性;在數(shù)據(jù)挖掘階段,主要是依據(jù)挖掘任務在前期數(shù)據(jù)預處理的基礎上,對目標數(shù)據(jù)實施具體的挖掘操作,挖掘算法的選定無疑是這個環(huán)節(jié)的重點;在前期數(shù)據(jù)準備和挖掘的基礎上,結(jié)果解釋和評價階段主要是模型的建立,以及結(jié)合用戶的實際情況進行合理的解釋,并不斷修正和深化模型,從而得出理想數(shù)據(jù)。本文旨在通過對某一工程項目,發(fā)生在對同一招標項目而產(chǎn)生的不同投標報價的數(shù)據(jù)進行數(shù)據(jù)挖掘,結(jié)合運籌學、統(tǒng)計學知識,對投標報價數(shù)據(jù)進行分析得到可進行挖掘的數(shù)據(jù),然后利用數(shù)據(jù)挖掘發(fā)掘具有串通投標行為及不平衡報價的規(guī)律性,為以后的評標工作提供參考。

二、投標報價數(shù)據(jù)的聚類方法分析

傳統(tǒng)的聚類算法只是衡量樣本的相似程度,顯然在投標報價分析中這種做法不合適,因為同一招標項目不同投標人的分部分項工程量的“綜合單價”數(shù)據(jù)中雖然有很多數(shù)據(jù)項相似,但由于有不平衡報價現(xiàn)象存在,最終會導致其歐氏距離很遠,反而不能聚在一個類當中,從而影響識別結(jié)果。目前,雖然數(shù)據(jù)挖掘知識在某些領域成功應用,但現(xiàn)有的數(shù)據(jù)挖掘方法不能直接應用在投標報價分析中,必須對現(xiàn)有的算法進行改進。對選取的投標報價數(shù)據(jù)如何進行衡量,以下將對這個問題進行分析。

1.對投標報價數(shù)據(jù)的觀察

以某招標項目為例,表1是招標項目的投標報價數(shù)據(jù)經(jīng)過數(shù)據(jù)清理、轉(zhuǎn)換和整理后的結(jié)果。該項目的分項項目總數(shù)有100多項,表1只列出核心的前8個物料和10個投標單位的報價情況,其他用省略號表示。

仔細觀察表1中的數(shù)據(jù)發(fā)現(xiàn),沒有兩個投標單位在同一分部分項工程的報價完全相同,而且因為招標投標制度已實行近20年,串通投標行為不斷演變,手段也越來越隱蔽,早期串通投標行為中表現(xiàn)出的投標報價中過多的雷同性或非正常錯誤一致等“疏忽”或“拙劣”表現(xiàn)一般不會輕易出現(xiàn),評標專家在評標過程中想直觀地識別出非正常的報價行為比較困難。當前招標工程項目的分部分項工程量清單的項目很多,大型工程可能多達上萬條,許多分部分項的報價相當接近,無法直觀看出投標單位之間的關聯(lián)性。

2.投標報價相似度的度量方法

基于表2數(shù)據(jù)看出,許多投標單位的編碼數(shù)據(jù)有的比較接近,有的差別很大,無法直接運用數(shù)據(jù)挖掘中的聚類算法(例如K ̄means法)進行相似性判斷,只能對算法進行一定的改進。因而,需要先計算每個樣本的均值和方差,然后提出一個衡量相似性的方法,表2即是計算各個單位報價的均值與方差得到的結(jié)果。

自由設定相似水平參數(shù)k(k∈[0,1]),若任意兩份投標報價數(shù)據(jù)各分項報價的差距Δk(Δ指兩個投標單位在同一分部分項報價的差值的絕對值除以該分部分項的方差,例如,投標單位2和3在編碼1的Δ=|19.69-19.27|/22.52),則認為該分項報價在該相似水平下被判定為相似(當k=0時,說明報價完全相同;當K>0時,說明報價的差距小于一定的程度),否則認為不相似。

令k=0,0.001,0.01,0.05,分別統(tǒng)計各份投標報價兩兩間存在相似分項報價的個數(shù),詳見表3。

在已設定的不同相似水平下,以投標單位相似的分項報價個數(shù)來衡量報價間的相似程度。對于串通投標的投標報價,其相似報價個數(shù)通常會高于非串通投標報價的相似分項報價個數(shù),且在不同相似水平下呈現(xiàn)規(guī)律性變化,即在不同的水平下,串通投標報價的相似分項報價個數(shù)均明顯高于非圍標間的。另外,《廣州市建設工程招投投標管理辦法》第6章《評標和中標》第34條“有下列情形之一的,經(jīng)評標委員會集體表決后認定,作串通投標處理,并提請招標投標監(jiān)管部門依法做出處罰:(一)不同投標人的投標文件內(nèi)容存在非正常一致的;(二)不同投標人的投標文件2處以上錯漏一致的;(三)不同投標人的投標報價或者報價組成異常接近或者呈規(guī)律性變化的”[4] 也為我們通過相似度判定串標行為提供了法律依據(jù)。我們可以將相似水平(K值)為0時的情況找出報價完全一致的項目,然后對應第1、2點去判定其是否屬于串標;也可以找出不同相似水平下相似度最高的幾家單位,重點核查其是否有其他串標行為的跡象。

由表3可知,單位01與08、01與09、02與08、08與09均存在3個項目報價完全一致,我們可以重點對照這些項目核查它們存在一致的合理性和概率,判定其是否存在串標。同時我們也可以看出,在相似水平(K值)設為0.001、0.01、0.05等不同水平下,上述4個單位比較結(jié)果的相似數(shù)目都比較大。例如,在相似水平(K值)取到0.05時,1和9的相似項目達到128項,占該項目總數(shù)132項的95%以上,串標的嫌疑是非常大的,值得評委在評標時重點關注。

三、投標報價數(shù)據(jù)相似度與差異度分析

“聚類模型主要用于辨別相似記錄并將這些記錄按它們所屬的不同組別進行分類。在聚類分析時,事先并不清楚這些組別和它們的屬性,甚至不知道到底應該生成多少組。這正是聚類模型與Clementine系統(tǒng)中其他機器學習技巧的區(qū)別——即無法預先設置的輸出結(jié)果或目標字段。聚類方法是基于記錄間和組間的測量距離,而記錄應被分派到某類中是基于使同一個類別的記錄間的距離盡可能最小的原則?!盵5]

1.投標報價數(shù)據(jù)相似度的挖掘分析

把一個招標項目中的投標報價數(shù)據(jù)兩兩進行相似度的對比,并把相似個數(shù)進行統(tǒng)計,利用Clementine軟件進行數(shù)據(jù)流的建立,按照既定的流程進行挖掘,由此得到表5。[5]

從聚類結(jié)果和相似度數(shù)據(jù)挖掘分析顯示的結(jié)果來看,有3家投標單位(編號為01、08、09)在投標報價過程中有串標的傾向和嫌疑,根據(jù)《中華人民共和國招標投標法實施條例》,需要提交給決標評委對其投標報價進行重點分析和審查。

2.投標報價數(shù)據(jù)差異度的挖掘分析

同樣利用Clementine及相關軟件建立相應的數(shù)據(jù)流,通過對投標報價數(shù)據(jù)的深度挖掘,挑選出差異度大的數(shù)據(jù)項。也就是說,通過計算機對數(shù)據(jù)進行定量、對比分析,在數(shù)據(jù)挖掘工具中設定一定的差異度范圍,找出報價與該分部分項其他投標單位報價差異較大的報價。在實際工程招標投標中,報價差異較大的原因很多,在日后工程結(jié)算時風險較大,值得評委在評標時運用專業(yè)知識進行審查或及時要求投標單位進行進一步澄清報價理由。這是經(jīng)濟標評審工作的重大核心價值所在,也是我們評標工作中的最重要、最需要完善的一項工作。特別是當前我們工程招標中普遍實行工程量清單計價,施工項目合同多數(shù)為單價合同而非總價包干合同,需對分部分項報價進行深入細致分析才能切實尋找出投標文件的風險所在,由評委在評標時提出適當?shù)膽獙Ψ椒?,真正保障招標人的利益,真正體現(xiàn)出招標制度的優(yōu)勢。[5]

四、研究結(jié)論及成效

綜上,本研究利用定量分析和定性分析相結(jié)合的方法,以某一公開招標項目不同投標文件的工程量清單的報價數(shù)據(jù)為案例,通過Excel數(shù)據(jù)表對提取的數(shù)據(jù)進行預處理,然后運用聚類分析方法,對處理后的數(shù)據(jù)運用數(shù)據(jù)挖掘技術(shù)分析其相似度和差異度,一方面嘗試根據(jù)投標單位在投標報價的相似度基礎上對串通投標行為進行判別,另一方面可依據(jù)投標報價的差異度,亦可對即將實施串標的行為給予風險預警,使得評標委員會在冗余繁忙的評標工作中節(jié)省時間、精力和財力,同時提高評標工作的科學性和公正性。其成效主要體現(xiàn)在以下兩方面:第一,全面介紹了報價分析應用和數(shù)據(jù)挖掘的研究現(xiàn)狀,以及數(shù)據(jù)挖掘技術(shù)在報價分析方面的應用及難點,同時對數(shù)據(jù)挖掘技術(shù)的特征和流程進行一定的歸納總結(jié),為數(shù)據(jù)挖掘的實施奠定了一定的理論基礎;第二,詳細介紹了對數(shù)據(jù)挖掘的分析處理和對目標數(shù)據(jù)的清理與轉(zhuǎn)換,重點是對數(shù)據(jù)的聚類分析及相似度和差異度進行了深入細致的分析,從而得出客觀科學的依據(jù)來指導并應用于實際工作。

五、研究不足與展望

本文利用數(shù)據(jù)挖掘技術(shù)在投標報價評審的應用實踐中取得了一些有用的結(jié)論,但由于時間精力有限,研究還存在一些不足之處。因此,還有一些問題值得進一步探討,后續(xù)研究可從以下幾個方面展開:

第一,數(shù)據(jù)挖掘算法的選擇。在挖掘過程中,由于時間精力有限,所以本文只選擇了聚類分析方法,在日后研究中,可以考慮能否設計一個新的、更優(yōu)的專門算法。相似水平(K值)怎樣選擇更加合理,是主觀設定的,其科學性不是很充分,其規(guī)律性有待進一步研究。

第二,挖掘數(shù)據(jù)集的細分。由于數(shù)據(jù)收集和時間有限,本課題主要對“工程量清單數(shù)據(jù)”“分部分項”中的“綜合單價”進行數(shù)據(jù)挖掘,在后續(xù)研究中,可以考慮對挖掘的數(shù)據(jù)集進行進一步的細分,使挖掘的結(jié)果更有針對性。

第三,報價分析應用系統(tǒng)的開發(fā)。目前的研究僅停留在利用一種數(shù)據(jù)挖掘算法針對部分數(shù)據(jù)進行了研究,后續(xù)研究可以把其他部分的數(shù)據(jù)也加進來建立模型,對數(shù)據(jù)的研究不但要縱向進行,還要對研究結(jié)果進行橫向分析。另外,將歷年投標報價數(shù)據(jù)進行挖掘分析還可以得出某類建設工程在某段時間內(nèi)的市場價格,找出市場價格和中標價格偏離程度很大的原因。將建立起來的模型合并,可以最終建立報價分析系統(tǒng),應用于日后的評標工作中。

參考文獻:

[1]

推進電子招標進程 打造陽光交易平臺:深圳市建設工程招標投標率先進入電子時代紀實[J]. 建筑市場與招標投標,2010(3):44-48.

[2]吳萌.基于數(shù)據(jù)挖掘的決策支持系統(tǒng) [EB/OL].(2012-11-10)[2017-08-27]. https://wenku.baidu.com/view/d9f41a16f18583d0496459ce.html.

[3]曹婷.數(shù)據(jù)挖掘在員工網(wǎng)絡招聘中的應用研究[D].廣州:暨南大學,2009.

[4]廣州市建設工程招標投標管理辦法[S/OL]. (2010-01-13)[2017-08-25].http://www.law110.com/law/city/guangzhou/2006law110200301241.html.

[5]劉智煥.經(jīng)濟標評審中的投標報價數(shù)據(jù)聚類分析[J].廣東交通職業(yè)技術(shù)學院學報, 2017,16(3):75-78

(責任編輯:鐘昭會)

猜你喜歡
串通評標報價
論惡意串通的立法問題
惡意串通與債權(quán)人撤銷權(quán)解釋論的三維意蘊
法大研究生(2020年1期)2020-07-22 06:05:30
我國政府采購中串通投標行為法律規(guī)制的路徑
法制博覽(2018年6期)2018-01-23 00:48:50
基于TOPSIS模型的精益評標方法
評標工作中有關量化指標體系建立的探討
設計評標應該重視評標準備與初步評審
電力工程招標評標方法的幾點思考
星蟲·大人們著了魔
報價
報價
朝阳市| 旺苍县| 红桥区| 鄂温| 来宾市| 峡江县| 阜新| 南城县| 涿州市| 南澳县| 拜城县| 汾阳市| 淮北市| 封丘县| 洱源县| 巍山| 寿阳县| 启东市| 贵溪市| 昌宁县| 新田县| 长春市| 疏附县| 彭州市| 中牟县| 石狮市| 达尔| 贺州市| 塔河县| 油尖旺区| 呈贡县| 铅山县| 理塘县| 徐州市| 祁阳县| 勐海县| 巴彦县| 临朐县| 婺源县| 建阳市| 开鲁县|