湯 駿
(南通市公共資源交易中心(南通市政府采購中心), 江蘇 南通 226001)
評標是招標采購活動中最關(guān)鍵的環(huán)節(jié)之一,也是最易引發(fā)質(zhì)疑和投訴的環(huán)節(jié)之一。由于評標主要依靠人的主觀判斷,易受評標專家能力不夠、經(jīng)驗不足、態(tài)度敷衍,以及外界干擾等諸多不利因素影響,導(dǎo)致評標結(jié)果不公正、不公平現(xiàn)象一直存在且難以有效根治。加之實施“放管服” 改革以后,招標采購參與門檻進一步降低,企業(yè)參與投標的便利度大大增加,投標數(shù)量暴增,造成評標工作量超負荷,客觀上導(dǎo)致評委在有限時間內(nèi)難以精準地給出評標結(jié)論。如何借助人工智能技術(shù)克服和糾正不恰當?shù)娜藶橐蛩貑栴},遴選出實力強、信譽好、綜合素質(zhì)優(yōu)的投標人,既充分發(fā)揮評標專家的專業(yè)經(jīng)驗和技術(shù)優(yōu)勢,又可防止專家隨意行使自由裁量權(quán),切實提高評標質(zhì)量,已成為招標采購管理部門迫切需要解決的重要課題。
國內(nèi)研究者在智能評審領(lǐng)域已有一些初步探索,如盧晶等[1]通過將供應(yīng)商結(jié)構(gòu)化響應(yīng)數(shù)據(jù)與評標辦法相結(jié)合,設(shè)計了輔助專家評審的應(yīng)用工具,實現(xiàn)閱標記錄、關(guān)鍵參數(shù)自動對比、詳評自動算分等功能;王佩光等[2]提出采用主成分分析方法獲取影響企業(yè)信用等級的主要影響指標,將指標及對應(yīng)的企業(yè)信用等級作為樣本集,從原始樣本集有放回的生成隨機樹訓(xùn)練集,建立企業(yè)信用評估的隨機森林模型,并通過投票方式獲得企業(yè)信用等級等。
上述方法有一定的適用性限制,因此改變以往全量化評標的傳統(tǒng)做法,探索差別化評標具有較強的現(xiàn)實意義。
所謂全量化評標是指評標專家按照招標文件規(guī)定的評標程序、方法和要求,對全部投標文件逐項進行評審,并結(jié)合規(guī)范及經(jīng)驗給出定性或者定量結(jié)論的過程。按照評標程序和工作流程,通常先進行形式評審,再進行初步評審,最后詳細評審,既不會缺省步驟,也不顛倒順序,這是招標采購行業(yè)當前的通行做法。
所謂差別化評標是指通過比較待評審?fù)稑宋募c歷史投標文件,剔除已經(jīng)形成評標結(jié)論的部分(即不再對兩者之間相同的要素進行評審),只對新增或者調(diào)整的內(nèi)容進行“增量評審” 的過程。這種差別化評標方式可能會缺省步驟,也可能不按固定順序進行評標。
差別化包含兩層含義:一是評標起點的差別。對于全部投標文件而言,由于大多數(shù)投標人已有部分歷史評標記錄(除非是首次參與投標的企業(yè)),因此評標可能不是從形式評審開始,而是從初步評審甚至詳細評審開始,這與全量化評標從零開始的做法有明顯差異;二是評標關(guān)注點的差別。不同投標人的投標文件與其歷史投標文件比較,產(chǎn)生的待評審(即增量評審)內(nèi)容不一致,評標專家對于不同投標文件評審的關(guān)注點也就不盡相同,如有的投標文件需要重新復(fù)核其資質(zhì)、業(yè)績,有的投標文件只需要評審其施工組織設(shè)計方案即可。差別化評標的運行原理見圖1。
圖1 差別化評審原理圖示
差別化評標是招標采購領(lǐng)域的全新概念。雖然我國招投標法律體系中沒有類似定義,但是從邏輯推演和實踐應(yīng)用來看,差別化評標有理論依據(jù)和現(xiàn)實基礎(chǔ)。
1.2.1 差別化評標的理論依據(jù)
我國一直推行招投標文件標準化管理,國家發(fā)展改革委、有關(guān)的行業(yè)主管部門針對資格預(yù)審文件、招標文件、投標文件、合同文本等均制訂了統(tǒng)一示范文本。這些制式文本在要素構(gòu)成、順序結(jié)構(gòu)等方面有固定格式和明確規(guī)定,為推行差別化評標提供了有利條件。對于企業(yè)而言,盡管招標項目千差萬別,但每一次投標需要提供的基礎(chǔ)材料均雷同。例如,《中華人民共和國標準設(shè)計招標文件(2017 年版)》(以下簡稱《標準設(shè)計招標文件》)規(guī)定,投標文件包括8 項內(nèi)容:(1)投標函及投標函附錄;(2)法定代表人身份證明或授權(quán)委托書;(3)聯(lián)合體協(xié)議書;(4)投標保證金;(5)設(shè)計費用清單;(6)資格審查資料;(7)設(shè)計方案;(8)投標人須知前附表規(guī)定的其他資料。上述8 項材料中,除第6 項“資格審查材料” 和第8 項“設(shè)計方案” 會因項目不同而作調(diào)整以外,其他材料均無太大變化。若待評審項目與已評審項目的規(guī)模、類型和質(zhì)量標準要求一致或者相近,那么“資格審查材料” 也不會有顯著變化。評標專家無需將投標文件全部評審一遍,完全相同的部分,可以“不用審” ,局部不同的部分可以“選擇審” ,而對于完全不同的部分才需要“仔細審” ,即無需對投標文件各部分平均用力用時評審。
《招標采購“循例評審” 原理和技術(shù)實現(xiàn)》[3]中提出一種智能評審新思路——循例評審。其基本假設(shè)是,當兩個招投標項目的項目特征、招標要約條件和投標響應(yīng)程度等三個維度信息完全一致時,若同一個投標單位參與投標,其評審結(jié)論應(yīng)該一致(至少是高度相近)。將差別化評標進行量化折算,若待評審項目投標企業(yè)的投標文件與歷史投標文件完全一致,那么其差別化程度為0,即可通過“循例評審” 方法直接得到評標結(jié)論;當差別化程度為100 %,即待評審文本與歷史文本無任何相似信息,則需要評委進行全量化評審;當差別化程度為0~100 %,就可通過差別化評標方法進行評審。說明差別化評審相較于循例評審具有更大的適用性,可實現(xiàn)局部或間斷的循例評審。
1.2.2 差別化評標的實踐依據(jù)
根據(jù)評標實踐,評標專家通常需要在查驗投標文件基本信息、鑒別業(yè)績獎項等級、核算工程造價規(guī)模等環(huán)節(jié)消耗大量的時間,而這些在以往項目中已經(jīng)過評委仔細評審并形成可靠結(jié)論。本文隨機抽取江蘇省南通市近3 年65 個項目2 490份房屋建筑和市政基礎(chǔ)設(shè)施工程項目的投標文件,經(jīng)統(tǒng)計測算發(fā)現(xiàn),在項目特征(如建筑面積、層高、跨徑)、工藝要求(結(jié)構(gòu)形式、抗震強度)等基本要素相似的招標活動中,同一個企業(yè)提供的投標文件在不同的項目中少有變化,企業(yè)的資質(zhì)證書和經(jīng)營范圍等基本信息不變,財務(wù)報表、業(yè)績獎項、人員配備、機械臺班等內(nèi)容也均高度雷同,差別主要集中在施工組織設(shè)計方案中因不同項目的水文、地質(zhì)條件變化而需要調(diào)整的部分。從投標文件文本的相似度來估算,70%~80%以上的篇幅完全一致,即對于評標專家而言,至少可縮減70 %~80 %以上的評標工作量。即便在項目特征和工藝要求等基本要素有顯著差異的不同項目中,同一企業(yè)提供的投標文件相似度也超過了30 %(形式評審內(nèi)容基本都相同),這是非??捎^的數(shù)字。很顯然,投標文件的相似度越高,節(jié)約的評標資源就越多。
一是效率高。差別化評標只對本次投標文件與樣本數(shù)據(jù)庫中歷史文件的不同之處進行評審,其評標工作量大大縮減。據(jù)統(tǒng)計,對于一般的投標人而言,在3~5 年的周期內(nèi),主要資質(zhì)等級、重大業(yè)績獎項、主要管理人員的執(zhí)業(yè)資格等方面信息變化很少,大量的形式評審工作量可以直接忽略,有效提升了評標效率。
二是精度高。樣本數(shù)據(jù)庫中的歷史投標文件已進行過“標定” ,新舊投標文件中相同內(nèi)容的部分不再重復(fù)評審,能有效地避免因不同的評標專家重復(fù)評審可能導(dǎo)致的與以往評標結(jié)論不一致的結(jié)果,確保評標尺度完全一致,評標結(jié)論穩(wěn)定、均衡、可信。
三是成本低。評標的效率和精度獲得提升,評標時間大大壓縮,招標人支付的評標費用、評標設(shè)施和場地的運維費用也相應(yīng)降低,評標場次周轉(zhuǎn)率明顯提升,評標的單位成本大幅減少。
建立差別化評標工作機制,首先要將沉淀的海量歷史投標文件及其評審結(jié)論資料,按照預(yù)先設(shè)定的規(guī)則分門別類,進行文本信息結(jié)構(gòu)化拆解和提取,并形成樣本數(shù)據(jù)庫;再將待評審文本導(dǎo)入樣本數(shù)據(jù)庫并進行文本信息要素碰撞、比對或者匹配化處理;最后生成真正需要評標專家人工評審的待評標文本。差別化評標的工作流程如圖2所示。
圖2 差別化評標的工作流程
投標文件文本信息結(jié)構(gòu)化處理是差別化評標工作的第一步,也是決定差別化評標能否取得成功的最關(guān)鍵一步。結(jié)構(gòu)化處理的目的是將自然語言轉(zhuǎn)化為一種能被計算機理解的形式。計算機快速實現(xiàn)對文本的理解,為下一步文本的比較、篩選、判斷和信息提取做準備。我國招標采購大部分已實現(xiàn)電子化,大多是通過專用投標文件工具軟件制作生成投標文件,無論是文本目錄構(gòu)成、篇章層次還是字體格式,均具有模塊化規(guī)制的特點。文本的凝聚度高而自由度很低,有效減少了文本信息結(jié)構(gòu)化處理的難度,也是推行差別化評標的有利條件。圖3 是某投標文件自動化制作工具,其具有高度封裝性,能使用戶使用“搭積木” 方式快速地生成投標文件。
圖3 某投標文件自動化制作工具
投標文件有商務(wù)標、技術(shù)標、報價函三個主要部分。實踐中,商務(wù)標函所包含的諸如資質(zhì)證書、項目負責人注冊執(zhí)業(yè)證書、安全生產(chǎn)許可證書,以及有關(guān)的社保信息、業(yè)績材料與獎項證明、稅務(wù)繳納情況、財務(wù)報表信息,大多是按照規(guī)定格式直接調(diào)用或者自動生成,不存在手工編輯、錄入的過程。報價函(工程量清單計價文件)也通過專業(yè)造價軟件生成,基本無需其他結(jié)構(gòu)化技術(shù)介入處理。
由于投標文件內(nèi)容龐雜,特別是技術(shù)標函中的“施工組織設(shè)計方案” ,投標單位會根據(jù)項目的具體特點和工藝要求等進行針對性編撰,因此必須引入自然語言處理技術(shù)才能實現(xiàn)文本結(jié)構(gòu)化。投標文件區(qū)別于一般的文學(xué)作品,經(jīng)大樣本的詞典訓(xùn)練,并應(yīng)用深度學(xué)習(xí)、知識圖譜、語義情感推理技術(shù),可將投標文件文本進行有效的結(jié)構(gòu)化處理。若短期內(nèi)技術(shù)難度太大,或有法律法規(guī)不適應(yīng)的情況,這部分內(nèi)容可以保留人工評審的做法。
若將投標文件文本信息結(jié)構(gòu)化處理的過程看作是機器學(xué)習(xí)中的“分類” 過程,那么文本要素信息歸集就是“聚類” 過程,即按照預(yù)先設(shè)定的規(guī)則,將結(jié)構(gòu)化拆解后的信息有序歸類并形成數(shù)據(jù)庫,以便于分析、比較和信息提取。而這種規(guī)則的設(shè)定主要依據(jù)是招標文件規(guī)定的評標程序和評標辦法。經(jīng)歸集處理后形成的文本要素信息數(shù)據(jù)庫見圖4。
圖4 投標文件文本信息要素歸集數(shù)據(jù)庫示意
以《標準設(shè)計招標文件》為例,一般設(shè)計投標文件的文本信息歸集處理方式如下:
(1)形式評審標準:投標人名稱、投標函及投標函附錄簽字蓋章、投標文件格式、聯(lián)合體投標人、備選投標方案;
(2)資格評審標準:營業(yè)執(zhí)照和組織機構(gòu)代碼證、資質(zhì)要求、財務(wù)要求、業(yè)績要求、信譽要求、項目負責人、其他主要人員;
(3)響應(yīng)性評審標準:投標報價、投標內(nèi)容、設(shè)計服務(wù)期限、質(zhì)量標準、投標有效期、投標保證金、權(quán)利義務(wù)、設(shè)計方案;
(4)資信業(yè)績評分標準:信譽類似項目業(yè)績、項目負責人資歷和業(yè)績、其他主要人員資歷和業(yè)績;
(5)設(shè)計方案評分標準:包括設(shè)計范圍、設(shè)計內(nèi)容、設(shè)計依據(jù)、設(shè)計工作目標、設(shè)計機構(gòu)設(shè)置和崗位職責,設(shè)計說明和設(shè)計方案,設(shè)計質(zhì)量、進度、保密等保證措施,設(shè)計安全保證措施,設(shè)計工作重點、難點分析,合理化建議等。
完成文本信息的結(jié)構(gòu)化拆分、并按規(guī)則生成歸類數(shù)據(jù)集后,可對待評審文本與歷史文本進行比對,即進行文本的匹配度(或者說語義相似度)分析。在投標文件文本結(jié)構(gòu)化比較完善的前提下,從難易程度看,匹配方法主要有三種:
一是基于關(guān)鍵詞搜索的匹配。這是最簡單,也是誤判率最低的匹配。例如企業(yè)的資質(zhì)證書等級、項目負責人的執(zhí)業(yè)資格證書、個人社會保險代碼等具有唯一性特征元素的比對。關(guān)鍵詞匹配的應(yīng)用場景主要集中在資格、資信評審等環(huán)節(jié)。當然,關(guān)鍵詞匹配過程并不僅停留于“詞語” 這個最小單元,可擴展至任意劃分的“整體單元” 的匹配和比較,如冬雨季施工方案、噪音和揚塵控制措施等。
二是基于算法的語義相似度計算。語義相似度計算的基本思路是將文本映射到向量空間,利用余弦相似度算法模型等計算兩類文本是否相似。當前基于語義的中文文本相似度的算法包括向量空間模型算法(VSM)、隱性語義索引(LSI)算法、奇異值分解法(SVD)等等。這些算法在時間成本及運維效率方面各有優(yōu)缺點,需要結(jié)合實際恰當選用。相似度計算主要應(yīng)用于短文本比較,例如待評審文本語句是“項目經(jīng)理擔任過省級科研攻關(guān)項目負責人并獲得創(chuàng)新成果二等獎” ,而數(shù)據(jù)庫中的文本語句是“項目經(jīng)理作為項目負責人在省級科研攻關(guān)項目中獲得了創(chuàng)新成果二等獎” ,經(jīng)相似度模型計算即能判斷這兩類短文本語義相同。
三是基于深度學(xué)習(xí)方法的語義推理。更高難度的相似度計算需要運用深度學(xué)習(xí)方法,包括先驗知識、知識圖譜等技術(shù)的應(yīng)用。一般要先建立詞典,構(gòu)建訓(xùn)練語料,再通過監(jiān)督(半監(jiān)督)方法完成語義的推理和相似度計算。該匹配方法主要應(yīng)用于大篇幅主觀文本的比對,如施工組織設(shè)計方案相似程度的比較。如果缺乏完備的詞庫和足夠的語料訓(xùn)練,則由評標專家人工評審更為合適。
實際上,如果文本信息的結(jié)構(gòu)化過程在統(tǒng)一規(guī)則下進行,就不存在相似度分析的問題。但是,結(jié)構(gòu)化過程不可能完全規(guī)整,一定會有遺漏、差錯(語義混亂),因此人工智能技術(shù)的介入必不可少。
上述全部標識完成以后即生成待評審文本,計算機將自動出具一份標識差異信息的對比報告,同時列出待評審文本出現(xiàn)在樣本數(shù)據(jù)庫中具體的歷史記錄。如企業(yè)提供的某項業(yè)績曾在哪次項目評審中出現(xiàn),其評審結(jié)論是什么等。評標專家可以瀏覽這些相似字段的歷史記錄,用于檢驗計算機提示的重合信息是否存在偏差,是否需要人工修正等等。
計算機形成差別化待評審文本后,交由專家評審。經(jīng)“過濾脫水” 處理后的待評審文本與原始文本相比,評審內(nèi)容大幅減少,評審工作量大大降低。專家可更集中精力對照招標文件要求,嚴格認真地完成剩余部分的評審并給出評標結(jié)論。值得注意的是,專家評標結(jié)論將作為新的素材載入樣本數(shù)據(jù)庫,成為下一次評審的源數(shù)據(jù),即每次的新評審內(nèi)容都將作為新“標尺” 納入數(shù)據(jù)庫并成為下一次評審的“參照比對答案” ,任何細小差錯都會引發(fā)連鎖反應(yīng),對后續(xù)評審產(chǎn)生一定影響。
某待評審項目為南通市***會議中心項目,其中一家投標企業(yè)是蘇州市***建筑有限公司,通過輸入篩選條件(一般以項目類型、特征、規(guī)模、造價等作為篩選字段)和調(diào)用數(shù)據(jù)庫后發(fā)現(xiàn),該單位曾先后于 2018 年 7 月 16 日和2020 年 3 月15日參與投標,相關(guān)投標信息如圖5 所示。
圖5 待評審文本與樣本數(shù)據(jù)庫文本信息的尋址匹配過程
從圖5 可以看出,計算機完成信息匹配檢查以后,待評審文本形成了三部分內(nèi)容。
第一部分是信息完全重合部分(即待評審信息與數(shù)據(jù)庫信息完全一致),屬于無需評審的內(nèi)容,如本次“南通市*** 會議中心項目” 中,蘇州***建筑公司提供的“房建一級資質(zhì)” 在“西安市***圖書館項目” 中已經(jīng)提供;項目負責人獲得獎項方面,在“淮安市***學(xué)校新建項目” 中也有提供,因此“資質(zhì)等級” 和“近3 年項目負責人獲得獎項” 兩項評審內(nèi)容均無需評審。
第二部分是信息局部重合部分(即待評審信息與數(shù)據(jù)庫信息局部相似但不完全一致),需要就兩者間存在差異的部分進行復(fù)核評審。如本次要求項目負責人有“一級建造師和高級職稱” ,但計算機匹配的兩個歷史項目中投標人提供的項目負責人信息分別是“二級建造師、中級職稱” 和“一級建造師、中級職稱” ,故僅需要就本次提供的“高級職稱” 一項進行復(fù)核即可(一級建造師無需復(fù)核)。
第三部分是信息未成功匹配部分(即待評審項目在歷史文本中未搜尋到任何匹配片段),主要是“施工組織設(shè)計方案” 等主觀性表述內(nèi)容。前文提到,這部分內(nèi)容盡管可以通過自然語言處理技術(shù)予以恰當處理,但是畢竟技術(shù)還不成熟,且計算機給出的結(jié)論是否可靠尚有存疑,一般以評委介入評審為主。統(tǒng)計數(shù)據(jù)表明,采用差別化評標方式后,評審用時不到兩個歷史項目平均用時的30%。
綜上分析可知,數(shù)據(jù)庫搜集的樣本越多,其待檢信息與歷史信息匹配契合度越高,除首次參與投標的企業(yè)(冷啟動問題),或企業(yè)投標信息發(fā)生巨大變化等情況外,運用差別化評標技術(shù)能極大地提升工作效率。
當前,合理管控專家評委在評標中的自由裁量權(quán),盡可能通過人工智能方法來克服人工評審的缺陷,確保評審結(jié)果穩(wěn)定、可靠、經(jīng)得起查驗,已經(jīng)成為招標采購行業(yè)的迫切需要。受法律約束和技術(shù)水平等因素影響,我國在智能評審方面的研究還很不充分,至今尚未找到理論上可行、實踐中可靠,并得到行業(yè)內(nèi)部普遍認可的解決方案。實踐應(yīng)用證明,基于歷史樣本數(shù)據(jù)搜索的差別化評標方法,在理論邏輯、可操作性、技術(shù)實現(xiàn)等方面優(yōu)勢明顯,可實現(xiàn)有條件替代人工評審,有良好的推廣前景。