国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于集成機器學習的數(shù)據(jù)資產(chǎn)定價模型及系統(tǒng)設計

2022-09-23 09:25:46任建宇
中國管理信息化 2022年14期
關鍵詞:定價資產(chǎn)價值

任建宇

(重慶交通大學 經(jīng)濟與管理學院,重慶 400000)

0 引言

當今社會背景下,經(jīng)濟蓬勃發(fā)展,數(shù)據(jù)體量不斷增長。我國政府始終密切關注數(shù)據(jù)發(fā)展,高度重視數(shù)據(jù)資產(chǎn)挖掘帶來的價值,并出臺多項專門政策支持數(shù)據(jù)資產(chǎn)應用于各大領域,由此,數(shù)據(jù)挖掘與應用領域迎來了悄無聲息卻影響深遠的革新。表1 是近年來我國出臺的關于數(shù)據(jù)發(fā)展的部分政策,筆者發(fā)現(xiàn)了相關政策對數(shù)據(jù)資產(chǎn)定價的有效指引,認識到有效發(fā)掘數(shù)據(jù)資產(chǎn)價值、快速實現(xiàn)數(shù)據(jù)資產(chǎn)交易已逐漸成為市場創(chuàng)造價值和促進決策的熱點。

表1 關于數(shù)據(jù)發(fā)展的部分政策文件統(tǒng)計

數(shù)據(jù)資產(chǎn)交易雖逐漸成為熱點,但目前市場數(shù)據(jù)資產(chǎn)的有效挖掘仍存在諸多難點和限制。數(shù)據(jù)資產(chǎn)是一種全新的無形資產(chǎn),也因此具備無形資產(chǎn)的屬性特點,即無實體形態(tài),具有不確定性、時效性、非競爭性等。同時,數(shù)據(jù)的價值會受到數(shù)據(jù)容量、用途、規(guī)模等因素直接或間接的影響。筆者針對以上情況,在對大數(shù)據(jù)資產(chǎn)的應用場景及價值影響因素進行界定的基礎上,應用集成機器學習的算法來評估數(shù)據(jù)資產(chǎn)價值,從而對數(shù)據(jù)資產(chǎn)進行更準確的價值評估。

1 文獻綜述

目前,不少學者通過改進傳統(tǒng)研究方法建立定價模型,進行價值評估。其中,成本法、市場法和收益法是傳統(tǒng)資產(chǎn)評估方法的代表。成本法作為反映企業(yè)經(jīng)營情況最基本的方法,在市場不活躍的情況下更為適用,相較于收益法和市場法具有較大優(yōu)勢。市場法是指對市場上相同或相似資產(chǎn)的近期交易價格通過直接或者間接對比,分析其中的差異,估算數(shù)據(jù)資產(chǎn)的價值。劉琦等人提出了運用“市場法”評估數(shù)據(jù)資產(chǎn)價值的基本思路,在對技術水平、價值密度、數(shù)據(jù)容量等差異因素進行量化調(diào)整的基礎上,評估同一類型的大數(shù)據(jù)資產(chǎn)的價值。收益法是評估大數(shù)據(jù)資產(chǎn)價值的首要方法。收益法在國際企業(yè)價值評估中的地位愈發(fā)突出,其使用前提是已知數(shù)據(jù)預期收益、折現(xiàn)率和效益期限。陳媛將收益法運用于房地產(chǎn)估價中,從多個維度進行深度思考。黃樂等人借鑒同樣作為無形資產(chǎn)的品牌價值評估的主流辦法,將收益法、成本法和市場法結合已有的數(shù)據(jù)資產(chǎn)評估模型,創(chuàng)造性地將平臺活躍系數(shù)等參數(shù)引入平臺式數(shù)據(jù)資產(chǎn)價值評估模型。左文進和劉麗君則在傳統(tǒng)數(shù)據(jù)資產(chǎn)評估方法的基礎上引入Shapley 值法和破產(chǎn)分配法,從而構建大數(shù)據(jù)資產(chǎn)價值評估模型。

由此可見,數(shù)據(jù)資產(chǎn)價值評估仍處于發(fā)展探索階段,學術界對于數(shù)據(jù)資產(chǎn)價值評估缺乏統(tǒng)一的評判標準。另外,傳統(tǒng)算法前期需要繁復的特征工程,效率低下,模型精確度很大程度上會受到特征工程的干擾。因此,構建相對完善的評估系統(tǒng)、選擇客觀正確的衡量標準對于健全當前數(shù)據(jù)資產(chǎn)評估體系具有積極意義。

2 數(shù)據(jù)資產(chǎn)定價模型的建立

數(shù)據(jù)資產(chǎn)評估特征多、特征復雜且冗余度高,使得如何尋找評估分類器的最優(yōu)評估特征集成為難點。鑒于此,筆者通過建立一個模型,有效處理樣本缺失值,降低特征工程的難度,提高精度。

在建立本數(shù)據(jù)資產(chǎn)定價模型時,筆者使用了多種模型和算法幫助系統(tǒng)功能的實現(xiàn),包括引入詞向量的概念,將文本數(shù)據(jù)轉化為可供機器識別的數(shù)字數(shù)據(jù),即對原始數(shù)據(jù)進行數(shù)字化預處理。另外,筆者利用爬蟲抓取網(wǎng)絡數(shù)據(jù)后生成原始數(shù)據(jù)表,該數(shù)據(jù)表將表格作為載體,在對數(shù)據(jù)表進行詞向量化后生成詞向量矩陣,將表中的文本數(shù)據(jù)轉化為能被機器識別且與文本相對應的數(shù)字數(shù)據(jù)。除此之外,將以下模型和算法運用于整個系統(tǒng)的建立與運行過程中,這是本定價模型和系統(tǒng)的核心。①CBOW 模型(Continuous Bag-Of-Words Model)主要用于實現(xiàn)系統(tǒng)中詞預測的功能,設定某個中心詞的前后選取范圍,通過范圍內(nèi)連續(xù)詞來計算該中心詞出現(xiàn)的概率。②長短期記憶神經(jīng)網(wǎng)絡(Long Short-Term Memory LSTM)相較于無法處理長距離依賴問題的循環(huán)神經(jīng)網(wǎng)絡,其細胞的結構和運算存在變化。其細胞狀態(tài)能夠傳遞序列處理過程中的信息,在訓練過程中通過“門”結構不斷學習保存或遺忘來實現(xiàn)添加和移除信息。③XGBoost 算法運用于預測結果的全過程,首先采用CART 回歸樹對數(shù)據(jù)進行擬合,每個樣本可得到相應預測分數(shù),將所有分數(shù)相加,可得到該樣本在此模型下的分數(shù)。

從數(shù)據(jù)形態(tài)的角度來看,本系統(tǒng)基于以上算法和模型將原始數(shù)據(jù)進行數(shù)次分析轉化,得出評估數(shù)據(jù)價值的結果。原始數(shù)據(jù)利用爬蟲獲取的文本數(shù)據(jù)在CBOW 模型的作用下轉化為可供機器識別的數(shù)據(jù),并建立數(shù)據(jù)矩陣生成三維詞向量,在LSTM 神經(jīng)網(wǎng)絡的作用下使詞向量二維化,最后利用XGBoost 算法進行回歸分析,預測數(shù)據(jù)的價值。

3 系統(tǒng)設計及運行流程

3.1 系統(tǒng)功能實現(xiàn)

在建立數(shù)據(jù)資產(chǎn)評估模型的基礎上,數(shù)據(jù)資產(chǎn)評估系統(tǒng)可以做到以下幾點。首先,界定數(shù)據(jù)資產(chǎn)的使用場景。數(shù)據(jù)具有多維使用的特性,不同應用場景下的數(shù)據(jù)資產(chǎn)價值不盡相同,因此在定價前要分析數(shù)據(jù)資產(chǎn)標題的文本相似度,根據(jù)應用場景將其劃分為不同類別。其次,推進數(shù)據(jù)資產(chǎn)定價合理化。根據(jù)現(xiàn)有數(shù)據(jù)資產(chǎn)交易平臺上的交易相關信息構建恰當?shù)闹笜梭w系,形成系統(tǒng)框架;根據(jù)可比交易的歷史數(shù)據(jù)構建基于市場法的數(shù)據(jù)資產(chǎn)估值定價模型,為數(shù)據(jù)資產(chǎn)交易定價的公平合理提供更多、更易于被廣泛接受的實踐依據(jù),同時支持實時數(shù)據(jù)估值計算。在對數(shù)據(jù)資產(chǎn)特征進行研究的基礎上,使用機器學習相關算法,建立數(shù)據(jù)資產(chǎn)實時估值系統(tǒng),通過模型參數(shù)的調(diào)優(yōu)提高估值效率。數(shù)據(jù)估值系統(tǒng)的組成部分主要包括數(shù)據(jù)采集器、數(shù)據(jù)處理器、交互模塊和數(shù)據(jù)估值模型。

3.2 系統(tǒng)模塊設計

3.2.1 數(shù)據(jù)輸入接口模塊

數(shù)據(jù)輸入接口模塊能夠反映數(shù)據(jù)資產(chǎn)交易信息特征類型多的特點。該模塊分為兩個子模塊:一是數(shù)據(jù)輸入模塊。此模塊測試數(shù)據(jù)包括數(shù)據(jù)大小、數(shù)據(jù)類型、字段數(shù)量、數(shù)據(jù)條數(shù)、采集時間等自變量數(shù)據(jù)。二是數(shù)據(jù)分類模塊。此模塊按照產(chǎn)業(yè)經(jīng)濟、金融征信、輿情監(jiān)測、科研技術等應用場景,利用文本相似度將數(shù)據(jù)輸入模塊中,劃分為不同的可比案例集。

3.2.2 數(shù)據(jù)采集模塊

數(shù)據(jù)資產(chǎn)具備量大、高維、數(shù)據(jù)類型多樣等特點,本系統(tǒng)有針對性地組建數(shù)據(jù)采集模塊,借助Python對數(shù)據(jù)資產(chǎn)交易平臺作最大限度的信息獲取,信息類型包括塊數(shù)據(jù)和數(shù)據(jù)資產(chǎn)標題、數(shù)據(jù)大小、數(shù)據(jù)條數(shù)、交易價格等。

3.2.3 異常數(shù)據(jù)預處理模塊

針對歷史交易數(shù)據(jù)存在數(shù)據(jù)類型繁雜、數(shù)據(jù)源不唯一、數(shù)據(jù)存在缺失等問題,本系統(tǒng)組建異常數(shù)據(jù)預處理模塊,以提高數(shù)據(jù)質量。在實現(xiàn)數(shù)據(jù)采集和存儲后,將若干條數(shù)據(jù)資產(chǎn)歷史交易信息數(shù)據(jù)輸入該模塊,進行一致性檢驗、缺失數(shù)據(jù)處理和回歸分析等預處理操作。

3.2.4 特征工程構建模塊

在特征工程構建模塊輸入若干條數(shù)據(jù)資產(chǎn)交易歷史信息數(shù)據(jù),輸出對應模型的特征數(shù)據(jù),具體實現(xiàn)以下3 方面功能。①文本情感分析。將數(shù)據(jù)資產(chǎn)標題的文本轉化為詞向量,再利用詞向量平均模型將其轉化為句向量,通過卷積神經(jīng)網(wǎng)絡實現(xiàn)特征降維。②One-Hot編碼。對于商品類別和數(shù)據(jù)類型這兩類分類特征,將離散特征的取值擴展到歐式空間,優(yōu)化特征之間的距離計算,使其更具合理性。③對于數(shù)據(jù)大小、采集時間、字段數(shù)量、字段條數(shù)等變量采用歸一化和標準化處理方式,消除量綱級影響。

3.2.5 估值定價模塊

在估值定價模塊輸入特征工程提取的特征信息,輸出待估數(shù)據(jù)資產(chǎn)的參考定價,具體實現(xiàn)以下兩方面功能。一是輸入可比實例與數(shù)據(jù)資產(chǎn)特征數(shù)據(jù),通過編碼完成匹配后形成特征價格矩陣,作為可比基礎。二是根據(jù)輸入可比實例的特征數(shù)據(jù),利用XGBoost 等多種機器學習算法訓練數(shù)據(jù),輸入得到的可比案例至模型中,準確計算待估數(shù)據(jù)資產(chǎn)的市場價值并輸出參考價格。

3.3 系統(tǒng)運行流程

系統(tǒng)運行流程如圖1 所示。首先利用Python 爬蟲技術在數(shù)據(jù)資產(chǎn)交易平臺上收集數(shù)據(jù)資產(chǎn)交易歷史信息數(shù)據(jù),在數(shù)據(jù)輸入模塊輸入數(shù)據(jù),其中包括數(shù)據(jù)大小、類型、字段數(shù)量、數(shù)據(jù)條數(shù)、采集時間等;隨后進行數(shù)據(jù)處理,針對數(shù)據(jù)類型繁雜、數(shù)據(jù)源不唯一、數(shù)據(jù)缺失等問題對數(shù)據(jù)進行一致性檢驗、缺失數(shù)據(jù)處理和回歸分析等預處理操作;將經(jīng)過預處理的數(shù)據(jù)輸入對應模型的特征數(shù)據(jù),對數(shù)據(jù)資產(chǎn)標題進行文本情感分析、One-Hot 編碼與數(shù)據(jù)的歸一化和標準化處理;最后輸入可比實例的特征數(shù)據(jù),利用神經(jīng)網(wǎng)絡等多種機器學習算法對數(shù)據(jù)進行訓練,將得到的可比案例輸入模型,準確計算待估數(shù)據(jù)資產(chǎn)的市場價值,并輸出參考價格。

圖1 系統(tǒng)運行流程

4 系統(tǒng)運行效果與展望

本系統(tǒng)已開發(fā)成功,可進行多個對象的預測,應用人工智能對數(shù)據(jù)資產(chǎn)特征進行系統(tǒng)分析、提取與量化。在完善評估系統(tǒng)后,評估系統(tǒng)部署于阿里云服務器,便于外部基本用戶使用。本系統(tǒng)基于集成人工智能算法,有效解決了數(shù)據(jù)資產(chǎn)交易歷史數(shù)據(jù)特征多、特征復雜、冗余度高的問題,相對于一般的機器學習算法具有更好的泛化能力和模型精度。系統(tǒng)可操作性強,可服務于數(shù)據(jù)資產(chǎn)估價機構及各大數(shù)據(jù)交易網(wǎng)站,具有強推廣性和自主成長能力。

本系統(tǒng)將順應時代發(fā)展不斷更新。筆者認為,此定價模型及系統(tǒng)能適用更優(yōu)化的模型和算法,從系統(tǒng)的預測精度和速度兩個維度進行提升,利用體量更大、質量更好的數(shù)據(jù)不斷訓練優(yōu)化模型,并持續(xù)更新數(shù)據(jù),以滿足系統(tǒng)的時效性要求。

猜你喜歡
定價資產(chǎn)價值
本刊2020年36卷第12期版權頁定價勘誤
輕資產(chǎn)型企業(yè)需自我提升
商周刊(2018年19期)2018-10-26 03:31:24
央企剝離水電資產(chǎn)背后
能源(2017年7期)2018-01-19 05:05:02
基于分層Copula的CDS定價研究
一粒米的價值
“給”的價值
幫爸爸定價
讀寫算(下)(2015年11期)2015-11-07 07:21:02
關于資產(chǎn)減值會計問題的探討
自主定價基本不可能
把維護作為一種資產(chǎn)
密云县| 通许县| 惠州市| 长葛市| 孝昌县| 凉城县| 咸阳市| 咸丰县| 宽城| 湖州市| 罗定市| 永宁县| 巩义市| 海丰县| 靖远县| 霍山县| 湘潭市| 江陵县| 武宣县| 柞水县| 台北县| 昭通市| 苗栗县| 清水县| 天门市| 慈溪市| 承德县| 永善县| 焦作市| 汉沽区| 株洲县| 集贤县| 六盘水市| 广昌县| 顺平县| 大埔县| 宁晋县| 夏邑县| 博爱县| 驻马店市| 萨嘎县|