国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

樣本

  • 基于自然最近鄰的不平衡數(shù)據(jù)欠采樣方法
    衡數(shù)據(jù)是指各類別樣本的數(shù)量有巨大差異的數(shù)據(jù)集,其廣泛存在于金融欺詐檢測、醫(yī)療診斷、故障預(yù)測等實(shí)際應(yīng)用中。在將支持向量機(jī)、貝葉斯分類器、神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)的分類模型用于不平衡數(shù)據(jù)的分類時,分類器傾向于學(xué)習(xí)多數(shù)類樣本的特征而忽略了少數(shù)類,容易將少數(shù)類樣本識別為多數(shù)類,無法保證少數(shù)類樣本的分類準(zhǔn)確率。而由于少數(shù)類樣本往往具有重要價(jià)值,因此其類別的誤判會造成嚴(yán)重的損失。以保險(xiǎn)欺詐檢測為例,欺詐行為的數(shù)量遠(yuǎn)遠(yuǎn)小于正常交易的數(shù)量,如果不能檢測出欺詐活動,那么將會造成機(jī)構(gòu)資

    統(tǒng)計(jì)與決策 2023年15期2023-08-23

  • 噪聲主觀評價(jià)中的白噪聲標(biāo)準(zhǔn)樣本法及其應(yīng)用
    時,選取確定的聲樣本作為參考聲樣本能得到一致性更高的結(jié)果,因此人們更多地采用參考評分法[7-9]。使用該方法時,一般會在全體待評價(jià)聲樣本中選取感知特性適中的待評價(jià)樣本作為參考聲樣本,因而被稱為待測樣本法。在評價(jià)過程中,如果參考樣本與待評價(jià)樣本類型相同,可比性強(qiáng),則被試評分一致性高,可得到準(zhǔn)確的評價(jià)值。但不同實(shí)驗(yàn)中選取的參考樣本往往不同,使得實(shí)驗(yàn)結(jié)果之間不具可比性。為此,Nilsson[10]提出將每個實(shí)驗(yàn)聲樣本的煩惱度表示為粉紅噪聲等效聲級,即用具有相同煩

    西北工業(yè)大學(xué)學(xué)報(bào) 2022年4期2022-09-09

  • 采用雙層優(yōu)選策略的主動學(xué)習(xí)算法及其應(yīng)用
    的限制,采集到的樣本中通常無標(biāo)簽樣本占比大,有標(biāo)簽樣本占比少。為充分利用這些樣本信息,半監(jiān)督學(xué)習(xí)和主動學(xué)習(xí)算法相繼提出并應(yīng)用于圖像分類[1-2]、故障檢測[3-4]、工業(yè)過程建模[5-6]等領(lǐng)域。傳統(tǒng)的半監(jiān)督學(xué)習(xí)算法通過對無標(biāo)簽樣本進(jìn)行標(biāo)記以擴(kuò)大有標(biāo)簽樣本集,以此達(dá)到提升模型精度的目的[7-10]。區(qū)別于半監(jiān)督學(xué)習(xí)算法僅利用無標(biāo)簽樣本來提升模型性能,主動學(xué)習(xí)借助專家知識,對優(yōu)選出的無標(biāo)簽樣本進(jìn)行人工標(biāo)記[11-12],獲取其真實(shí)標(biāo)簽,并將標(biāo)記后的樣本加入有

    智能系統(tǒng)學(xué)報(bào) 2022年4期2022-08-19

  • 一種改進(jìn)的不平衡數(shù)據(jù)過采樣算法BN-SMOTE?
    不同類別之間數(shù)據(jù)樣本的不均衡分布,其中大多數(shù)樣本屬于某種類別,而剩余的樣本屬于其它類別。許多實(shí)際的應(yīng)用領(lǐng)域中都存在不均衡數(shù)據(jù)集的分類問題,例如醫(yī)療診斷[1]、信息檢索系統(tǒng)[2]、欺詐性電話的檢測[3]、直升機(jī)故障檢測[4]等。傳統(tǒng)的分類方法傾向于對多數(shù)類有較高的識別率,對于少數(shù)類的識別率卻很低。因此不均衡數(shù)據(jù)集的分類問題的研究需要尋求新的分類方法和判別準(zhǔn)則。目前最流行的處理不平衡學(xué)習(xí)問題的方法多是基于過采樣方法來延伸的。在本文中,首先介紹了SMOTE 算法

    計(jì)算機(jī)與數(shù)字工程 2020年9期2020-11-02

  • 不平衡分類的數(shù)據(jù)采樣方法綜述
    ]中,在幾百萬個樣本基因里可能僅有一個基因是癌癥基因;電信通訊中只有少數(shù)通訊是具有欺詐行為的通訊記錄[4-5];軟件檢測中也只有不到10%的軟件是具有缺陷的[6]。不平衡數(shù)據(jù)普遍存在于人類生活的方方面面,不僅數(shù)據(jù)分布廣泛,而且數(shù)據(jù)比例不均衡。在不平衡數(shù)據(jù)中數(shù)量多的樣本稱為負(fù)樣本,數(shù)量少的樣本稱為正樣本。正負(fù)樣本擁有較大的比例差距,例如:全國1年中雷電天氣(正樣本)天數(shù)占全年天數(shù)的比例不到10%;新生體檢中患肺結(jié)核疾病的學(xué)生人數(shù)占比不到1‰。在數(shù)據(jù)分類評價(jià)指

    重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)) 2019年7期2019-08-17

  • 一種基于混合采樣的非均衡數(shù)據(jù)集分類算法
    數(shù)據(jù),是指某一類樣本的數(shù)量明顯少于另一類樣本的數(shù)量,即多數(shù)類(負(fù)類)和少數(shù)類(正類)存在比例失衡[5].在非均衡數(shù)據(jù)集中少數(shù)類可能比多數(shù)類包含著更多有價(jià)值的信息,在這種情況下,正確識別少數(shù)類比正確識別多數(shù)類更加重要.隨機(jī)森林[6]通過自助采樣[7]獲取樣本集,從而構(gòu)建決策樹得到很好的分類預(yù)測效果,常被用于數(shù)據(jù)集分類研究[8,9]中.但在實(shí)際應(yīng)用中,因?yàn)樗@得的數(shù)據(jù)常常表現(xiàn)為非均衡數(shù)據(jù)[10],所以在數(shù)據(jù)處理方面經(jīng)常引入欠采樣和過采樣方法,對于非均衡數(shù)據(jù)集的

    小型微型計(jì)算機(jī)系統(tǒng) 2019年6期2019-06-06

  • 中國生物樣本庫資源管理與應(yīng)用現(xiàn)狀分析
    090)探討生物樣本庫的管理與應(yīng)用,首先需要明確生物樣本的定義,生物樣本是指從生物個體獲得的物質(zhì),生物資源是指融合生物樣本實(shí)體、生物分子信息及生物樣本表型數(shù)據(jù)的綜合資源[1]。生物樣本庫是指所有涉及生物資源收集、處理、保存和使用的機(jī)構(gòu),包括人類生物樣本庫、動物樣本庫、植物樣本庫和微生物樣本庫。人類生物樣本庫是針對人類生物資源收集、處理、保存和使用的機(jī)構(gòu),人類生物樣本包括原始樣本如:血液、組織、尿液、唾液、糞便、毛發(fā)和皮屑等,還有很多衍生樣本,如細(xì)胞、DNA

    實(shí)用器官移植電子雜志 2017年6期2017-09-10

  • 基于核方法的虛擬樣本構(gòu)造
    基于核方法的虛擬樣本構(gòu)造劉鵬飛,何良華(同濟(jì)大學(xué) 電子與信息工程學(xué)院,上海 201804)樣本不平衡問題已經(jīng)成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱門。虛擬樣本生成方法是一種重要的解決樣本不平衡問題的方法,它通過線性生成少數(shù)類樣本來實(shí)現(xiàn)。在以往的大多數(shù)研究工作中,虛擬樣本的生成是在原始的特征空間中進(jìn)行的,樣本通常處于線性不可分的狀態(tài),將會導(dǎo)致生成的虛擬樣本丟失幾何特性。因此,文章提出了一種基于核方法的虛擬樣本構(gòu)造方法,虛擬樣本在線性可分的核空間中生成。樣本不平衡;支持向量

    網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2017年3期2017-02-22

西乌珠穆沁旗| 湘西| 芜湖县| 肥西县| 平和县| 新竹县| 虞城县| 家居| 济宁市| 和林格尔县| 谢通门县| 景德镇市| 武鸣县| 石家庄市| 扶余县| 永济市| 杭锦后旗| 安陆市| 井冈山市| 磐石市| 元氏县| 阿巴嘎旗| 长阳| 湟源县| 麻江县| 兴山县| 穆棱市| 龙里县| 桐乡市| 中卫市| 平邑县| 安塞县| 沭阳县| 郧西县| 延庆县| 铁岭市| 资兴市| 武胜县| 兴义市| 古丈县| 蓬莱市|