樊文飛,王國仁,王朝坤
1(School of Informatics, University of Edinburgh, Edinburgh, EH8 9AB, UK)
2(北京航天航空大學(xué) 計算機(jī)學(xué)院,北京 100191)
3(北京理工大學(xué) 計算機(jī)學(xué)院,北京 100081)
4(清華大學(xué) 軟件學(xué)院,北京 100084)
數(shù)據(jù)管理與智能計算的深度融合已經(jīng)成為大數(shù)據(jù)時代順利前行的迫切需求.智能數(shù)據(jù)管理旨在“為數(shù)據(jù)增添智能”,是數(shù)據(jù)科學(xué)與技術(shù)的重要基石,更是大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展的關(guān)鍵支撐.一方面,將新一代人工智能方法應(yīng)用于先進(jìn)數(shù)據(jù)管理技術(shù),嘗試探索和突破智能數(shù)據(jù)管理與分析的理論體系、技術(shù)方法及系統(tǒng)平臺,已經(jīng)成為數(shù)據(jù)管理領(lǐng)域的新興研究方向;另一方面,研發(fā)面向人工智能的數(shù)據(jù)庫基礎(chǔ)軟件,為新一代人工智能技術(shù)的研發(fā)和廣泛應(yīng)用提供海量數(shù)據(jù)的有效存儲、查詢、分析和挖掘等的系統(tǒng)支持,亦是國家科技創(chuàng)新的決定性因素.智能數(shù)據(jù)管理與分析領(lǐng)域日益得到學(xué)術(shù)界和工業(yè)界的普遍關(guān)注,其理論、技術(shù)和方法亟待深入地探索與思考.目前,針對智能數(shù)據(jù)管理與分析的研究仍然處于起步階段,有很多需要研究的問題.
本??_征文,共收到投稿38篇(包括第35屆中國數(shù)據(jù)庫學(xué)術(shù)會議(NDBC 2018)推薦的12篇高質(zhì)量論文).其中,37篇論文通過了形式審查,內(nèi)容涉及智能數(shù)據(jù)管理與分析技術(shù)和應(yīng)用.特約編輯先后邀請了 70多位專家參與審稿工作,每篇投稿至少邀請2位專家進(jìn)行評審.稿件經(jīng)初審、復(fù)審、NDBC 2018會議宣讀和終審4個階段,歷時5個月,最終有20篇論文入選本???根據(jù)主題,這些論文可以分為4組.
《大規(guī)模RDF圖數(shù)據(jù)上高效率分布式查詢處理》提出基于MapReduce 框架的查詢處理器SDec 有效回答大規(guī)模RDF智能圖數(shù)據(jù)上的SPARQL基本圖模式查詢.
《基于規(guī)則的最短路徑查詢算法》設(shè)計了一種基于最優(yōu)子路徑的前向擴(kuò)展算法,可快速求解基于規(guī)則的最短路徑查詢問題,并進(jìn)一步設(shè)計了基于最短優(yōu)先策略的前向擴(kuò)展算法.
《基于角色發(fā)現(xiàn)的動態(tài)信息網(wǎng)絡(luò)結(jié)構(gòu)演化分析》使用角色來量化動態(tài)網(wǎng)絡(luò)的結(jié)構(gòu),并給出兩種解釋角色的方法;將動態(tài)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測問題轉(zhuǎn)換為角色預(yù)測問題,提出基于潛在角色的動態(tài)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測方法.
《復(fù)雜條件下的社區(qū)搜索方法》給出了條件社區(qū)搜索問題的形式化定義,使用布爾表達(dá)式表示搜索條件;進(jìn)而提出解決條件社區(qū)搜索問題的通用框架及其優(yōu)化方法,將條件社區(qū)搜索分解為多個單項條件社區(qū)搜索.
《基于事件的社交網(wǎng)絡(luò)上的雙邊偏好穩(wěn)態(tài)規(guī)劃》研究了如何為社交網(wǎng)絡(luò)中的用戶規(guī)劃感興趣的事件,提出了雙邊偏好穩(wěn)態(tài)規(guī)劃算法,考慮了用戶和事件彼此間的偏好效用.
《基于時效規(guī)則的數(shù)據(jù)修復(fù)方法》針對同一實體對應(yīng)的多條記錄存在時間戳缺失或不精確條件下的數(shù)據(jù)時效修復(fù)問題,給出了通用的狀態(tài)類型時效規(guī)則提取算法,以及基于時效規(guī)則的數(shù)據(jù)時效修復(fù)算法.
《劣質(zhì)數(shù)據(jù)上代價敏感決策樹的建立》定義了劣質(zhì)數(shù)據(jù)上代價敏感決策樹的建立問題,提出了3種融合數(shù)據(jù)清洗算法的代價敏感決策樹建立方法.
《兩兩比較模型的Why-not問題解釋及排序》從利用兩兩比較方法尋找函數(shù)依賴的算法中得到啟發(fā),將兩兩比較方法、統(tǒng)計學(xué)方法以及機(jī)器學(xué)習(xí)方法進(jìn)行結(jié)合,針對Why-not問題尋找解釋并對解釋進(jìn)行排序.
《差分隱私的數(shù)據(jù)流關(guān)鍵模式挖掘方法》提出了一種滿足差分隱私的數(shù)據(jù)流關(guān)鍵模式挖掘算法,既考慮了隱私和數(shù)據(jù)效用之間的權(quán)衡,又考慮了挖掘時間和維護(hù)開銷之間的權(quán)衡.
《基于網(wǎng)格耦合的數(shù)據(jù)流聚類》針對現(xiàn)有數(shù)據(jù)流聚類算法在實時處理高速、大量的數(shù)據(jù)流時聚類效率和精度不高的問題,提出了一種基于網(wǎng)格耦合和核心網(wǎng)格的數(shù)據(jù)流聚類算法.
《分布式異構(gòu)數(shù)據(jù)庫數(shù)據(jù)同步工具》提出了一種基于MySQL二進(jìn)制日志還原SQL的方法,設(shè)計了日志解析器和日志還原器,可針對不同事件進(jìn)行日志解析,并依據(jù)相應(yīng)規(guī)則還原生成可執(zhí)行的SQL語句.
《面向通用模型的高可用性步態(tài)周期分析方法》提出了一種結(jié)合波峰波谷檢測與閾值空間的高可用性步態(tài)周期分析方法,通過自動求解預(yù)估值,并構(gòu)建自適應(yīng)區(qū)間,根據(jù)通用步態(tài)模型對缺乏上述信息的未知步態(tài)數(shù)據(jù)進(jìn)行切分與分析,能更便利準(zhǔn)確地求解步態(tài)周期數(shù)據(jù).
《CNN多位置穿戴式傳感器人體活動識別》針對現(xiàn)有二維卷積輸入構(gòu)建方法中對多位置三軸向傳感器相同軸向數(shù)據(jù)之間的空間依賴性挖掘不足的現(xiàn)象,提出了多層卷積神經(jīng)網(wǎng)絡(luò)模型并應(yīng)用于基于傳感器數(shù)據(jù)的人體活動識別.
《改進(jìn)的SSD航拍目標(biāo)檢測方法》針對無人機(jī)場景下目標(biāo)分辨率低、尺度變化大等問題,在SSD目標(biāo)檢測算法的基礎(chǔ)上,采用表征能力更強(qiáng)的殘差網(wǎng)絡(luò)進(jìn)行基準(zhǔn)網(wǎng)絡(luò)替換,引入跳躍連接機(jī)制降低提取特征的冗余度,引入不同分類層的特征信息融合機(jī)制來有機(jī)結(jié)合網(wǎng)絡(luò)結(jié)構(gòu)中低層視覺特征與高層語義特征.
《面向交通流量預(yù)測的多組件時空圖卷積網(wǎng)絡(luò)》提出了一種多組件時空圖卷積網(wǎng)絡(luò),該模型結(jié)合圖卷積和標(biāo)準(zhǔn)卷積構(gòu)造時空卷積塊來同時捕獲交通數(shù)據(jù)的時空特性.
《時空依賴的城市道路旅行時間預(yù)測》針對傳統(tǒng)旅行時間預(yù)測模型難以引入多源特征的問題,提出了兩階段的旅行時間預(yù)測框架,有效提取路段間上下游依賴關(guān)系,且整合了天氣日期等外部特征.
《面向高維特征和多分類的分布式梯度提升樹》證明了特征并行策略更適合高維和多分類場景,提出了一種使用特征并行的分布式梯度提升樹算法.
《因子分解機(jī)模型研究綜述》從準(zhǔn)確性和性能兩個方面總結(jié)了因子分解機(jī)模型存在的基本問題和近年來的研究進(jìn)展,綜述了適用于因子分解機(jī)模型求解的4種代表性優(yōu)化算法.
《因子分解機(jī)模型的寬度和深度擴(kuò)展研究》從特征的高階交互、場交互、層次交互與傳統(tǒng)模型的集成學(xué)習(xí),以及特征工程角度討論了 FM模型的寬度擴(kuò)展,從與深度學(xué)習(xí)模型等集成的角度,詳細(xì)闡述了FM模型的深度擴(kuò)展,同時概括比較了FM模型的優(yōu)化學(xué)習(xí)方法和基于不同并行與分布式計算框架的實現(xiàn).
《基于強(qiáng)化學(xué)習(xí)的金融交易系統(tǒng)研究與發(fā)展》以金融領(lǐng)域常用的強(qiáng)化學(xué)習(xí)模型發(fā)展為脈絡(luò),對交易系統(tǒng)、自適應(yīng)算法、交易策略等方面諸多研究成果進(jìn)行了綜述.
本??饕嫦驍?shù)據(jù)庫、數(shù)據(jù)挖掘、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等多領(lǐng)域的研究人員和工程人員,反映了我國學(xué)者在智能數(shù)據(jù)管理與技術(shù)領(lǐng)域最新的研究進(jìn)展.感謝《軟件學(xué)報》編委會和數(shù)據(jù)庫專委會對??ぷ鞯闹笇?dǎo)和幫助,感謝??w評審專家及時、耐心、細(xì)致的評審工作,感謝踴躍投稿的所有作者.希望本??軌?qū)χ悄軘?shù)據(jù)管理與分析相關(guān)領(lǐng)域的研究工作有所促進(jìn).