管蓉
近日,谷歌發(fā)布了一個幫助研究者查找在線數(shù)據(jù)的免費搜索引擎:數(shù)據(jù)集搜索(Dataset Search)。谷歌表示,該引擎面向科學家、數(shù)據(jù)記者和數(shù)據(jù)極客等人群。
據(jù)報道,數(shù)據(jù)集搜索與谷歌的其他專用搜索引擎一樣可以免費使用,它基于擁有者對文件和數(shù)據(jù)庫的分類方式來查找文件和數(shù)據(jù)集。該引擎讀取文件內容的方式與搜索引擎搜索網(wǎng)頁的方式不同。有專家表示,該引擎填補了這一領域的空白,可以極大地促進開放數(shù)據(jù)運動的發(fā)展,這一運動旨在實現(xiàn)數(shù)據(jù)的開放利用和重復利用。
目前谷歌已經(jīng)正式對外測試開源數(shù)據(jù)集搜索引擎,用戶在鍵入數(shù)據(jù)集名稱或關鍵信息后,該搜索引擎會給出一系列數(shù)據(jù)源列表,每一個數(shù)據(jù)源都會有簡要的介紹,例如更新日期、作者、版權和內容說明等。
隨著數(shù)據(jù)集搜索的不斷改進,未來它也許會跟谷歌學術整合,將特定研究領域的搜索結果關聯(lián)到相關數(shù)據(jù)集。