Mark Dugdale IPPro
IPPro:與維基媒體基金會的合作讓Turnitin公司的技術(shù)實際應(yīng)用于世界最大互聯(lián)網(wǎng)信息庫之一的英文維基百科在其間進行更大范圍的侵犯著作權(quán)檢測的意義有多大?
Jason Chu:在數(shù)字世界,主要由于持續(xù)不斷的超出人類管理能力的信息內(nèi)容的涌現(xiàn)和內(nèi)容驗證、版權(quán)保護變得日益復(fù)雜。維基百科是全球最大的、全面的免費百科全書,而Turnitin在協(xié)助出版商保證其作品原創(chuàng)性方面處于領(lǐng)先地位。
維基百科社區(qū)高度重視”可核查性“,即任何文章內(nèi)容和信息必須有已發(fā)表的可靠來源。Turnitin技術(shù)能夠驗證維基百科及其他電子資源比先前的范圍更廣的內(nèi)容,讓維基百科編輯們更有效地處理潛在的著作權(quán)問題。
IPPro:維基媒體基金會主要想通過Turnitin獲得哪些效果?
Jason Chu:侵犯著作權(quán)檢測的難點之一是太多網(wǎng)站鏡像和/或復(fù)制維基百科的內(nèi)容,噪點多且難以辨識原始資料來源。Turnitin技術(shù)關(guān)鍵在于能夠有效比對維基百科的內(nèi)容及鏡像網(wǎng)站的內(nèi)容。
也就是說,這是維基百科首選Turnitin的原因。
維基百科社區(qū)的Jake Orlowitz主動與Turnitin接洽,因為維基百科用來檢測侵犯著作權(quán)的機器人程序并不能提供全面的內(nèi)容覆蓋,也沒被大規(guī)模應(yīng)用。先前使用的機器人程序不能比對維基百科文章內(nèi)容與學(xué)術(shù)期刊及出版物的內(nèi)容,而這是Turnitin的強項:覆蓋了80%的世界前5000家期刊。這些都是維基百科選擇使用Turnitin的原因。
就效果來說,Turnitin提供的機器人程序EranBot進行了廣泛的測試,首先檢測了與醫(yī)療有關(guān)的英文編輯內(nèi)容,持續(xù)時間超過一年。測試完成后,經(jīng)維基百科社區(qū)批準(zhǔn),EranBot用于檢測所有英語文章的編輯內(nèi)容。
IPPro:請問這些機器人能代替人工編輯嗎?
Jason Chu:技術(shù)永遠(yuǎn)無法取代人類。這項技術(shù)僅完善人類的判斷,更有效地整合并辨識問題點。EranBot和維基百科的其他機器人程序被用來識別那些問題點:文章內(nèi)容或與外部、在線或已發(fā)表資源可能匹配的文章編輯內(nèi)容。
維基百科的編輯們,即人類,擁有決定權(quán),審查Turnitin提供的內(nèi)容匹配報告,并確定這些內(nèi)容的使用是否適當(dāng)或是否侵犯著作權(quán)。該技術(shù)有助于更有效地、更容易地辨識上述內(nèi)容。但是,該技術(shù)沒有對此內(nèi)容使用作出判斷的能力,而人類有。
IPPro:著作權(quán)人的共同煩惱就是必須通過移除請求權(quán)親自指出侵權(quán)行為,Turnitin技術(shù)如何幫助著作權(quán)人減輕這些負(fù)擔(dān)?
Jason Chu:Turnitin提供的報告逐字地、清晰地突出顯示與其他在線或已發(fā)表的資源相匹配的內(nèi)容。Turnitin報告不僅指出匹配內(nèi)容的來源,還顯示根據(jù)其算法辨識出的所有匹配內(nèi)容。報告內(nèi)容全面,便于著作權(quán)人與潛在的侵權(quán)人溝通,通知并驗證其權(quán)利主張。
IPPro:Turnitin與學(xué)校、學(xué)院就學(xué)生抄襲方面的合作如何?抄襲常見嗎?貴司的技術(shù)如何幫助克服呢?
Jason Chu:我們看到,學(xué)生沒有充分理解著作權(quán),也不懂得負(fù)責(zé)任地使用獲得的信息,如引用要恰當(dāng)。學(xué)生們對著作權(quán)的理解多通過消費和共享在線信息獲得。通過便于P2P交流的App和服務(wù),互聯(lián)網(wǎng)及網(wǎng)絡(luò)促進、支持連接及共享,包括信息免費、自由分享的理念。
這種自由對促進在線參與及社會互動方面意義重大,但并適用于學(xué)術(shù)環(huán)境。在學(xué)術(shù)環(huán)境中,學(xué)生們需懂得,不標(biāo)明來源、不謹(jǐn)慎對待信息本身的共享念頭是不可行的。
學(xué)校和機構(gòu)通過使用Turnitin技術(shù),讓學(xué)生思考如何將源材料加入文中,并審慎考慮所用資源。Turnitin報告作用巨大,可突出顯示并反饋給學(xué)生,告知學(xué)生使用信息資源的方法、尊重原創(chuàng)和著作權(quán)。
翻譯:王宏軍