国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

標(biāo)記系統(tǒng)及學(xué)術(shù)文本處理的未來(二)

2016-05-14 09:00詹姆斯·庫姆斯艾蘭·瑞尼爾史蒂芬·德羅斯王曉光李夢琳劉晶
出版科學(xué) 2016年6期
關(guān)鍵詞:文獻(xiàn)

詹姆斯·庫姆斯 艾蘭·瑞尼爾 史蒂芬·德羅斯 王曉光 李夢琳 劉晶

[摘 要] 標(biāo)記事務(wù)影響著學(xué)者們對思考與寫作系統(tǒng)的采納使用。程序性標(biāo)記和表示性標(biāo)記會阻礙這一進(jìn)程的發(fā)展,描述性標(biāo)記則通過簡化機械性任務(wù),讓學(xué)者們將注意力集中于內(nèi)容上的做法,以加快這一進(jìn)程。

[關(guān)鍵詞] 標(biāo)記 學(xué)術(shù)文本 文獻(xiàn) 標(biāo)準(zhǔn)通用標(biāo)記語言

[中圖分類號] G231 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1009-5853 (2016) 06-0009-08

[Abstract] Markup practices can affect the move toward systems that support scholars in the process of thinking and writing. Whereas procedural and presentational markup systems retard that movement, descriptive markup systems accelerate the pace by simplifying mechanical tasks and allowing the authors to focus their attention on the content.

[Key words] Markup Scholarly text Document SGML

8 文檔可移植性的可選方案

目前文檔可移植性有四種方案,但它們僅提供了部分解決方案。這些可供選擇的方案包括:

(1)作者對自己的作品進(jìn)行排版并提供完稿復(fù)本;

(2)作者提交與設(shè)備獨立的頁面描述文件,比如附言;

(3)作者提交打印輸出文件,出版商使用光符閱讀器(OCRs)將其轉(zhuǎn)換成電子形式;

(4)作者發(fā)送無描述性標(biāo)記的源文件,出版商用專門的工具來轉(zhuǎn)換標(biāo)記。

第一種選擇方案里,作者過多地參與作品的描述過程,這使他們不能將注意力集中于作者這個角色。這個過程存在許多嚴(yán)重問題。首先,需要明確的是,排版是一項技術(shù)活,諸如字體、字形和字號,行距、加粗、字距、色框、手稿正面、手稿反面、字符間距、分散對齊等這些概念,以及專業(yè)設(shè)計師的所有設(shè)備都需要進(jìn)行專門的培訓(xùn)。其次,大部分排版程序需要編程技術(shù)或者大量的人工參與。非技術(shù)性的問題甚至可能會有更重要的意義。出版商的排版規(guī)范通常存在許多不足。這些不足往往通過與專業(yè)人員的長期合作才能解決。因此,作者需要花費大量的時間和精力來明確排版規(guī)范和重置類型。再次,與專業(yè)排版人員一樣,作者排版可能需要對不是根據(jù)出版商規(guī)范和出版商評估費用來設(shè)置的任何事務(wù)負(fù)經(jīng)濟(jì)上的責(zé)任。最后,作者排版會受限于緊迫的生產(chǎn)周期,這個周期會干擾他們的教學(xué)、學(xué)術(shù)、管理計劃。

文檔可移植性的第二種方案——提供頁面描述文件——仍然讓作者受限于大部分排版問題。為了準(zhǔn)備頁面描述文件,作者必須有完整的排版規(guī)范,以及確保他們的文件與規(guī)范相符合。

第三種方案——提交用OCRs進(jìn)行閱讀的打印文件——這能使作者擺脫一些排版問題,但是這并不能很好地改善生產(chǎn)流程。盡管OCRs正在變得更快以及更加精準(zhǔn),但它們的價格仍然昂貴且容易出錯。因操作人員介入的需要,校對在生產(chǎn)環(huán)節(jié)被淘汰的可能性很小。此外,OCRs限制了從打印輸出生成標(biāo)記文件的能力。現(xiàn)在的系統(tǒng)能生成一些程序性標(biāo)記,但不能區(qū)分比如定理和公理,或者甚至不能區(qū)分章和小節(jié)。因此,OCRs生成文件仍然需要受過培訓(xùn)的人員來識別和編碼文本元素(需要注意的還有,就算是經(jīng)過訓(xùn)練的操作員,也不會做諸如公理和定理這樣復(fù)雜的區(qū)分)。當(dāng)字符識別的問題被解決,我們可以期望OCRs生產(chǎn)商再集中到元素識別的問題上。但是,沒有精確的編碼,文本元素的自動識別將是一項充滿隨意性的任務(wù)。而且,當(dāng)知識已經(jīng)能夠很輕易地被記錄在源文件中時,開發(fā)系統(tǒng)來恢復(fù)被遺棄的知識是一件極其浪費資源的事情。

最后,普遍觀點認(rèn)為,出版商能使用專門的工具將作者的源文件轉(zhuǎn)換成他們自己的格式。比如,據(jù)出版系統(tǒng)希爾伯德報告[20,pp.37-38] 所述:“ Shaffstal 通信/轉(zhuǎn)換系統(tǒng)已經(jīng)逐漸成為一種先進(jìn)的工具,幾乎能夠處理接口域出現(xiàn)的任何問題?!?但是在Shaffstall 5000 XT 的測試中,記者試圖處理來自MacWrite 2、MacWrite 4.2、PageMaker、ReadySetGo和Microsoft Word的文件。他們發(fā)現(xiàn)系統(tǒng)能很好地處理MacWrite 2 文件,但是不能很好地處理其他的文件,因為“這些程序使用不同的方式處理數(shù)據(jù)”。 很明顯,每個程序的每個新版本都會危及系統(tǒng)的實用性。此外,這些系統(tǒng)并沒有提供必要的元素識別;它們只是簡單地生成了帶有基本程序標(biāo)記的源文件。專業(yè)人員仍然需要辨別每一種元素類型。最終,文件很可能會再次遭到破壞1。

SGML最近甚至被描述性標(biāo)記的支持者批判2。批評者認(rèn)為SGML對作者和系統(tǒng)開發(fā)者來說過于復(fù)雜。但是,Datalogics已經(jīng)證實了復(fù)雜的SGML工具可以進(jìn)一步開發(fā),以及SGML文檔創(chuàng)建是一個直觀的過程。同樣地,SoftQuad為Macintosh生產(chǎn)了一款A(yù)AP文本處理器。Sobemap有一款SGML語法分析程序,都能同時在Microsoft Windows和UNIX下運行。

這些產(chǎn)品具有代表性,但發(fā)展得并不徹底,只是剛剛開始。美國國防部每年在它所倡議的基于SGML的電腦輔助后勤支援系統(tǒng)(CALS)上投資大約200億美元。其他各種大型政府機構(gòu),比如美國國稅局正在投資SGML。一些私營組織,如McGraw-Hill計劃在不久的將來徹底轉(zhuǎn)換它們的系統(tǒng)。一些開發(fā)商不滿這種壓力,尤其是來自政府的壓力[19,p.25]。然而,以上提到的早期成功還是會引領(lǐng)發(fā)展,可以預(yù)見,未來的阻力還很大。

最后,SGML因其缺乏對數(shù)學(xué)、圖形和表格材料的支持而受到質(zhì)疑和批判。但是SGML有元語言屬性,美國出版商協(xié)會(AAP)已經(jīng)證實了SGML應(yīng)用程序能夠支持?jǐn)?shù)學(xué)和表格材料。我們有理由相信,這一標(biāo)準(zhǔn)可以通過描述性標(biāo)記和引用標(biāo)記來支持圖形。

9 文檔可移植性不依賴于標(biāo)準(zhǔn)

我們認(rèn)為,并不需要等待SGML成為主流。我們已經(jīng)說明,描述性標(biāo)記遠(yuǎn)遠(yuǎn)優(yōu)于表示性標(biāo)記和程序性標(biāo)記。描述性標(biāo)記的優(yōu)越性并不在于它正在成為一種標(biāo)準(zhǔn);相反地,描述性標(biāo)記是標(biāo)準(zhǔn)的基礎(chǔ),因為它有著超過其他形式標(biāo)記的內(nèi)在優(yōu)勢3。

已經(jīng)轉(zhuǎn)換為使用描述性標(biāo)記的人們已經(jīng)在享受一些顯現(xiàn)出來的好處。我們已經(jīng)把發(fā)表在布朗大學(xué)時事通訊的文章的源文件發(fā)送給了巴塞羅那大學(xué),那里對源文件的加工處理可以不經(jīng)修改。布朗大學(xué)出版的學(xué)術(shù)期刊,比如《NOVEL: A Forum on Fiction and Philosophy and Phenomenological Research》在排版過程中使用了描述性標(biāo)記,而且正在準(zhǔn)備接受以電子方式提交文件。我們可以預(yù)見越來越多的學(xué)術(shù)期刊出版商在認(rèn)識到這可以大大節(jié)約管理和制備成本的時候會進(jìn)行轉(zhuǎn)型。最終,行業(yè)標(biāo)準(zhǔn)將會加速向描述性標(biāo)記轉(zhuǎn)換4。

文檔的可移植性確實可以大大地減少成本和勞動力方面的損耗。但是文檔可移植性無法滿足同事間共享文檔的需要,也不能完全解決生產(chǎn)過程中存在的問題。正如美國出版商協(xié)會(AAP)認(rèn)為,描述性標(biāo)記提供了針對建立文檔移植的最完整和最有效的解決方法。當(dāng)SGML成為一種行業(yè)標(biāo)準(zhǔn),描述性標(biāo)記能夠立即帶來許多優(yōu)勢,而且如果必要的話,那些被描述性編碼的文檔可以很容易地進(jìn)行更新。

10 認(rèn)知需求的最小化

10.1 基本理論

所有文檔標(biāo)記都要執(zhí)行以下三個步驟5。

(1)元素識別。指識別當(dāng)前元素的特定類型——段落,引用,腳注等。

(2)選擇標(biāo)記。指確定適用于(1)中所識別的元素類型的標(biāo)記。

(3)執(zhí)行標(biāo)記。指對元素進(jìn)行標(biāo)記。

最好的標(biāo)記技術(shù)僅需要做最少的認(rèn)知處理(其他條件不變)。我們相信步驟(1)和步驟(3)是可以被忽略的。第一個步驟是元素識別,這對于所有形式的標(biāo)記都是一樣的:比如在使用描述性標(biāo)記時,或在使用其他形式的標(biāo)記時,我們都沒有先驗理論來假設(shè)一個作者識別出一個實體為腳注。第三個步驟執(zhí)行標(biāo)記最受關(guān)注,它帶來的結(jié)果是各種形式的“按鍵輸入最小化”和選擇接口(比如下拉菜單)。但是同樣地,我們沒有先驗理論來相信標(biāo)記的一種形式比另一種更容易進(jìn)行優(yōu)化6。簡單地來看標(biāo)記的選擇,它表明描述性標(biāo)記比表示性標(biāo)記或程序性標(biāo)記需要更少的認(rèn)知。這些差別如圖2所示。

10.2 表示性標(biāo)記

在表示性標(biāo)記方案下,標(biāo)記的選擇需要作者為元素類型選擇一組印刷表示規(guī)范,接著還要確定一些替代方案7。印刷規(guī)范與文本元素之間的關(guān)系具有隨意性和不穩(wěn)定性,這增加了標(biāo)記選擇過程的復(fù)雜性。我們已經(jīng)討論了因表示性標(biāo)記規(guī)范不穩(wěn)定性而產(chǎn)生的維護(hù)問題。比如說當(dāng)美國現(xiàn)代語言學(xué)會(MLA)改變了其長引用的規(guī)范時,作者不僅必須更新他們的文件,還必須重新學(xué)習(xí)標(biāo)記,這勢必要經(jīng)歷一小段混亂時期。

更為重要的是,表示性標(biāo)記的隨意性不支持循環(huán)以及創(chuàng)建多種選擇方案的情況。高頻元素,如段落,可能不存在大規(guī)模循環(huán)問題;但是比較少出現(xiàn)的元素,如引用,則需要遵循特定的樣式規(guī)范。同樣地,像段落這樣只有很少選擇方案的元素,通常不需要進(jìn)行太多的思考(盡管你可能會在判斷文件是個人信件還是商業(yè)信函上搖擺不定,由此判斷段落是否應(yīng)該通過空行或縮進(jìn)來進(jìn)行標(biāo)記)。但是,隨著文本格式化程序和打印設(shè)備靈活性的提高,像章節(jié)這樣更高級別的元素,其選擇方案的數(shù)量迅速增加。最具靈活性的出版商,聘請專業(yè)設(shè)計師來選擇表示性標(biāo)記。但是作者必須自己決定如何對元素進(jìn)行標(biāo)記,這可能會花費很多時間來不停調(diào)整字體和空行。

在對文本元素的標(biāo)記進(jìn)行最初的選擇之后,人們自然會期望整個標(biāo)記過程可以大大地簡化。然而有作者反映,他們自身的記憶能力限制,需要經(jīng)?;仡櫸臋n來看他們之前是如何對某一種元素類型進(jìn)行格式化的。此外,他們很可能在處理文檔的過程中改變對于標(biāo)記的想法,從而中斷標(biāo)記過程,并對先前選擇的元素重新格式化。

10.3 程序性標(biāo)記

對程序性標(biāo)記方案來說,標(biāo)記的選擇更為復(fù)雜。首先,作者需要執(zhí)行表示性標(biāo)記同樣需要進(jìn)行的標(biāo)記選擇。然后作者要確定目標(biāo)文本格式化程序所需的程序性標(biāo)記,來創(chuàng)建選定的表示性標(biāo)記。使用程序性標(biāo)記的作者在其工作場所要保持程序文檔與樣式指南一致。

10.4 描述性標(biāo)記

描述性標(biāo)記將標(biāo)記選擇過程簡化為一個單一步驟,很自然地略去了元素識別這一步驟。一旦作者確定了元素類型,通過選擇能為當(dāng)前元素類型縮寫自然語言名稱的標(biāo)識符就能簡單地確定適當(dāng)?shù)臉?biāo)記。事實上,自然語言名稱可以用于標(biāo)識符,并且經(jīng)常用于比較少出現(xiàn)的元素,如“地址”。例如“詩歌引用”的縮寫PQ只是達(dá)到了按鍵輸入最小化的效果。

此外,使用標(biāo)準(zhǔn)詞綴進(jìn)行標(biāo)記的這一規(guī)范,只是被選擇用來啟動元素,這對于終止一種元素類型的標(biāo)記選擇(在必要時)是不起作用的。例如,一旦作者選擇作為合適的標(biāo)記來啟動一個詩歌引用,那么引用結(jié)束的標(biāo)記自然是,這可能是通過運用附加的標(biāo)準(zhǔn)和不改變附加的規(guī)則來實現(xiàn)。因此,描述性標(biāo)記非常適合選擇優(yōu)化8。

描述性標(biāo)記比正常語言處理還要多一些元素識別的必要,由此將認(rèn)知需求達(dá)到最小化。盡管文本元素與其自然語言名稱之間的關(guān)系存在隨意性,但是名稱和描述性標(biāo)記之間的關(guān)系不是任意的。比如一個段落的標(biāo)簽可能是p或者para,但不會是sk或address。此外,元素名稱和描述性標(biāo)記之間的關(guān)系是穩(wěn)定的。美國現(xiàn)代語言學(xué)會(MLA)可以每天修改其樣式表,但是長引用的描述性標(biāo)記依然為<1q>。作者不僅不需要修改他們的標(biāo)記,他們也不需要為每一種樣式的變化而學(xué)習(xí)新的標(biāo)記。因此,寫作過程無需因遵從樣式表而被打斷,作者也無需回顧文檔來看已經(jīng)格式化了的特定元素類型。事實上,他們完全擺脫了格式化問題。

盡管作者普遍相信集成的編輯格式化程序能通過消除標(biāo)記的需求來簡化文檔的開發(fā),但是我們的分析不僅顯示了這種應(yīng)用程序需要標(biāo)記,還顯示了標(biāo)記為目前最流行的系統(tǒng)所需,其需求性大大超過了描述性標(biāo)記。不管這個還需進(jìn)一步處理的分析結(jié)果是否詳細(xì)準(zhǔn)確,都應(yīng)該明白以下兩點:(1)程序性標(biāo)記選擇之前需要進(jìn)行表示性標(biāo)記選擇;(2)由于標(biāo)簽和元素名稱之間的關(guān)系具有穩(wěn)定性和非任意性,描述性標(biāo)記的選擇比其他標(biāo)記形式需要更少的認(rèn)知能力。最后,表示性標(biāo)記所需要的額外認(rèn)知過程會浪費本可以應(yīng)用于文檔內(nèi)容的精力,最終甚至可能造成寫作過程的長期中止。

11 內(nèi)容導(dǎo)向

描述性標(biāo)記更為微妙的一個優(yōu)勢在于,它支持作者關(guān)注文檔的結(jié)構(gòu)和內(nèi)容。表示性標(biāo)記和程序性標(biāo)記往往將作者的注意力集中于物理表示9。

當(dāng)文檔增加了描述性標(biāo)記,其邏輯結(jié)構(gòu)會更加清晰明確。例如,標(biāo)準(zhǔn)標(biāo)簽集中包含“標(biāo)題”標(biāo)簽,如

、

等,這些標(biāo)記既闡明了層次關(guān)系,也闡明了順序關(guān)系。事實上,我們中的一部分人通常會將由標(biāo)簽組成的骨架式大綱作為文檔標(biāo)記的開始。當(dāng)我們的文檔得到擴(kuò)充,這種結(jié)構(gòu)的標(biāo)記幫助我們保持了解每個部分設(shè)計的重點。此外,當(dāng)我們繼續(xù)深入,我們能夠使用專門的應(yīng)用程序?qū)Y(jié)構(gòu)進(jìn)行縮放。

不同于描述性標(biāo)記,表示性標(biāo)記和程序性標(biāo)記不能支持作者開發(fā)文檔結(jié)構(gòu),更糟糕的是,它們偏離了文檔內(nèi)容。正如我們已經(jīng)討論過的,元素識別作為標(biāo)記文檔的第一步,對所有形式的標(biāo)記都是一樣的。第二步標(biāo)記選擇,總是需要一些額外的精力,但是描述性標(biāo)記將這種精力集中于文檔中的元素及其作用。表示性標(biāo)記將作者的注意力轉(zhuǎn)向排版規(guī)范和樣式表。程序性標(biāo)記甚至脫離文檔,使之朝著特定的標(biāo)記轉(zhuǎn)換,這需要用專門的文本格式化程序來產(chǎn)生選定的表示性標(biāo)記。

還有很多細(xì)節(jié),我們在這里不能詳細(xì)地闡述。但是讀者應(yīng)該記住,我們的論證主要集中于標(biāo)記選擇的過程。我們注意到它可能會如執(zhí)行描述性標(biāo)記一般,同樣輕松地執(zhí)行復(fù)雜的表示性標(biāo)記或程序性標(biāo)記。換句話說,任何形式的標(biāo)記都可以簡化到一個單一的編輯操作。相反地,一個糟糕的界面可能讓描述性標(biāo)記的執(zhí)行變得難以理解和令人分心。

此外,我們有點拐彎抹角地提出作者考慮的問題。我們曾經(jīng)簡單地認(rèn)為,顯示描述性標(biāo)記的界面可以幫助作者更加專注于內(nèi)容和結(jié)構(gòu)。這一想法顯然過于簡單化。首先,并不是所有的標(biāo)記都提供了重要的結(jié)構(gòu)信息,或者更好地提供了當(dāng)時對作者重要的信息。其次,即使是描述性標(biāo)記,也可以變得很密集,導(dǎo)致文本模糊難懂。再次,作者或許希望可以在任何特定時間看到列舉在列表中的項目,而不是描述性標(biāo)記。最后,我們不得不得出結(jié)論,查看格式和內(nèi)容定位之間沒有簡單的聯(lián)系。一個理想的系統(tǒng)要能為作者提供選擇不同視圖文件的能力,并且它應(yīng)該可以顯示一些文本元素的標(biāo)記以及為其他人隱藏標(biāo)記。

12 寫作輔助功能與特殊加工處理

使用描述性標(biāo)記來識別文檔的邏輯元素,不僅簡化了組成、維護(hù)、協(xié)作和出版流程,還使作者能夠應(yīng)用各種不同的寫作輔助工具。如果文本處理要實現(xiàn)最初的目標(biāo),大力協(xié)助學(xué)術(shù)寫作,且不僅僅致力于提高打字輸入,那么這種功能必須充分利用。

沒有描述性標(biāo)記提供的結(jié)構(gòu)識別,文本就是簡單一個“可以從文檔分析中推導(dǎo)出來的無特定形式的字符串”[18,p.68],而電腦完全不適合這個推論。添加內(nèi)容描述性標(biāo)記可以將這種無特定形式的字符串轉(zhuǎn)化為文本元素的結(jié)構(gòu)化數(shù)據(jù)庫,使學(xué)者能夠有選擇性和系統(tǒng)性地處理那些元素。通過標(biāo)記選擇性處理文本元素的兩個寫作輔助功能是多視圖(alternative views)和結(jié)構(gòu)導(dǎo)向編輯(structure-oriented editing)。

13 文檔的其他視圖

如果一個文檔要進(jìn)行描述性標(biāo)記,那么在編輯器中顯示的文本元素可以通過參照識別這些元素的標(biāo)記在全文范圍進(jìn)行指定。例如,人們可以指定所有的塊引用在視圖中隱藏。以前兩個句子之間會有較大的行距,現(xiàn)在可能只有一個顯示隱藏行數(shù)的標(biāo)記,或者如果用戶喜歡,可以根本不用標(biāo)記:句子一句接著一句,彼此相鄰。同樣地,所有的腳注,或所有注釋,或某一特定類的所有注釋——比如說所有關(guān)于翻譯的注釋,都可以通過注釋器而非作者被隱藏起來。通過這種方式,當(dāng)前感興趣的文本部分會備受關(guān)注,但是不感興趣的可以隱藏。當(dāng)然,在編輯過程的任何一個步驟,隱藏的文本可以被立即且有選擇地公開用于查看。

更加專業(yè)的視圖也同樣有用,它不僅僅是對一般的寫作和編輯有效,而且能通過細(xì)微的調(diào)整以協(xié)助學(xué)者思考手頭上特定的項目或主題。這里舉個具體的例子。本文的一位作者寫了一篇關(guān)于認(rèn)知邏輯的文章。他的論文中包含文本元素標(biāo)記,如原語(用于標(biāo)記明確引入了公理系統(tǒng)原始術(shù)語的文本),定義(界定系統(tǒng)的定義),公理(系統(tǒng)的公理),以及定理(遵循公理的命題)。利用這種標(biāo)記的編輯工具保留著文檔中每個公理元素的當(dāng)前列表。這份列表在編輯時——有時會顯示在并行的編輯窗口——可以進(jìn)行快速查詢,也可以自動更新,還可作為附件進(jìn)行打印。列表中的公理元素可能按照種類進(jìn)行隨意地分類和審核——原語、公理、定義、定理——不管它們的排列順序。除了對開發(fā)系統(tǒng)里公理元素當(dāng)前地位簡單地提供一個快速參考,這個工具還被用于系統(tǒng)間的比較(其公理元素的分類總結(jié)放進(jìn)了相鄰的窗口)以及探索元素之間的關(guān)系。類似的技術(shù)也可以應(yīng)用于其他學(xué)科。

這些查看策略有效性的一個原因是用于比較的文本相關(guān)章節(jié)是簡單并列的;另一個是這些域的定向重排——這是因為一份文檔經(jīng)常選擇的修辭結(jié)構(gòu)決定了文本元素的敘事順序,但這并不是作者關(guān)于主題思考的最好順序。在這兩種情況下,編輯工具使用描述性標(biāo)記來克服在寫作環(huán)境中由預(yù)期的修辭形式的表象需求所強加的限制。這種類型的輔助功能正是一位學(xué)者期望從電腦中獲得的。

這里正在實現(xiàn)的是不能用傳統(tǒng)學(xué)術(shù)工具來有效進(jìn)行的:已經(jīng)由某些內(nèi)容相關(guān)屬性指定的文本的分散部分,被迅速地進(jìn)行了比較和編輯。使用像紙一樣的傳統(tǒng)書寫媒介時,只有在文章中費力地細(xì)查、刪減和重排,才能達(dá)到現(xiàn)在同樣的效果;即使那樣,出現(xiàn)錯誤的可能性還很大。這種傳統(tǒng)的人工方法所需要的時間和精力限制了作者努力重排的數(shù)目,并且讓更多實驗重組特別不切實際。使用計算機輔助方法時,一切都力求在時間和精力上消耗最小的成本,每一個直覺都能立即進(jìn)行探索,查看策略可以根據(jù)每次試驗的結(jié)果來逐步地細(xì)化。所有這些技術(shù)都需要描述性標(biāo)記所提供的結(jié)構(gòu)化信息;沒有它的話,比起使用鉛筆、紙和剪刀的時代,計算機學(xué)家們現(xiàn)在的狀況也好不了太多。

盡管許多作者認(rèn)為一份文件不同視圖的價值可以體現(xiàn)在其作為一種智力工具;但令人吃驚的是,很少學(xué)者利用了這些特性10。部分問題體現(xiàn)在用于顯示和編輯不同視圖文件的能力被看成是一種特定的實驗文本處理系統(tǒng)的功能,而不是文本處理的一般策略。但是,通過簡單地使用描述性標(biāo)記方案和一個通用的可編程編輯器,任何學(xué)者都可以立即著手使用這些工具11。

14 構(gòu)建框架和結(jié)構(gòu)導(dǎo)向的編輯

其他視圖的一個特殊例子如圖3所示。文檔有一個自然的層級結(jié)構(gòu):章有節(jié),節(jié)有小節(jié),再到句子、單詞和字母等等。如果文檔的各部分如此標(biāo)記,那么操作通用編輯器就是一件容易的事情,只顯示章節(jié)標(biāo)題,為學(xué)者提供一個作品大綱。此外,由于章節(jié)標(biāo)記被鍵入到了章節(jié)層級里,作者可以輕易地使大綱窗口以任意所需要的細(xì)節(jié)深度來顯示大綱,細(xì)節(jié)深度層次最低的是全文,或者是有注釋和替代版本的文本。“縮放”功能可以控制細(xì)節(jié)連續(xù)層級的逐層隱藏和展現(xiàn)。當(dāng)文檔顯示在大綱視圖里時,你可以使用編輯工具來移動文檔的層級組件,還可以對文檔整體結(jié)構(gòu)做相應(yīng)的調(diào)整。例如,有人可能會將一個章節(jié),連同其所有嵌套的小節(jié)和文本,直接移動到另一章節(jié)。或者,有人會將文本的一部分從第三層級上調(diào)至第二層級,并且對其嵌套的小節(jié)標(biāo)題的深度標(biāo)記做相應(yīng)調(diào)整。目前文本處理理論家們已經(jīng)廣泛向業(yè)界推薦使用這種方式對文本的自然層級結(jié)構(gòu)進(jìn)行調(diào)整 。最近,盡管有一批功能強大的框架應(yīng)用再次上市,但這些產(chǎn)品大多是專門的應(yīng)用程序,而不是基于描述性標(biāo)記的一般實現(xiàn)策略。

背景和新概念

介紹

標(biāo)記理論

標(biāo)記類型

標(biāo)點符號標(biāo)記

表示性標(biāo)記

程序性標(biāo)記

描述性標(biāo)記

引用標(biāo)記

元標(biāo)記

標(biāo)記處理

隱藏,公開,掩飾,顯示

小結(jié)

描述性標(biāo)記的優(yōu)點

可維護(hù)性

文檔可移植性

背景

優(yōu)點

文檔移植的選擇方案

文檔移植獨立于標(biāo)準(zhǔn)

小結(jié)

認(rèn)知需求最小化

基本理論

表示性標(biāo)記

程序性標(biāo)記

描述性標(biāo)記

小結(jié)

內(nèi)容導(dǎo)向

寫作輔助功能和特殊加工處理

引文

文檔的其他視圖

構(gòu)建框架和結(jié)構(gòu)導(dǎo)向編輯

小結(jié)

結(jié)論

圖3 描述性標(biāo)記的框架

這種策略通過描述性標(biāo)記形成了一種優(yōu)秀的編輯設(shè)計樣式:結(jié)構(gòu)導(dǎo)向編輯。描述性標(biāo)記允許編輯操作的對象不僅僅是字符、單詞和線,還有實在的文本元素符號、在特定標(biāo)記標(biāo)簽范圍內(nèi)的文本域。例如,你可以執(zhí)行“刪除這條腳注”或“移動這條引用”的操作。結(jié)構(gòu)導(dǎo)向的編輯使作者能夠在適合其作者身份的抽象層面上處理文檔;其他形式的編輯需要對線位移、行號和標(biāo)志域進(jìn)行調(diào)節(jié)。因此,結(jié)構(gòu)導(dǎo)向編輯可以最大限度地減少認(rèn)知需求,以幫助作者關(guān)注內(nèi)容。

寫作輔助屬性,如文檔的替代視圖和結(jié)構(gòu)導(dǎo)向編輯,致力于大大提高學(xué)術(shù)創(chuàng)作環(huán)境下的時效性和生產(chǎn)力。這些功能的實現(xiàn)很大程度上依賴于描述性標(biāo)記。使用其他類型標(biāo)記的文本處理,使過時的技術(shù)和戰(zhàn)略將繼續(xù)主導(dǎo)計算機輔助的文檔工作。

15 結(jié) 論

描述性標(biāo)記解決了學(xué)者在文檔開發(fā)中面臨的許多問題。第一,簡化了標(biāo)記文本的過程,因為作者的關(guān)注重點集中于文本內(nèi)容,而不需操作計算機程序,也無需擔(dān)心文本副本的排版印刷問題。第二,維護(hù)問題簡化到文檔文件外部一些容易識別的位置;樣式的變化更新是容易的,文檔也不容易遭到破壞。第三,美國出版商協(xié)會(APP)已經(jīng)認(rèn)可,描述性標(biāo)記為建立行業(yè)標(biāo)準(zhǔn)提供了最好的方法。文檔可移植性使作者能夠與同事共享文件,并且大大降低了出版成本。第四,在描述性標(biāo)記文檔中,作者提供了語義信息和語用信息,這對于諸如文檔替代視圖和結(jié)構(gòu)導(dǎo)向編輯之類的輔助是必要的。如果沒有描述性標(biāo)記,只有那些格式不兼容的專用系統(tǒng)為僅僅一部分學(xué)者提供功能支持。

最后,應(yīng)該明確的是,描述性標(biāo)記不只是有競爭力的標(biāo)記系統(tǒng)的最好方法;它還是所能想到的最好方法。目前,兩方面的因素制約著人們接受描述性標(biāo)記。一是作者希望保留熟悉的技術(shù)和操作,二是開發(fā)人員使用專有格式將用戶鎖定在自己的產(chǎn)品里。但是,由于描述性標(biāo)記配備有標(biāo)記系統(tǒng)一般性理論中的基本概念,作者能很快意識到描述性標(biāo)記的優(yōu)越性。伴隨著這種意識的擴(kuò)散,我們有望在學(xué)術(shù)計算的質(zhì)量上獲得顯著提升。

參考文獻(xiàn)

注:本文沒有引用參考文獻(xiàn)[6][8][29][32] 。

[1]Alexander. G.B. Computer aids for authors and editors: A natural extension of word processing and typesetting? Seybold Rep. Publ. Syst. 13, 10 (Feb. 13. 1984), 3-21

[2]American National Standards Institute. Information Processing-Text and Office Systems-Standard Generalized Markup Language (SGML). IS0 8879-1986 (E), ANSI, New York. 1986. (First edition: Oct. 15.1986)

[3]Association for Computing Machinery. Proceedings of thy ACM SIGPLAN-SIGOA Symposium on Text Manipulation. ACM. New York, 1981

[4]Association of American Publishers. Electronic Manuscript Project: Task 1 Report. Aspen Systems, Rockville. Md., 1984

[5]Association of American Publishers. Standard for Electronic Manuscript Preparation and Markup. Electronic Manuscript Series. Association of American Publishers. Washington, D.C., Feb. 1986

[6]Association of American Publishers. Authors Guide to Electronic Manuscript Preparation and Markup. Electronic Manuscript Series. Association of American Publishers. Washington. D.C., May 1986

[7]DS. The SGML Newsletter. BDS. Sterling, Va

[8]Beach, R., and Stone. M. Graphical style-Towards high quality illustrations. In SIGGRAPH 83 Conference Proceedings. ACM, New York. 1983, pp. 127-135

[9]Bush. V. As we may think. Atl. Mon. 176. 1 (July 1945). 101-108

[10]Carmody, S., Cross. W., Nelson, T.H., Rice, D., and van Dam, A. A hypertext editing system for the /360. In Pertinent Concepts in Computer Graphics. M. Faiman and J. Nievergelt. Eds. University of Illinois Press, Urbana. Ill., 1969, pp. 291-330

[11]Chamberlin. D.D., et al. JANUS: An interactive system for document composition. In Proceedings of the ACM SIGPLAN-SIGOA Symposium on Text Manipulation (Portland, Oreg., June 9-10). ACM. New York. 1981, pp. 82-91

[12]Coombs. J.H. Information management system for scholars. Tech. Memo. TM 69-2, Computer Center. Brown Univ., Providence. R.I., Dec. 1986

[13]Coombs, J.H., Scott, A.M., Landow, G.P., and Sanders, A.A., Eds. A Pre-Raphaelite Friendship: The Correspondence of William Holman Hunt and John Lucas Tupper. UMI Research Press, Ann Arbor, Mich., 1986

[14]Corda, U., and Facchetti, G. Concept browser: A system for interactive creation of dynamic documentation. In Text Processing and Document Manipulation, J.C. van Vliet, Ed. Cambridge University Press. Cambridge. Mass., 1986, pp. 233-245

[15]Drucker. P.F. Management: Tasks, Responsibilities, Practices. Harper and Row. New York. 1973

[16]Engelbart, D.C., and English, W.K. A research center for augmenting human intellect. In Proceedings of the AFIPS Fall Joint Computer Conference (San Francisco, Calif., Dec. 9-11). AFIPS Press, Reston. Va., 1968. pp. 395-410

[17]Engelbart. D.C., Watson, R.W., and Norton, J.C. The augmented knowledge workship. In Proceedings of the National Computer Conference (New York, June 4-8). AFIPS Press, Reston, Va., 1973,pp. 9-2 1

[18]Goldfarb. C.F. A generalized approach to document markup. In Proceedings of the ACM SIGPLAN-SIGOA Symposium on Text Manipulation (Portland. Oreg., June 9-10). ACM, New York. 1981, pp. 68-73. (Adapted as “Annex A. Introduction to generalized markup” in [2])

[19]Integration and pagination: Long documents, proposals, books. Seybold Rep. Publ. Syst. 16. 16 (Apr. 27, 1987), 21-27

[20]Interfaces, media converters and OCR devices. Seybold Rep. Publ. Syst. 15. 18 (June 2, 1986),34-39

[21]Lamport, L. LATEX Users Guide and Reference Manual. Addison-Wesley. Reading, Mass., 1986

[22]Mamrak, S.A., Kaelbling. M.I., Nicholas, C.K., and Share, M. A software architecture for supporting the exchange of electronic manuscripts. Commun. ACM 30, 5 (May 1987), 408-414

[23]Meyrowitz, N., and van Dam, A. Interactive editing systems: Parts I and II. ACM Comput. Surv. 14. 3 (Sept. 1982), 321-415

[24]Modern Language Association. MLA Handbook. MLA, New York. 1977

[25]Modern Language Association. MLA Handbook. MLA, New York. 1984

[26]Nelson. T.H. Getting it out of our system. In Information Retrieval: A Critical Review. G. Schecter, Ed. Thompson, Washington, D.C., 1967.pp. 191-210

[27]Nelson. T.H. Comput. Libr. (1974)

[28]Nelson. T.H. Literary Machines, Nelson. Nashville. Term., 1981

[29]Nievergelt. J., Coray. G., Nicoud. J.D., and Shaw. A.C., Eds. Document Preparation Systems. North-Holland. Amsterdam. 1982

[30]Reid, B.K. A high-level approach to computer document formatting. In Proceedings of the 7th Annual ACM Symposium on Programming Languages (Las Vegas. Nev., June). ACM, New York. 1980. pp. 24-30

[31]Trigg. R.H., and Weiser. M. TEXTNET: A network-based approach to text handling. ACM Trans. Off. Inf. Syst. 4. 1 (Jan. 1986). l-23

[32]Van Dam, A., and Rice. D.E. On-line text editing: A survey. ACM Comput. Surv. 3. 3 (Sept. 1971),93-114

[33]Yankelovich. N., Meyrowitz. N., and van Dam. A. Reading and writing the electronic book. Computer 18, 10 (Oct. 1985), 15-30

(收稿日期:2016-04-10)

猜你喜歡
文獻(xiàn)
Hostile takeovers in China and Japan
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
Architectural Landscape Planning and Design
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
《黨的文獻(xiàn)》2013年第6期要目
《黨的文獻(xiàn)》2013年第4期要目
《黨的文獻(xiàn)》2013年第3期要目
《黨的文獻(xiàn)》2013年第2期要目
《黨的文獻(xiàn)》2013年第1期要目
太仓市| 东宁县| 新兴县| 龙陵县| 资源县| 五河县| 邢台县| 嫩江县| 进贤县| 马尔康县| 建昌县| 宣汉县| 星座| 司法| 芜湖县| 顺昌县| 绍兴县| 宁远县| 镇康县| 邛崃市| 大足县| 诏安县| 南昌市| 宝清县| 德兴市| 五家渠市| 东阿县| 隆林| 凤台县| 威远县| 砀山县| 泽库县| 罗山县| 阜新市| 正阳县| 平昌县| 沁源县| 慈溪市| 灯塔市| 双江| 龙里县|