☆ 吳曉龍
(南京玄武區(qū)教師進(jìn)修學(xué)校,江蘇南京 210016)
網(wǎng)絡(luò)文本資源下載技巧詳解
☆ 吳曉龍
(南京玄武區(qū)教師進(jìn)修學(xué)校,江蘇南京 210016)
教師們經(jīng)常上網(wǎng),也經(jīng)常在網(wǎng)上搜索到一些有用的文本資源。有時辛辛苦苦找到有用的資源,可是卻下不下來。本文主要給大家介紹一些網(wǎng)絡(luò)文本資源下載的一般方法和一些高級技巧。
方法一:最簡單的下載,也是教師們用得最多的方法。
(1)選擇網(wǎng)頁的文本,這時文字顯現(xiàn)反選狀態(tài)(藍(lán)底,白字)。
(2)右鍵,復(fù)制(或CTRL+C)以上選擇的文本。
(3)打開相應(yīng)的軟件,如Word、PPT等。
(4)粘貼文本(或CTRL+V)。
通過以上步驟,網(wǎng)絡(luò)上的文本資源被成功復(fù)制、下載。
問題:用以上方法下載網(wǎng)絡(luò)文本資源,如果網(wǎng)頁上的文本不能選擇怎么辦?如果網(wǎng)頁上的文本可以選擇,但不能成功復(fù)制怎么辦(有些網(wǎng)頁文本你一單擊右鍵復(fù)制,它會提示非法拷貝等提示)?
請大家嘗試如下網(wǎng)絡(luò)文本資源的下載方法。
方法二:“另存為”法,基本操作如下。
(1)先上網(wǎng)找到相應(yīng)的網(wǎng)頁文本資源。
(2)點擊IE瀏覽器的“文件”菜單。
(3)在文件菜單下選擇“另存為”。
(4)把“保存類型”選擇為“文本文件”,然后把保存位置設(shè)置為“桌面”或者你需要保存的位置,再點“保存”按鈕。
在桌面或者你選擇的保存位置會生成一個文本文件,打開文本文件就會出現(xiàn)你要下載的文本信息,再用選擇-復(fù)制-粘貼的方法將其復(fù)制到你所需要的地方,如Word、PPT中等等。
給大家介紹用方法二下載的實例:
http://www.xwjy.cn/jiaoyududao/zhengcifagui/200909/9440.shtml
以上鏈接就不能直接復(fù)制、粘貼,但可用以上介紹的方法二下載。
方法三:還有一些網(wǎng)頁的文字,用“另存為”的方法也不行,那你可以嘗試如下方法。
打開網(wǎng)頁,在IE瀏覽器的“查看”菜單里 選“源文件”,在里面找找看你沒有你需要的文字,如果有,再進(jìn)行“復(fù)制”-“粘貼”操作。
用這種方法,也可以下載以下頁面的文本資源:
http://www.xwjy.cn/jiaoyududao/zhengcifagui/200909/9440.shtml
方法四:打開網(wǎng)頁,在IE瀏覽器的“文件”菜單里選“使用Microsoft Office Word編輯”。
用這種方法,同樣也可以下載以下頁面的文本資源:
http://www.xwjy.cn/jiaoyududao/zhengcifagui/200909/9440.shtml
方法五:打開網(wǎng)頁,在IE瀏覽器的“工具”菜單——“Internet選項”——“安全”——Internet——自定義級別,然后在設(shè)置里把“腳本”里的 活動腳本 “禁用”,按“確定”。
重新啟動IE瀏覽器,打開需要下載的網(wǎng)頁,這時就可以選擇、復(fù)制所需要的文本了。
復(fù)制完后別忘了把IE瀏覽器的活動腳本設(shè)置為啟用,不然以后瀏覽網(wǎng)頁的時候有些頁面里的內(nèi)容就看不到了。
下面介紹幾種更高級一些的網(wǎng)絡(luò)文本下載方法。
方法六:“拷屏——文字識別”法。
有些網(wǎng)頁上的文本資源,你看到的看似是文本,但它是圖片或者是FLASH等軟件生成的“非文本格式的文本”,比如JPEG圖片、SWF格式的動畫、加密的PDF格式文本等。
大家可以嘗試,拷屏后用文字識別軟件識別的方法來下載。該方法操作相對較復(fù)雜,需要有一定的電腦操作基礎(chǔ)。
這種下載方法的原理是:先將要下載網(wǎng)頁的頁面拷屏,生成JPEG圖片,然后用文字識別軟件將圖片識別成文本(就和將報紙、雜志上的文字用掃描儀掃描到計算機后用文字識別軟件識別原理相似)。
具體操作方法如下:
(1)打開需要下載的頁面,按PrintScreen鍵(這個鍵一般在鍵盤的右上方,有些鍵盤可能是簡寫PSC)。
(2)打開圖片處理軟件Photoshop,新建一個文檔,粘貼,這時你所選的網(wǎng)頁頁面以圖片的形式出現(xiàn)在Photoshop中,用裁剪工具將沒有文字或者不需要的部分剪去,剩下文本部分。
為了提高文字的識別率,請放大圖片,將圖片的分辨率提高到300以上。
圖像大小調(diào)整的方法,Photoshop-圖像-圖像大小。將文件存儲為JPEG格式(“文件”菜單-“存儲為”)。
安裝識別軟件,這里以尚書七號OCR為例,軟件下載地址:http://www.xwjy.cn/xici/soft/shangshu7.rar。
下載解壓后點擊安裝文件Setup.exe,按提示點“下一步”直到“確定”,安裝完成。
在“開始”菜單里運行“尚書七號OCR程序”,打開前面保存的JPEG圖片,再按“識別”按鈕,圖片被識別成文本(紅色框從左到右分別是“打開”按鈕和“識別”按鈕)。
識別軟件的識別率受到圖片清晰度等多種因素影響,如果沒有100%識別適當(dāng)手動修改一下即可。
在使用PrintScreen鍵“拷屏-識別”這種方法進(jìn)行文本下載時,常見到的一個主要問題是:當(dāng)需要下載的文本不只是電腦桌面那么一屏,而是有很多,需要拉垂直滾動條才能瀏覽全部文本,這時用PrintScreen鍵只有一屏一屏的拷貝,然后用文字識別軟件進(jìn)行識別,那是比較麻煩的。
下面給大家介紹一種可以滾動拷貝屏幕的方法。
滾動拷貝屏幕一般需要用到一些軟件,這類的軟件很多,下面以 HyperSnap 為例,軟件下載地址:http://www.xwjy.cn/xici/soft/hypersnap670.rar。
先將Hypersnap軟件下載到本地,然后雙擊安裝:
下面要做的兩項工作就是:在網(wǎng)上找到需要下載的頁面文本(文本較多,帶滾動條),然后啟動HyperSnap軟件進(jìn)行滾動拷屏,具體方法如下:
(1)打開需要下載的文本頁面,下面以http://www.xwjy.cn/jixujiaoyu/jinrituijian/200903/7843.shtml為例,并且將垂直滾動條拉到最頂端(這樣便于從上往下滾動拷屏全部內(nèi)容)。
(2)啟動HyperSnap軟件,可以從“開始”-“程序”菜單里啟動,也可以從桌面上直接雙擊快捷按鈕。
(3)進(jìn)入HyperSnap程序界面,選擇“捕捉”菜單下的“整頁滾動”,這時會在需要下載的頁面出現(xiàn)閃爍框,在閃爍框里點擊鼠標(biāo)左鍵,電腦就會自動滾動屏幕并拷屏。
(4)選擇“文件”菜單下的“保存”或“另存為”將文件保存所需要的格式和位置。
(5)將拷屏的圖片文件放大到300dpi以上,然后用識別軟件進(jìn)行文字識別。
方法七:“文字捕捉”法。
用HyperSnap軟件還可以直接對頁面進(jìn)行“文字捕捉”(意思就是直接將頁面的文字識別成可以拷貝的文本,這是一種非常“神奇”而又方便的方法),具體操作如下:
(1)打開HyperSnap軟件。
(2)在“捕捉”菜單里選擇“捕捉設(shè)置”,在“捕捉設(shè)置”的對話框里將“文本捕捉”選項卡里的“純文字捕捉”和“格式化文本捕捉”選中,確定。
(3)打開找到的頁面,然后點擊HyperSnap的“文本捕捉”菜單下的“文本”,在網(wǎng)頁頁面鼠標(biāo)就會變?yōu)閰^(qū)域選擇狀態(tài)。
(4)按住鼠標(biāo)左鍵,選擇需要捕捉的區(qū)域,然后文本就會被捕捉、識別,并呈現(xiàn)出來。
(5)將HyperSnap捕捉、識別后的文本復(fù)制、粘貼到相應(yīng)的文字處理軟件(如Word)即可。
于翼楠]