1. 尚書七號如何使用
這個裡面有圖 隨著掃描儀的逐漸普及,文檔掃描已作為掃描儀的一項主要用途越來越被用戶所常用,現在市場上的文檔識別軟體也有好多種。對識別軟體不了解,往往會導致用戶朋友事倍功半,下邊我們就來談談中晶ScanMaker 4850ii隨機附送的尚書七號的使用方法。 首先,尚書七號將整個OCR的過程明確化了,通過程序的菜單,我們就能夠知道整個OCR的過程,主要分為:「文件」、「編輯」、「識別」、「輸出」等步驟。 在文件菜單中,您可以調用掃描儀,或者選擇將已經掃描好的圖像文件打開。得到圖像文件後,用戶的工作,就是「編輯「菜單裡面所提示的:圖像頁面的處理,其中包括圖像頁的傾斜校正(提供自動和手動實現方法),旋轉等功能。 處理完畢後,就可以進入「識別過程」,該過程關鍵的是「版面分析」,現在尚書七號的自動版面分析功能很強,面對報紙雜志等復雜情況的版面,也能保持分析正確率很高。不再需要我們在尚書六號裡面那樣的建議手工劃識別范圍。也正是這點,大大降低了使用者的工作量。為了方便,在「識別」菜單下,也提供了用戶在自動版面分析後,通過修改識別范圍框的屬性,來決定需要識別否的功能。當然,如果用戶還是可以按習慣的尚書六號那樣,自己來設定識別區域。當用戶設置好後,就可以直接點擊「開始識別」的按鈕進行文字識別了。 自動識別完畢,識別結果的「文本窗口」都會彈出,這個窗口能夠提供識別結果的校對,為了校對的方便,尚書七號增加了游標跟隨顯示原圖像行的校對方法(如下圖出現的黃色提示行的出現)。 這樣提供校對的方法,一眼就能夠看到圖像原文和識別出文本的差別,方便了用戶,降低了用戶校對的工作疲勞感。當檢查過後確認沒有錯誤,用戶就可以選擇識別結果的「輸出」了,指定的文件格式有:RTF、HTML、XLS、TXT,用戶這里可以根據自己的需要選擇對應的格式。如果是用戶想得到類似原文的識別結果,請選擇RTF格式。把RTF格式輸出的文件用WORD打開後,會發現幾乎保留了原文的所有特點,包括原來的頁面中的彩色圖像,都已經保留在WORD中了。原稿如下: 識別結束後,存為RTF格式保存,WORD打開後的情況: 從上面的種種介紹來看,尚書七號確實大大的方便了用戶使用OCR的識別工作。 其次,在尚書七號中,提供了多圖像頁面的處理功能。用戶就可以放心的將好幾頁的文章,統一進行版面處理(只要選擇「識別」菜單下的「選擇全部文件」就可以做到批處理),識別的結果輸出在同一個文件當中,更便於管理和保存。 尚書七號還最大范圍的減少了用戶作掃描時候的限制,用戶只要在掃描驅動軟體中,設定解析度是300DPI,不管是彩色、256階灰度還是黑白兩值,尚書七號都是輕松識別。同時,如果用戶只是需要黑白文檔,在彩色、256階灰度方式的掃描,尚書七號可以自動的轉化成黑白兩值圖做識別,這樣的識別效果還更好。 下面是尚書七號OCR系統的技術指標,供大家參考: 本軟體系統是應用OCR(Optical Character Recognition)技術,為滿足書籍、報刊雜志、報表票據、公文檔案等錄入需求而設計的軟體系統。 目前,許多信息資料需要轉化成電子文檔以便於各種應用及管理,但因信息數字化處理的方式落後,不但費時費力,而且資金耗費巨大,造成了大量文檔資料的積壓,因此急需一種快速高效的軟體系統來滿足這種海量錄入需求。本軟體系統正是適用於個人、小型圖書館、小型檔案館、小型企業進行大規模文檔輸入、圖書翻印、大量資料電子化的軟體系統。 ●識別字元 簡體字元集:國標GB2312-80的全部一、二級漢字6800多個。 純英文字元集。 簡繁字集:除了簡體漢字外,還可以混識台灣繁體字5400多個以及香港繁體字和GBK漢字。 ●識別字體種類 能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,並支持多種字體混排。 ● 識別字型大小 初號 小六號字體。 ●表格識別 可以自動判斷、拆分、識別和還原各種通用型印刷體表格。 ~
2. 尚書七號掃描時出現出現這個問題是怎麼回事急
我建議你使用漢王 PDF OCR,我也用過掃描的,漢王的中文識別率還是很高的,關鍵還是操作簡單,尚書的我用過一次,對圖片的格式有要求,挺耽誤我操作效率的,我就沒繼續研究了
3. 尚書七號ocr轉換的掃描件用word打開後為什麼自動縮小了
掃描時需要一定的解析度設定,如果你的解析度設定的小,那麼在word中讀取到的掃描件(這里的是圖片格式)就會自動縮小。
如果用尚書識別文字的話,不存在大小的問題,圖形會要求解析度尺寸。
4. 求尚書七號具體使用步驟!
首先,尚書七號將整個OCR的過程明確化了,通過程序的菜單,我們就能夠知道整個OCR的過程,主要分為:「文件」、「編輯」、「識別」、「輸出」等步驟。
在文件菜單中,您可以調用掃描儀,或者選擇將已經掃描好的圖像文件打開。得到圖像文件後,用戶的工作,就是「編輯「菜單裡面所提示的:圖像頁面的處理,其中包括圖像頁的傾斜校正(提供自動和手動實現方法),旋轉等功能。
處理完畢後,就可以進入「識別過程」,該過程關鍵的是「版面分析」,現在尚書七號的自動版面分析功能很強,面對報紙雜志等復雜情況的版面,也能保持分析正確率很高。不再需要我們在尚書六號裡面那樣的建議手工劃識別范圍。也正是這點,大大降低了使用者的工作量。為了方便,在「識別」菜單下,也提供了用戶在自動版面分析後,通過修改識別范圍框的屬性,來決定需要識別否的功能。當然,如果用戶還是可以按習慣的尚書六號那樣,自己來設定識別區域。當用戶設置好後,就可以直接點擊「開始識別」的按鈕進行文字識別了。
自動識別完畢,識別結果的「文本窗口」都會彈出,這個窗口能夠提供識別結果的校對,為了校對的方便,尚書七號增加了游標跟隨顯示原圖像行的校對方法(如下圖出現的黃色提示行的出現)。
5. 尚書七號使用方法
下面結合Microtek掃描儀的驅動軟體ScanWizard5,詳細介紹如何配合尚書六號OCR軟體做好文字識別工作:
Step1:掃描圖像文件
建議首先點擊桌面上ScanWizard5軟體的圖標,進入Microtek掃描儀驅動軟體的界面,直接進行掃描工作,而不需要啟動其他的掃描程序或圖像編輯程序,這樣可以大大加快掃描進程。同時,注意將ScanWizard5軟體切換到高級工作模式(如圖1所示),以便於用戶檢查掃描儀工作時的解析度。在文字識別時,推薦使用的掃描解析度設定在300ppi,色彩模式可以選擇「RGB彩色」或者「灰階」,選擇「掃描到」的文件格式是TIF或者JPG兩者都可以,然後將掃描得到的文件保存在用戶確定的目錄下面。
Step2:打開尚書六號讀取掃描好的圖像文件
Step3:被識別圖片的預處理
被識別圖片的預處理工作主要包括「傾斜校正」和「設定正確識別區域」兩個步驟。在進行「傾斜校正」時,可按下工具欄的最下面的一個「圖像傾斜校正」工具按鈕。系統會自動彈出一個對話框,提示需要校正的角度,此時按下「是」按鈕,系統就給予圖片做水平的傾斜校正。在此需要特別注意,「自動傾斜校正功能」只能對原稿做±2.8度的傾角的校正,如果原稿的傾斜角度大於2.8度,系統會建議用戶重新掃描稿件,以提高識別率。
如何「正確設定識別區域」,也是一個值得用戶注意的地方:如「海爾」一文,實際是分成兩個欄目進行閱讀的,所以在設定識別區域的時候,注意需要將這個兩個欄目分別圈定,也就是設定兩個識別區域(如圖2所示)。同時,對於一些文字稿件,如果在中間插有圖片的時候,建議採用繞開的方式,對所環繞的文字分別進行識別區域的設定。此外,對於表格類的圖片,為了將標題欄也能識別進去,建議將表格部分整個框選,同時標題作為一個單獨的框選區域。
Step4:開始進行識別
在開始「識別」的時候,應注意識別軟體的設定值是否正確,尤其注意識別字集的選擇問題:如果要識別簡體中文,請選擇「簡體字集」;如果要識別繁體中文,請選擇「繁體字集」;在選擇「純英文字集」時,可以大幅提升英文字母的識別率。同時,「簡體字集」和「繁體字集」也具有較強的識別英文的能力。
Step5:識別校對完成後,進行保存
在「尚書六號」文字識別軟體中,存檔格式(也就是文件保存的類型)有四種,分別是:Word、Text、CSV、HTML。直接用Word格式保存時,可以用微軟的Word軟體打開,它可以相對比較完整的保存排版格式;但建議用戶一般可選擇Text(純文本)格式保存,因為這種格式可以用幾乎所有文檔編輯器打開;如果用戶進行表格識別,識別結果可以選擇保存為CSV格式,這樣用EXCEL就能夠直接打開;而HTML格式是針對網頁設計使用的,用IE等網路瀏覽器或網頁編輯器可以打開。
6. 尚書七號如何用
打開ocr後,如果識別掃描儀文件,同時打開掃描儀,放好文件,點擊掃描-選擇作業類型-設置圖像類型-解析度-圖像區域-設置後按掃描-掃描完成後,用滑鼠選擇識別區域,點擊識別-將識別文件保存(輸出按鈕)(txt格式)打開路徑中的txt文件復制粘貼到所需位置如word等。
7. 使用尚書七號軟體,點「掃描」,激活的是攝像頭而非掃描儀,為什麼啊~~~~
這個可能是兩個設備或者驅動有沖突。不知你這個是筆記本還是台式機。這兩個的驅動是否可以單獨安裝。
你可以這樣試試:先安裝掃描儀,並測試正常後再安裝攝像頭的驅動。一般即可解決。
如果還有問題,可以看看掃描儀的設置,是否有埠等方面的設置。