ES-D350で本1冊のスキャンをしました。
本を裁断、Document Capture Proでスキャン、その後読んde!!ココでOCR処理の手順で行ないました。
本の裁断ですが、裁断機を購入する程スキャンするとは思えないので、定規とカッターのみで行ないます。
意外と簡単だったので、こだわりが無く読めればいいかな!?ぐらいでしたら、カッターで十分だと思います。
今回、スキャンするのはこの本です。
最近読ま無くなったのですが、捨てるのは忍びないので電子化して保存して紙媒体は破棄します。
床(テーブル)が切れるので、敷物と、定規とカッター(大きいのがいいと思います)を用意します。
全て100円均一で購入しました。定規は切れない様に金属製の定規が良いかと思います。
まっすぐであれば、定規でなくても大丈夫だと思います。
本の閉じしろで、のりが付いている厚さを本を開いてみて観察します。
のりが付いていない部分をカッターで切り落としたいので見て判断します。
糊の部分を切ってしまうと、本場ばらせないので要注意です。
切る場所を決めたら定規を当てます。
定規に合わせカッターで切っていきます。最初切る時が重要で本に対して直角になる様にカッターを当てて切り目をいれます。5回ほど切り目を入れると、20ページ程が外せます。
こんな感じになります。
本の背側がこんな感じになるので、背側にそってカッターで少しづつ裁断していきます。
定規は最初だけで途中からは、写真の右側の背表紙側に沿って切れば良いです。
そのまま続けると最後には、背表紙がキリ落ちて、本がバラバラにばらせます。
これをスキャナーに乗せます。
Document Capture Proを起動します。
そして、左上の「スキャン」ボタンを押します。
設定はADF両面で、解像度を確認して、それ以外は自動でにします。
また、白紙ページ除去をチェックしておきます。
詳細設定は、「詳細設定」ボタンを押して確認します。
詳細の設定を行えます。文字クッキリがいいかな?と思ったのですが、スキャンしてみると文字はクッキリですが、写真や表などが悲しいことになっていたので、結局は表紙を自動、それ以外のページをグレーでスキャンしました。
まずは分厚い表紙だけをスキャンします。
厚みがあってダメそうだったら、フラッドヘッドスキャナでスキャンするつもりでしたなんとか読み込めました。
表紙だけがスキャンできました。
続けて中身をスキャンします。
左下の「+」ボタンを押します。メニューが表示されるので「スキャナー」からを選択します。
そうすると、表紙と同じスキャン画面が表示されますので、設定を確認してスキャンします。
中身はイメージタイプにグレーを選択しました。この本の中には白黒です。
終わったら、最後のページを追加スキャンします。
用紙サイズを自動にしたので、傾き補正が出来ていません。
ところどころのページが斜めにスキャンされています。
なので、傾き補正をします。
左側にスキャンしたページが表示されています。
全てのページを選択します。(最初のページをマウスでクリックして選択した後に、スクロールバーを使って最後のページを表示します。そこでSHIFTキーを押しながら最後のページをマウスでクリックします。)
そして、右側のプレビュー表の上の一番右側のマークが「自動傾き補正」です。
これを選択すると、選択した(全て)のページの傾き補正を自動で実行してくれます。
スキャンした内容を保存します。
左上のファイルメニューの中の「名前をつけて保存」を選択します。
そうすると、以下の画面が表示されます。
今回は、画像で保存して、読んde!!ココ Ver.13でOCRするつもりなので、JPEG画像で保存します。
後の処理をしやすくするために、保存フォルダーの中を空にしておきます。
保存フォルダーを選択し、保存形式に「JPEG」を選択します。
OCRしない場合には、この保存形式でPDFを選択すれば、PDFが生成されて終了です。
保存形式を選択したら、「OK」ボタンを押します。
保存中のバーが表示され、右側まで進めが終了です。
終わったら、Document Capture Proを終了します。
ここから、OCR処理を行ないます。
あまり詳しくないので、自動で処理します。
読んde!!ココ Ver.13を起動します。
そうすると、以下の画面が表示されますので、上の「OCRファクトリー」ボタンを押します。
そうすると、以下の画面が表示されます。
ここで左側のタイトル一覧から「原稿をPDFにする(1つのファイルにまとめて保存)を選択します。
そして、左下側にある、「変更」ボタンを押します。
そうすると、以下の画面が表示されるので、左上の画像の読み込み直下のスキャナを選択します。
右側に処理内容の設定が表示されるので、「画像をファイルから読み込む」を選択します。
読み込むファイルの選択画面が表示されるので、先程Document Capture Proで保存したフォルダ内の画像を全て選択します。傾き補正と同じ様に最初と最後を選択するか、選択画像を1つ選択した後にキーボードのCRTLキーを押した状態で、Aボタンを押します。(そうすると、全ての画像が選択されます)
全部選択できたら、「開く」ボタンを押します。
選択された画像ファイル名が表示されます。
左下の「別名保存」ボタンを押します。
そうすると、保存名称が指定できますので、分かる名前を指定します。
今回は、xoopsの本なので、xoopsにします。
(よくよく考えたら、ファイルではなく、フォルダ指定すれば良さそうな気がします)
左側のタイトル一覧から先ほどつけた名前を選択して、「開始」ボタンを押します。
ここで大事のは、右側の最後に「PDF(透明テキスト)形式」となっている事が重要です。
初期設定だと、そうなっている筈です。
これになっていると、OCRした文字が、PDF中に透明のテキストとして保存される様です。
検索は、この透明なテキストを検索することになります。
以下の様な画面が表示され、1ページづつOCR処理されます。
終わったら自動的に、PDFが作成されます。
終わったら、読んde!!ココを終了して作業終了です。
PDFファイルは、初期設定だとドキュメントフォルダに保存されます。
ES-D350はこちらから購入できます((amazon)EPSON ドキュメントスキャナ ES-D350)
タグ: ES-D350, ドキュメントスキャナ
こんにちは♪
なにやら難しいことはじめてると思っていたら~~
デジタルブックをつくっておられたのですね。
凄いことができるのですねぇ~~~
私は確かソニーだったように思いますが
一つ持っていて、「悪人」という本が入っていて
読んだことがあります。
外へ持って出るには、かさばらないので便利ですよね。
そのうち、本はデジタルが普通になる日が来るのでしょうか。
tomoさん
コメントありがとうございます。
電車の中で読めるのと、最近老眼っぽいので紙はちょっと辛買ったりするので、拡大出来る電子端末は良い感じです。
それ以前に、場所をとっていて捨てたいけど、捨てられない本が電子化して処分できました。
ただ、紙には紙の良い所があり、閲覧性は紙の方がいいですよね。