読んde!!ココ Ver.13を使ってみました。

こちらのソフトの簡単に操作できるインタフェースがあり。単純な作業ならかなり簡単に処理することができました。

 

初めてなので、とりあえず両面原稿をスキャンして、OCRした後に、OCR結果と共にPDFを作成しました。

 

まずは読んde!!ココ Ver.13を起動します。

起動すると以下の画面が表示されます。

起動する前に、ドキュメントスキャナに原稿を載せておきます。(起動してからでも問題ありません)

 

左側の自動で認識を押して、表示される画面で開始ボタンを押します。

 

そうすると、以下の画面が表示されるので、今回は「紙原稿をPDFにする(1つのファイルにまとめて保存)」を選択し、開始ボタンを押します。

 

そうすると、以下のエラーが表示されました。使用するスキャナが指定されていないからの様です。

OKボタンを押します。

(2回目以降はこの画面は表示されません)

 

スキャナを選択してOKボタンを押します。

 

スキャン内容を選択して読み取りボタンを押します。

 

どんどんスキャンされ、原稿がなくなるとPDFが生成されます。

PDFは初期状態だと、ドキュメントフォルダに保存される様です。

 

最初のドキュメントスキャナの設置の日記に書きましたが、初期のままだと、スキャンがかなり遅いです。

なので、最初に設定を変更します。

 

最初の以下の画面で、右上の×ボタンでウインドウを閉じます。

 

そうすると、下に表示されている以下の画面が表示されます。

上のメニューのオプションから、環境設定を選択します。

 

原稿タブを選択し、EPSONスキャナ-「高速スキャンを行なうを」チェックし杖OKボタンを押して高速スキャンを有効にします。

 

この設定で、解像度が300dpiの時に高速スキャンが出来ました。

300dpi以外では、早くならない様です。

 

スキャン、OCR処理、PDFの作成がほぼ自動で処理できて非常に簡単にPDFが作成できました。

 

処理手順的には、まず原稿をスキャンします。

その後に、スキャンした画像をOCR処理して文字を抜き出します。

OCR処理の時間はスキャンと比べてかなり時間がかかります。

うちのPCのはPentiumDの3Gぐらいだったと思いますので、今時のPCだと早いかもしれませんね。

300ページぐらいで、30分程度かかっていたかと思います(測っていないので嘘かもしれませんが、時間は結構かかります)

抜き出した文字は、PDFに透明テキストとして埋め込まれる様です。

 

OCRについては、文章中の言葉はかなりの精度で読み取っている様に思えます。

ただ、文中ではなく原稿にある画像(写真)の中の文字も認識しようとする様です。

こちらの認識は当たり前ですが、無茶苦茶な文字で認識する事が多いようです。

本当は認識しなくて良いのですが、1ページづつ設定する手間はすごく大変なので、自動認識してそのまま保存しています。

読める文字だけ検索できれば十分で、誤認識して変な文字や記号でPDFに埋め込まれていても、それが検索に当たる事はあまりなさそうに思いますので自動認識で十分だと思いました。

 

今度は、あまり読まない分厚い本をスキャンしてみようと思います。

実は既に何冊かスキャンしているのですが、メモしていないので、次の本をスキャンした時にメモして載せようと思います。

 

ES-D350はこちらから購入できます((amazon)EPSON ドキュメントスキャナ ES-D350)

タグ: ,

コメントを残す