« 知求コンサート | トップページ | 3角比の実習 »

2006.02.19

フリーのOCR

ひょんなことことから、ずっと前にダウンロードだけはしてあったフリーのOCRをインストールしてみた。
ダウンロードしたのは去年の暮れか今年の初めだと思うのだが、余り必要性を感じなくて今まで使っていなかったのだ。

何と言っても数学は数式があって、どうやってもOCRで認識できるとは思えないから、TeXするか、画像のままで保存することがほとんど。

かつては画像で保存なんかしたら重くて大変だったけれど、今は特に画像だから重いということもないし、以前は新聞の切り抜き(webだからコピペで済むけど)もテキストデータにして保存していたけれど、今は画像も含めてそのままの形で保存しても、そんなに困らない。

そんなこんなでかつては「必需品」みたいな感じもしたOCRだけれど、今はほとんど必要性を感じていない。

ただ、やっぱり検索することを考えると数学ではなく普通の文章であれば、テキストデータの形のほうが便利かもしれないし、某所でOCRの話が出ていたのを見て
「そういえば持っていたなぁ」と解凍してみたのだ。

使ってみたのは
SmartOCR Lite EditionLite版は無料だけど、性能は予想以上に良かった。


Lite 版と Professional 版の違いについて

基本的には、「大量原稿の一括処理はできず原稿ごとに処理する」ことと「速度優先で文字認識される」ことが Professional 版との大きな違いですが、性能(性能テスト参照)と機能(特徴参照)は市販OCRソフトウェアよりも優れています。OCRに関するほとんどのことをSmartOCR 1.0 Liteで実現できるように設計されています。

と言っているだけのことはあって、少なくともスキャナについていたe-Typistよりはずっとしっかりと認識して誤字もずっと少ない。数式を含んだものはやっぱりだめだけど、日本語としての間違いはほとんどない。

まだ使い始めたばかりだからどの程度の学習をするのかわからないけれど、「またかよ~」と思うほどの誤字はなかったし、普通の日本語の文章であれば気持ちよく使える。

窓の杜の紹介記事を見ると

 「SmartOCR Lite Edition」は、独自のエンジンを搭載したOCRソフト。スキャナー画像やBMP/TIFF/JPEG/PNG/GIF/WMF/EMF形式のファイルから読み取った文字情報をテキスト文字列に変換してTXTファイルとして保存できるほか、元画像のレイアウトや表組みを保持したWord/ExcelファイルやRTF/HTML/CSV/PDF形式でも保存できる。また元画像にテキスト情報を埋め込み、画像を選択してテキストコピーしたり文字列検索ができる“透明テキストつきPDF”としても保存可能。
とのことだがまだ使い方がよくわかってない。 かなりいろいろなことができそうでちょっと楽しみ。

まぁ・・・Wordはめったに使わないから、どっちかって言うとTeXファイルにしてくれるともっといいんだけどなぁ・・・

|

« 知求コンサート | トップページ | 3角比の実習 »

コメント

SmartOCRをダウンロードしたところ、IEにブロックされました。そのブロックをかいくぐり、インストールし解凍を試みたところ非常に危険なので
中止したほうがとの表示が出ました。
 窓の社の中にありますので危険ではないと思いますがどうでしょう。

投稿: 鎌倉街道 | 2009.01.29 20:37

CosはIEを使っていませんし、スマートリーディング社は今は営業をしていないので、質問することも出来ませんからインストールするかどうかは自己責任ということになります。

Cosがインストールしたのは今使っているパソコンを使い始めたときなのでかなり前になりますが、そういう問題は起きなかった気がします。

OSの違い、ブラウザの違いなどもあるのでしょうから不安を感じられるのであればやめておいたほうがいいのかもしれません。
(自分のパソコンだったら、何かあっても自分で何とかすればいいのですが・・・)

投稿: Cos | 2009.01.29 23:03

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/3303/8746209

この記事へのトラックバック一覧です: フリーのOCR:

« 知求コンサート | トップページ | 3角比の実習 »