40代サラリーマンのBusiness Reminder

ビジネスマンの, ビジネスマンによる, ビジネスマンのための備忘ブックレビューが中心

文字スキャン AIで画像から文字をおこしてくれる人工知能日本語OCRスキャナーアプリが凄い件

人工知能日本語OCRスキャナーアプリ 文字スキャンを使ってみた

どなたかのブログを読んでいて久々に凄いアプリに出くわした。

この人工知能日本語OCRスキャナーアプリ文字スキャン”はiPhoneで写真を撮り、設定をすると、撮った写真の中の活字を読みとって、文字におこしてくれるというもの。

実際試しにやってみたが、かなりの精度で文字に起こしてくれる。

トップ画面はこんな感じ。

試しに文庫本の写真を撮ってみた。

それを読み取ったのがこんな感じ。

ご覧の通りかなりの精度で読み取れているのが分かる。

次にテレビの画面を写真で撮って、読み取ってみた。

シンプルなテキストだったこともあるだろうけど、ほとんど読み取れている。

ちなみに、私の手書きノートでやってみたのだが、さすがに文字が汚すぎて読み取れていなかった。この辺りはこれからの課題なんだろうなとは思う。

規約の部分を見てみると、このアプリは

スマートフォンのカメラで撮影した書類の画像を、テキスト変換(OCR処理)の精度を高める為の画像最適化を行い、Google Cloud Vision APIを利用してテキストに変換(OCR処理)するサービス

だとのこと。

なお、読み取ってテキストに起こしたものを保存しようとすると、ポイントが必要。最初に無料で10ポイント付いているが、使い込んでくるとポイントを購入する必要がある様子。

それにしても、今までドキュメントスキャナ的なものはあったけども、文字に起こしてくれるものは少なくともアプリではほとんどなかったように認識している(と思って色々調べて見たら、今までも”もじかめ”やCamScannerなどが対応していたそう。ただ、文字認識の精度等含めて、課題はあった様子で、このアプリの優位性は最新のDeep Learningを活用していて、精度を高める仕掛けがあるところの様だ。。)

音声認識などと同様に、画像からの文字起こしもかなりの需要がありそう。 AI が日常生活でどんどん使われ出すタイミングにになってきたなと強く思った次第。

2016年8月20日