-
Details
-
Written by: 芦田和毅
-
カメラ付き携帯電話による文字抽出システムの構築
近年,非常に多く見られるようになった携帯電話のカメラ機能であるが,その画素数などの性能の発展はめざましいものである.画素数を例にとってみても500万画素を越える機種も存在しており, デジタルカメラにも迫る性能を持つとも言われている.また,携帯電話のアプリケーションはJava言語で構築されているものもあり,主要なものとしてはNTT-Docomo社が開発した“iアプリ”が挙げられる.Java言語は現在世界中で最も普及しているプログラミング言語のひとつで,
非常に豊富なライブラリをもち,OSなどの実行環境に依らない強力な
オブジェクト指向言語として注目を集めている.さらに,NTT-Docomo社はiアプリの開発環境“Doja”による拡張APIを無償で配布している.それにより,今日のiアプリを取り巻く環境は非常に恵まれているといえる.
一方で,文字抽出はパターン認識の分野のひとつとして注目されている.これらはモノクロ画像からカラー画像までを対象にしたものであり,その精度はここ数年の研究の成果により活字のみならず,撮影角度の一定でない街頭の広告に含まれる文字などの抽出,認識まで可能になってきている.
そこで本研究では,携帯電話で撮影した情景画像をPC上のサーバに転送し,PC上で文字抽出処理をさせ,再び携帯電話に文字抽出結果を転送して携帯電話のディスプレイに表示する文字抽出ユーザインターフェースを作成する.
-
情景画像からの文字抽出に関する統合システムの構築
近年,光学文字認識に関する研究は,非常に精度の高いものとなってきている.ここでいう光学文字認識とは,活字の文書の画像をイメージスキャナなどで取り込み,コンピュータが編集できる形式(文字コードの列)に変換することである.
ラテン文字の活字文書の正確な認識はほとんど解決済みの問題であり,文字を正しく認識する確率は99%を越えているが,特定の間違いの許されない状況では人間が結果を確認する必要がある.
手書き文字認識や文字の種類が多い言語の文字認識ではまだ研究の余地がある.今回は文字認識ではなく,発展途上の分野であるカラー情景画像からの文字抽出についての研究を行う.