人工知能の発達は、社会にさまざまな影響を与えています。近年では囲碁でAIが人間に勝つというニュースや、行政もAIを導入するなど、AIの存在がより身近なものとなっています。
AIの進化によって変化を遂げたものの1つに、OCRがあります。OCRは100年以上前から開発されてきたITツールですが、近年になり、再び注目を集めています。
今回は、進化したOCRによる手書き文字の対応について、詳しくご紹介していきます。
OCRは手書きにも対応するのか
OCRはこれまで、基本的に手書き文字ではなくパソコンなどで出力された活字を読み取るというものでした。現代では、手書き文字の認識の精度も上がってきており、手書き文字の読み取りが実用化されてきています。
手書き対応のOCR
手書き対応のOCRは、さまざまなメーカーから提供されており、それぞれ異なった特徴のOCRが開発され、RPAなどとセットで提供されています。手書き文字に対応したOCRのほとんどは「AI-OCR」と呼ばれるAIが搭載されているものです。
役所での各種申請の手書き申請書やFAXでの紙の発注書、アンケートなどを読み取ることが可能で、不動産や製造、病院、保険に至るまで様々な業種で利用されてきています。
固定ピッチ・フリーピッチ
OCRの手書き読み取りには「固定ピッチ」と「フリーピッチ」があります。 固定ピッチとは、読み取り領域に記載される文字と文字の間隔を固定するという方法です。はがきの郵便番号欄のような1枠に1文字が入っているようなフォーマットになります。
一方、フリーピッチは、固定ピッチのように等間隔で文字を入力する必要がありません。1枠に複数の文字が入っているようなフォーマットになります。
手書きOCRの技術が発達していく中で、フリーピッチの技術も進化し、フリーピッチに対応するOCRが多く存在しています。
日本語手書き文字の認識精度
OCRを利用する際に気になるのは「認識率」です。認識率がよければ、読み取れる文字の割合も高くなるため、チェックもしやすくなります。
まずは、認識率とはどのようなものなのかを見ていきましょう。
OCRの認識率とは
認識率とは、OCRがどれくらいの精度で文字を認識し、データ化できるかというものです。
認識率が高ければ高いほど、精度がよいということになります。そして、精度が高くなっていくと、人が行うチェックや修正作業なども楽になります。しかし、現代においては、認識率を100%にする技術はなく、認識しにくい文字などが多く記載されている場合には、認識率は低くなる可能性が高いといえます。
たとえば「1(イチ)」と「l(エル)」は見た目が似ているため、数字と英語を読み間違えてしまう可能性もゼロではありません。数字以外にも、画数が少ないものに関しては高い認識率で認識してくれますが、画数が多い漢字などは、画像の粗さなどによって、認識率を下げてしまうこともあります。
AIを使った手書き文字の認識技術
近年では、AIが搭載され進化したOCRが多くの企業から販売されています。手書き文字をどのように認識しているか、今回は富士通のAI技術「FUJITSU Human Centric AI Zinrai(ジンライ)」(以下「Zinrai」)(注1)の手書き認識技術を紹介いたします。
「Zinrai」では異種深層学習モデルと言語モデルにより認識精度を向上しています。
異種深層学習モデルは、文字の区切りを正しく判別します。文字に加え、非文字(文字として存在しない「へん」と「つくり」の組み合わせ)も一緒に学習させることで、フリーピッチの手書き文字でも文字の区切りを正しく判別します。
言語モデルで認識候補を分析し、正しい文字列を出力して精度を上げています。
富士通Zinraiの日本語手書き認識技術
- ① 文字列の空白部分を利用して、複数領域にパーツ分割
- ② 分割領域が1つの文字を表す場合(上図上段)と、隣り合う領域を組み合わせて1つの文字になる場合(上図下段)に分け、認識アルゴリズムにより候補を出力
- ③ 信頼度の高いものを順に選択することでフリーピッチの文字の区切りを正しく判別し、最も可能性の高い文字列を出力
- ④ 言語モデルにより、認識候補が正しい文字列となるように補正
この仕組みにより、フリーピッチ手書き文字を95.5%(注2)以上で高精度に認識しています。
- (注1)FUJITSU Human Centric AI Zinrai:30年以上にわたり富士通グループが取り組んできた「知覚・認識」や、「知識化」、「判断・支援」、そしてそれらを高度化し成長させる「学習」などのAIに関する研究開発の結果である技術やノウハウを結集し、体系化したものです。
- (注2)PFU DynaEye 10「AI日本語手書きOCRオプション」の検証結果による実績値。
まとめ
今回は、OCRによる手書き文字の認識についてご紹介してきました。AIが導入されたことで、これからますますOCRの技術は進化していくでしょう。この進化に合わせて、RPAなどのツールとともにOCRの導入を検討されてみてはいかがでしょうか。
PFUでは、長年にわたって多くのクライアント様にOCRの導入を支援しております。OCRの研究を行っているため、高い認識率のOCRのご提供を実現しています。導入をご検討されている企業様は、是非一度ご相談ください。