本人確認ソリューション~ハイブリッドOCR適用による認識精度向上~

従来型OCRとAI-OCRの性質の異なる2つのOCRエンジンを併用することで、認識精度の向上を実現しました

本人確認ソリューション~ハイブリッドOCR適用による認識精度向上~
Technology

2024.03.29

概要

■「本人確認ソリューション」
当社の「本人確認ソリューション」は、銀行口座開設時等で提出が要求される本人確認書類(運転免許証、マイナンバーカード、在留カード、健康保険証)から、「氏名」「住所」「生年月日」などをOCRで読み取り、テキスト化するもので、eKYCなどの本人確認サービスのシステムに組み込まれ、氏名や住所の入力や提出書類との突合に利用されています。

そして今回、従来型OCRとAI-OCRの性質の異なる2つのOCRエンジンを併用することで、認識精度の向上を実現しました。
 

■ハイブリッドOCR適用による認識精度向上
ハイブリッドOCRの2つの認識結果を比較し、整合性が高い方を採用するなどし、単独よりも高精度、かつ安定した認識精度を達成しました。
また、さらに使用(出現)頻度が低い文字への対応などをした結果、性能評価したところ、認識率が非常に高い結果となりました。

概要

従来型OCRの課題

従来型OCRでは、多様な入力画像に対して、人が設計する。

 

従来型OCRの課題:
多様な入力画像に対して、人が設計するのが困難になってきている

 

従来型OCRの課題

AI-OCRの課題1 大量の学習データ

人が設計した処理(従来型OCR)をAIに学習させることで、人が設計する部分が大幅に減るが、学習データのバリエーションが大量に必要となった。


■ AI-OCRの学習データ
学習に以下の組み合わせを満たす大量のデータが必要となった。

■ 合成画像例
AIに学習させるため、歪ませたり等の変形パターン作成し、大量の学習データを作成。

AI-OCRの課題1 大量の学習データ

AI-OCRの課題解決策となる『ハイブリッドOCR』

AI-OCRの導入で低品質画像に対する認識精度が大幅に向上!
しかし、課題も・・・

 

AI-OCRの課題1:
認識結果が出力されない、全く異なる文字列が出力される等、不安定さが見られる

 

AI-OCRの課題解決策となる『ハイブリッドOCR』

AI-OCRの課題2 使用(出現)頻度が低い文字への対応

AI-OCRには、さらなる、課題も・・・

 

AI-OCRの課題2:
AI-OCRでは文字列単位(項目単位)で学習しているため、出現頻度が低い文字が軒並み出現頻度が高い文字に置換されることがあり、出現頻度が低い文字が多く使われる地域などでは問題となった

 

AI-OCRの課題2 使用(出現)頻度が低い文字への対応

お問い合わせ先

株式会社NTTデータNJK メディアドライブ事業部 営業部
お問い合わせはこちら

 

 

※記載されている社名、サービス/製品名などは、当社および各社の登録商標または商標です。

 


Profile

「メディアドライブ」ブランドで、OCR(文字認識)技術を中心に、パッケージソフト(OCR / PDF編集 / BIツール / 名刺管理)をはじめ、 OCR、文書分類、画像補正のライブラリ、クラウド型サービス(名刺管理 / AI-OCR / IVR)など、さまざまなソリューションを提供しています。
文字認識技術・音声/画像認識技術・人工知能(AI)技術をベースに、それらを組み合わせた業務システムの構築にも対応しています。


CONTACT
お問い合わせ
製品やサービスなど、
こちらよりお気軽にお問い合わせいただけます。