auの日記

プログラミング初心者の日記。(auはハンドルネームです)

AI OCRについて調べてみた

auです。

AI OCRについて調べてみました。

AI OCRとは

AI OCRとは、一言で言うとOCRにAIがくっついたものです。

OCRは、Optical Character Readerの略称で、手書きの書類・帳票といった媒体を読み取り、書かれている文字を認識してデータ化することです。

人間は書類を見て項目や数字の意味について理解できますが、そのまま読み込ませただけだとコンピュータは何なのかさっぱり分からないです。赤ちゃんみたいですね。

このAI OCRは、人間が行っているところのデータ入力の箇所を行います。

書類を見て人間がExcelに打ち込むと言ったバイトや仕事があると思います。この部分をAIにやらせるもののようですね。

AI OCROCRの違い

OCRは、決められた枠の中でしか識別ができなく、0のような6と言った文字の認識も曖昧なものがありました。

そこで出てくるのが、AIの機械学習ディープラーニングです。これは、機械に文字の形を学習させて、正解の文字の精度をあげることにつながっています。

また、AIを使うことで、何についての問いなのか分かるようになるようです。このおかげで、機械に対して「ここの項目は名前だよ」と言う風に教えてあげなくてすみます。

f:id:program-shoshinsya:20200713224130p:plain

それでもやはり、AIを使っても全てを自動化すると言うことができなかったり、思い通りの精度にならないと言うこともあるようです。

それでも、そのうち紙の読み取りだけなら人間と同じ精度になってもおかしくないなとも思います。