EduLab、ディープラーニングに基づく人工知能を活用し、手書きの複数文字(日本語)認識率93.5%を実現

Edtech事業を展開する株式会社EduLabは、ディープラーニングに基づく手書き文字(日本語)認識技術の開発プロジェクトを2015年より進め、手書き文字(日本語)認識率において、2016年6月時点で業界トップレベルの文字認識率98.66%を実現した。この時点で認識できた文字は、枠線内に書かれた手書きの単文字(日本語)であった。

その後、開発を進め、より実際の答案用紙に近い枠線がない住所、名前等の手書きの複数文字に対して文字認識率93.5%を実現した。(認識率は、人と読み取り結果が一致した割合。精度検証の対象としたデータは約35,000件)

単文字と複数文字の読み取りイメージ

開発の背景

日本の教育における、課題解決力を重視する傾向に伴い、入学試験、国や地方自治体の学力調査・各種検定試験等において記述式の解答方式が加速的に増えている。記述式の解答方式は人力で採点するため、採点に時間がかかり、採点費用の増大も大きな課題となる。

そのような背景から、採点効率の向上を目指し手書き文字のテキストデータ化について検討を開始したという。解答用紙に書かれた内容を人の手により入力しデータ化する作業では、これまで大幅な時間短縮が困難であった。

また、スキャナを使用して解答用紙を読み取りデータ化を行う従来のOCR(Optical character recognition:光学文字認識)技術は、入力枠という制約が生じるだけでなく認識できない割合も一定割合以上発生し、試験の採点に耐えうる品質精度の確保は難しい状況であった。

EduLabは、ディープラーニングに基づく人工知能技術(AI)を活用した高精度な手書き文字認識技術の研究・開発を開始し、2016年に手書き単文字(日本語)認識率98.66%を実現した。

複数文字認識技術の特徴

2016年時点の手書き単文字認識技術では下記の点が課題であった。

一文字の読み取りは高精度だが、部首やつくりなどのパーツが組み合わさり一つの漢字となる日本語の特性上、複数文字を読み取る(認識する)精度は低くなる。そのため、複数文字を読み取る(認識する)際に、誤った一文字に分割し読み取って(認識して)しまうという課題があった。

複数文字認識の誤認識イメージ

そこで、人間が文字を読む時と同じように複数の文字を同時に読み込み、まとめて結果を出力するという方法から検討を進め、複数文字でも正しく文字を読み取る(認識する)新たな手書き文字認識技術を開発した。新たなアプローチにより、複数文字を正しく一文字ごとに分割するプロセスを改善することができた。

現在の複数文字認識イメージ

開発にあたり、日本語の住所、名前、単語の手書き複数文字データを収集し人工知能(AI)に学習をさせた結果、住所の手書き複数文字データを読み取りにおいて93.5%の文字認識精度を達成した。(*認識率は、人と読み取り結果が一致した割合。精度検証の対象としたデータは約35,000件)

下記は手書き住所データと文字読み取り(認識)結果例である。下記の例では複数文字の住所データ全てを誤りなく読み取り(認識)できている(文字認識精度100%)。

手書き住所データと当社文字認識技術による読み取り(認識)結果

ABOUTこの記事をかいた人

教育系の研究科の大学院生です。専門は国語教育の授業開発で、魯迅の「故郷」の授業開発を研究しております。出身は北海道で、大学は京都、現在は関東に住んでいます。読書や美術館巡りが好きです。