EduLab、ディープラーニングに基づく手書き文字認識技術の開発プロジェクトを推進、認識率98.66%を実現

Edtech関連の事業を展開する株式会社EduLabは、ディープラーニングに基づく手書き文字(日本語)認識技術の開発プロジェクトを2015 年より進め、手書き文字(日本語)認識率において、2016年6月時点で業界トップレベルの認識率98.66%を実現したことを発表しました。

EduLab グループはこの手書き文字の認識技術を、主に手書き答案採点等のテスト分野に応用していく予定。

今回は上記プロジェクトを担当する株式会社EduLabの松本健成氏にお話を伺いました。

ディープラーニングに基づく手書き文字(日本語)認識技術開発の背景

DSC05331

株式会社EduLab 松本健成氏

 

中央教育審議会による答申「新しい時代にふさわしい高大接続の実現に向けた高等学校教育、大学教育、大学入学者選抜の一体的改革について」(2014 年12 月)では、現在の大学入試センター試験が、「知識・技能」を問う問題が中心になっているとした上で、今後は「知識・技能」と「思考力・判断力・表現力」を総合的に評価するものにしていくことが必要であると書かれています。そのため、大学入試においても課題解決力を重視する傾向にあります。

このような背景の中、入学試験・国や地方自治体の学力調査・各種検定試験等において記述式の解答方式が加速的に増えています。しかし、記述式の解答方式では、採点者の判断を要するため採点に時間がかかりすぎ、採点費用の増大がテスト実施主体の大きな負担となっています。

 

Edulabの松本氏も以下のように語っています。

「現在も、100万人規模で実施するテストの記述式問題は、数千人の人力で採点を行っています。人力での採点では時間もコストもテスト運営者の大きな負担です。採点を人力で行うことには限界があります。」

EduLab グループは、以前から100 万人規模の学力調査の採点業務を多数受託してきた実績があります。記述式解答の採点方法をより標準化し、より効率的な方法で採点を行うことを常に検討してきました。 初期の検討は、手書き文字をテキストデータ化した上で採点することでした。

記述式解答のような、大量の手書き文字をテキストデータ化する方法として、以下の方法を検討しましたが、コストの面や、精度の面で実用に耐えるのは難しいと判断しました。

  • パンチャーという人の手を使ったデータ入力作業
  • OCR(Optical character recognition:光学文字認識)技術

 

「人力でのテキスト化は時間やコストの面で難しいです。OCR技術でも高い精度を出すのは難しい。そこで注目したのがディープラーニングを用いた文字認識技術です。

ディープラーニングに精通した専門会社と協力して、EduLab グループが持っている豊富なフィールドデータを活用した日本語の手書き文字認識技術の開発プロジェクトを立ち上げました。結果としてかなりの精度にすることができたので、この度プレスリリースをいたしました。」

DSC05322

EduLab グループは、今回、第1段階の開発において手書き文字(日本語)認識率98.66%の実現により、1 設問あたり最大83%の採点工数カット(*EduLab グループ算出比)を実現しました。

「現在でもかなりの精度であることは間違いありませんが、実用する上での間違いは許されません。要求水準も高いですが、実用に耐えるまで精度を高めて、今後の大学入試改革や大規模に展開する記述式テストに貢献できれば嬉しいですね。」

今後記述式問題が増える中で、いかにスピーディに精度高く採点を行うかという課題をEduLabが開発した技術が解決するかもしれません。

 

DSC05331

ABOUTこの記事をかいた人

EdTech(教育×テクノロジー)をテーマにした「EdTech Media」、教育業界に特化した求人サービス「Education Career」を運営する、株式会社ファンオブライフ代表取締役。 EdTechのムーブメントを、情報と人材の面から支援している。