DX GLOSSARY DX用語集

デジタルやAI、ロボットに関する技術用語集

AI OCR

Ⅰ.OCRとは

OCR(Optical Character Recognition/Reader)とは、画像データ内のテキスト部分を認識し、文字データに変換する光学的文字認識技術のことです。紙に印刷された文字や手書きの文字を、カメラやスキャナなどの光学的手段で読み込み、デジタルデータとして認識することができます。

OCRは、1951年に暗号解析の専門家David Hammond Shepard氏が開発したシステム「GISMO」がきっかけで世界中に広く知られることになりました。当時開発されたのは英語圏だったため、数字とアルファベットの合計36個の形が識別されれば利用できたのですが、日本語は常用漢字だけでも2136字、それ以外も含めると5000万字ほどあるためOCR技術をそのまま利用することが非常に難しく、その難易度が普及の妨げになっていました。しかし、ここ数年の間にOCR技術を利用した処理が可能なパソコンとアルゴリズムの性能が格段に上がったため、日本でも広く活用され始めている技術と言えます。

OCRはデータ入力や文書管理などの場面で広く利用されています。例えば手作業でデータを入力する場合、時間の経過に伴って生産性・入力精度は低下しますが、OCRを使えば生産性や入力精度は一定を保ち続けることができます。もちろん低下することはありません。また、社内の画像情報をテキストデータ化することにより、メモリ上の保管スペースを約700分の1にすることもできるため、より省スペースでの文書管理も可能となります。さらに、データ入力や文書管理に限らず、これをデータベース化すれば検索するなどの「データの再利用」も可能です。

Ⅱ.AI OCRとは

AI OCRは、OCRにAI(人工知能)を加えて、印字されている文字や手書きの文字を高精度で認識し、文字データに変換する技術のことです。深層学習という手法を用いているため、規則性や関連性をAIそのものに学習させて判断や予測を行うことができます。前後の文字や文脈からもある程度予測できることから、ひらがなの「り」なのかカタカナの「リ」なのか等の識別も可能です。従来型のOCRは、あらかじめ決まられたアルゴリズムを基に文字を認識していましたが、AI OCRでは手書きなどのパターン分けのしにくいものでも高精度で識別が可能な技術であることから現在注目されています。

Googleを利用されている方は、Google が提供するオンラインストレージサービス「Googleドライブ」でOCR機能を無料で試す事ができます。Googleドライブにアクセスし、アップロードしたファイルを[アプリで開く]-[Google ドキュメント]を開くと、以下のように自動で出力されます。

AI OCR

▼レポート無料ダウンロード お申し込みはこちら▼

営業&設計部門の生産性向上最新事例解説レポート

今すぐダウンロードする
用語集一覧