2019年12月23日公開

IT用語辞典

OCR

制作協力:株式会社インプレス

読み方 : おーしーあーる
英語正式表記 : Optical Character Recognition

OCR

「Optical Character Recognition」の頭文字を取った略語。日本語では「光学式文字認識」という。手書きした文字や印刷された文字をスキャナーやデジタルカメラで読み取り、文字データへと変換する技術のこと。OCRの機能を備えたハードウェアやソフトウェアもOCRと呼ばれる。この場合のOCRは「Optical Character Reader」の略とされる。

文字をデータ化できるといっても、かすれた文字や、和文に混在した欧文文字、特殊文字などは正確な文字認識ができないことがある。もともとOCRは、文字を読み取る手段として利用されていたが、情報をデータ化することで、物理的な保管場所の省スペース化が図れることに加え、データ検索の迅速化、データの再利用などにも役立つ。最近では「e-文書法」や「日本版SOX法(J-SOX法)」の制定により、文書や伝票の電子化(ファイリング)が進められていることもあり、さらに普及することが予測される。