OCR

OCRとは、「Optical Character Recognition/Reader(光学的文字認識)」の略です。
紙の文書画像ファイルに含まれる文字を、コンピュータが読み取って編集可能なテキストデータに変換する技術のことです。

ポイント

  • 目的: スキャンした書類や写真に写っている文字情報を、手入力することなくテキストデータとして活用できるようにします(例: 検索、編集、コピー&ペースト)。
  • 仕組み: 画像内の文字パターンを認識し、対応する文字コードに変換します。
  • 用途: 書類の電子化、名刺管理、書籍のスキャン、画像からのテキスト抽出など、幅広い分野で利用されています。