アノテーション
「注釈」を意味する「annotation」が語源。IT分野では「特定のデータに情報タグ(メタデータ)を付加する」という意味で用いられるのが一般的だが、最近ではAI分野で多用されるようになった。
AIの機械学習の代表的な方法に「教師あり学習」があるが、機械学習のモデルとしての教師データ(正解のデータやラベルなど)を作成することをアノテーションと呼ぶ。AIは、情報タグを参照しながら教師データを取り込むことで、教師データ自体からは導き出しにくい抽象的な要素を理解し、各データの特徴や傾向などを学習する。例えば、検品作業での欠陥品の発見、自動運転における人や信号などの認識、音声データからの文字起こしなど、構築したAIに適したアノテーションを付加する必要がある。
アノテーションの対象となるデータの形式は幅広く、テキストデータをはじめ、画像データ、音声データなど、あらゆる種類のデータがアノテーションとして付加される。アノテーションが行えるサービスとしては、ライオンブリッジジャパンの「Lionbridge AI」、ユニメディアの「ANNOTEQ」などがある。