ダークデータとは
企業に蓄積されたビッグデータのうち、有効利用されずに保存されているデータのことを指す。ビッグデータの一種で、分析不可能で価値が不明なデータのこと。ビッグデータには明確な定義はないが、膨大かつ多種で、リアルタイムに蓄積されるデータを指すことが多い。ダークデータはビッグデータのうち半数以上を占めている。
ビッグデータは3種類に分類され、ダークデータ以外に「ROTデータ」「クリーンデータ」がある。ROTデータは、古い、もしくは重複していてビジネス上無価値なデータを指し、クリーンデータのみがビジネスにおいて有用な情報であるとされている。ダークデータは、価値があるかもしれないにもかかわらず、これまでのシステムでは分析できなかった多言語で記載された文章、画像、動画、音声などが該当する。分析できないため「光の当たらないデータ」として放置されてきた。
ダークデータを経営資源として活用するためのカギを握っているのが、多種類の非構造化データを正確に認知分析できる「コグニティブ・コンピューティング」だ。分析が難しかったデータから因果関係や傾向を導き出し、有益なデータに変換することができる。