データレイクとは
多種多様なデータを本来のフォーマットのまま保管する広大な領域のこと。ログファイルや画像ファイル、音声ファイルなど特定の構造を持たないデータを「非構造化データ」といい、リレーショナルデータベースのようにデータの属性を構造的に管理するデータを「構造化データ」と呼ぶ。
従来は、分析の目的に合わせて膨大なデータから必要なものを絞り込み、表計算やデータベースの形式で保存していた。しかし、分析してから保存していては時間もコストもかかる上、データを絞り込んで保存すると、分析する対象が変わったときにデータ不足でニーズに応えられない事態も起こりうる。データレイクは、あらゆるデータを最初から収集しておくため、効率良く幅広い分析ニーズに応えられる。
センサーのログ、GPS(全地球測位システム)、ソーシャルメディア、画像・映像、音声などの非構造化データの管理・分析に適し、IoT(モノのインターネット)のニーズが高い製造業で注目を集め、導入が進んでいる。
この記事を社内で共有し、課題解決のヒントにお役立てください
お客様マイページの「連絡ボード」機能を使って、同じ会社のメンバーと簡単にこのページを共有できます。社内で情報を共有し、組織全体の課題解決や業務効率の向上にお役立てください。
社内のメンバーに共有する(企業で共有する)
- (注)連絡ボードを利用するには企業設定が必要です。