Hadoopとは
巨大データの取り扱いを目的とした分散処理のフレームワークのこと。大規模なデータ(ビックデータ)を効率的に処理し、管理する目的で開発・利用されており、誰でも無料で自由に利用することができる。
もともとはオープンソースのソフトウェアプロジェクトを支援するApacheソフトウェア財団のプロジェクトの1つだったが、Hortonworks、米国Yahoo!、Clouderaといった初期から参加していた企業に加え、Intel、マイクロソフトなど多くの企業のメンバーによって開発が続けられている。
ビッグデータを分析する基盤を構築するには、コストがかかるデータウェアハウスなどを用意する必要があったため、導入を踏み切れずにいた企業も多かった。ところが、HadoopをベースとしたAmazon Elastic Mapreduceなどのビッグデータ分析エンジンが普及するようになると、楽天、リクルート、サイバーエージェント、クックパッドなど多くの企業が導入している。ビックデータを分析して得られる情報をもとに、マーケティングや新たなビジネスを創出しようという「ICT活用」が新たな潮流となっているだけに、今後もこの傾向は強まるだろう。