ビッグデータは「量」よりも「バラエティ」が重要
本連載前回の記事で、ビッグデータ時代のマーケティングでは「全体」より「部分」、そして「代表性」より「詳細性」が重要になると述べました。その後、最近の米ウォールストリート・ジャーナルの記事で、同じことをデータベース・マネジメントの第一人者が主張しているのを知りましたので紹介したいと思います。
その第一人者とは、米マサチューセッツ工科大学(MIT)でコンピュータ・サイエンスと人工知能を研究するマイケル・ストーンブレーカー教授です。2014年にコンピュータの世界におけるノーベル賞といわれるACMチューリング賞を受賞している斯界の世界的権威。そんな教授が、ビッグデータで大事なのはデータの「量」ではなくデータソースの「バラエティ」だと述べています。
データウェアハウスにより多くのデータを貯め込み、統合すればいいという流れに対して、教授はそれがいかに困難かが理解されていないと批判します。これからはむしろ「データキュレーション」が大事で、データウェアハウスに納まりきれない何百万という種類のデータの「ロングテール」を管理しなくてはならない、というのです。
キュレーションやロングテールという言葉をご存知の方も多いと思いますが、簡単に説明しておきましょう。美術館で展示品を収集・鑑定・管理する職業はキュレーターと呼ばれていますが、キュレーションとはまさにそうした仕事のことです。インターネット上では、キュレーション・メディアなるものも成長しています。
一方、ロングテールとは、分布の裾(尻尾)が非常に長いことをいいます。小売業のアイテム別売り上げ分布でいえば、その大半を占めるごく少数のアイテムがある一方、売り上げが非常に小さいアイテムが無数に存在する状態がそうです(図1)。一般に、オンライン小売業はオフライン小売業に比べて、売上分布がロングテールになる傾向があります。
ビッグデータについても、情報の分布がロングテールになっているとストーンブレーカーは指摘しています。筆者はデータベースについてはまったくの門外漢ですが、彼の指摘はビッグデータの本質を捉えているように感じます。そこで、今回はロングテールという概念に注目して、ビッグデータ時代のマーケティングについて考えてみましょう。