ビッグデータを、バズワードから自分の身近に

ビッグデータを、バズワードから自分の身近に

2015.09.16

普段数値を見ること、何かのグラフを見ることってどれくらいありますか?IT業界からバズワード的に飛び出した「ビッグデータ」。皆さんは普段データとどのように向き合っていますか?

ビッグデータの活用って?

みなさんは普段の業務や日常で、表やグラフを作成することってどのくらいありますか。
Microsoft Excelなどの表計算ソフト使っていますか。BIツールを使っていますか。
集計したデータから、次の一手を考えたり、業務や結果を振返ったりすることはどのくらいありますか。

IoT (Internet of Things:一意に識別可能な「もの」がインターネット/クラウドに接続され、情報交換することにより相互に制御する仕組み)やM2M (Machine to Machine:ヒトを介さず機械同士がコンピュータネットワークで情報交換および制御を行う)といった話題もありますが、当初はバズワード的にIT業界で話題に上がっていた「ビッグデータ」という言葉。それがここ1、2年では、コマーシャルや夕方のニュースや特集といった日常の中でも「ビッグデータを活用した~」という言葉をよく目や耳にするようになりました。

  • 東日本大震災のときの車の走行データから通行できる道路を導き出す
  • スーパーのポイントカードとPOSデータを活用した顧客分析
  • ECサイトでのレコメンド機能

などなど、ビッグデータの活用事例は分野も多岐にわたって紹介されています。
また、ビッグデータに関する冊子や本も多く出版されていますね。どの本を選んで読み始めればいいのか分からないくらいに・・・。

ビッグデータを使って予測する

私がビッグデータという言葉にちゃんと向き合った(バズワード的に受け取る、ではなくどのようなものか調べ始めた)のは数年前の話ですが、そのときまず思い出したのは学生時代のアルバイトでした。

学生時代はIT業界とはまったくかけ離れた場所にいた私。
(パソコンくらいは使っていましたが。いちユーザですね)
当時はSNSもまだmixiとかが流行り始めたくらいで、携帯もガラケー。タブレットもなければ、クラウド、ビッグデータといった言葉も耳にすることはありませんでした。

そんな当時、私のアルバイト先は某コンビニエンスストアでした。人生初のアルバイトで、商品を並べてレジ打ちしてってくらいのイメージでぱっと始めました。短期でも受け入れてくれる、早朝対応だったから田舎の割には時給も良いといった安易な気持ちから始めたんですね。

もちろん、想像していた通りの業務もして、(自分の家の掃除を毎日なんてしないのに)フロアやお手洗いの掃除も毎回やって、と業務を行っていたのですが・・・そこでもうひとつ、任されたのはお弁当類の発注でした。

天気予報の予測と、過去の実績を元に、予測して発注をする。そんなことを毎日くり返していると、自分が仕入れの数を決めた商品がちゃんと良い感じに売れているか、そわそわしたものです。天気予報が外れて雨が降るとお客様が全然来なかったり、仕入れ数が少なすぎてあっという間に品切れになってしまったり、余り過ぎてしまったり・・・。

当時はそこから「もっと精度が上がるようなデータを」とか、考えたわけではなかったのですが、「データを元に判断する」っていうことを実践していた最初のベースがこのアルバイトだった気がします。

いちユーザだった私にとって、裏でどれくらいのサーバが稼動していて、どれくらいの処理が動いていて、どれくらいの量のデータがあって、なんて当時は想像もしませんでした。でも、今考えると、当時やっていたことは最近「ビッグデータ活用」といわれていることの先駆けだったのでしょう。

使えるデータと、使えないデータ

当時よりもデータ量が多くなり、当時よりもデータ処理速度があがり、当時よりも多様なデータを扱えるようになった今日。

いま世の中の大半のデータが、ここ数年で生成されたものだと言われています。
構造化データよりも圧倒的に非構造化データのほうが多いと言われています。
ハードウェアが安価になり、クラウドもあるなか、データを蓄積しやすくなったと言われています。
KKD (勘・経験・度胸)ではなく新KKD (仮説・検証・データ分析)と言われています。

ただ、それでも、なんだかどことなーくビッグデータは「顧客情報を沢山持っている企業のもの」「大企業が得意なところ」といった印象が抜けきらない気がします。
でも考えてみると、世の中大きな視点からは「ビッグデータ」と言われているものも、実は自分の小さな行動から始まっています。

今までただ走っていたランニングも、アプリを使って距離、時間を計り蓄積。
(あ、またしばらく走れてない・・・

家計簿アプリを使って日々のレシートをパシャリ。データを貯めてすぐグラフ化。
(あ、今月使いすぎ・・・

そんなことをやっていると、段々「データ」に対する視点が生まれてきます。「データ」に対する疑問が沸いてきます。日常気にしていると、業務でもあれやこれやと気になります。

もっと研修受講者のアンケートを活用できないかな。
なんでこのデータが出てきたんだろう。原因は何だろう。
何かここで特別なことあったかな。

そんなことを考えていると、分析に十分なデータが上手く揃っていないことに気づくことが多いです。データ分析をする前提で設計されたものならいいのですが、全部が全部そう上手く揃っているわけでなくて、少しずつてこ入れしながら進めて行くしかないことに気づきます。

そんな「ビッグデータ分析」を支えるテクノロジーたち

データをもう少し上手く整理できないかなと思いデータベースを調べだし、もっと早く処理できないかなと思い、HadoopとかCEP (Complex Event Processing:複合イベント処理)の技術ってどんなんだとか調べだし。
簡単に可視化できないかなと思いBIツールを調べだし・・・。
そんなところから、「ビッグデータに関連する技術」に段々触れていくことになります。特にBIツールはお試し版で試したり、デモを見たり、教えてもらう機会にも恵まれたりと、QlikView、Tableau、PowerBI、Dr.SUM EA、TIBCO Spotfireなどなどみてきました。以下のような比較サイトも出ていますね。

新世代BIツール3製品徹底研究

どのツールにも優れた機能があって、迷ったりすることも多いですが、まずは何を知りたいのか、どうデータを活用していきたいのかが大事だと思います。

昔、アルバイトのときはデータがもう揃っていて、与えられた環境でどうそのデータを見て判断するか、でした。
今は、何を知りたいのか、そのためにどんなデータがあったらいいのか、から始まります。

私は「ビッグデータ」というキーワードを元に関連技術や活用事例を見るようになって、「データをみる」癖が強くなりました。皆さんも、身近なデータの活用からはじめませんか。

記事は、予告なく変更または削除される場合があります。
記載された情報は、執筆・公開された時点のものであり、予告なく変更されている場合があります。
また、社名、製品名、サービス名などは、各社の商標または登録商標の場合があります。