データをビジネスで活用するために、どのような人材と育成が必要になるか紹介します

あらゆるデバイスやセンサーがインターネットに繋がり、リアルタイムにデータを取得する「IoT(Internet of Things)」の時代が到来しています。これら膨大なデータを、ビッグデータとして収集・蓄積・分析することで得られる新しい知見から、問題解決やイノベーションを推進し、企業の競争力を強化する取り組みが本格化しています。
今回のビッグデータ特集では、企業向けにHadoopディストリビューションを提供するMapR社、日本サード・パーティ(JTP)でビッグデータ関連の技術トレーニングを担当する講師のインタビューを通して、ビッグデータを活用するために必要な人材と、その育成について紹介します。

特殊:データ活用を推進するデータサイエンティストの育成

「攻めのIT」としてのビッグデータの活用

ビッグデータの活用が求められる背景として、企業のIT部門に求められる役割が変わってきたということがあります。従来のIT部門の業務は、社内に対する価値の提供を目的とした、システムの導入や運用が中心でした。しかし、グローバル化とともに、先行き不透明かつ不確実な時代が到来し、多くの企業は厳しい経営環境に直面しており、IT部門は、より外向けのビジネスへの貢献が求められるようになりました。いわゆる「攻めのIT」です。

ビッグデータの活用は、従来のシステム導入や運用とは異なり、活用することで、新しい価値を生み出し続ける必要があります。そのため、ITエンジニアに求められるスキルセットや人材育成のアプローチも変わりつつあります。 そして今、企業において、ビッグデータ活用の中心となる「データサイエンティスト」というロールが注目されるようになりました。一般社団法人データサイエンティスト協会とそのスキル委員会は、「データサイエンスティスト」に求められるスキルの定義を行い、主要なスキルを、「サイエンス力」、「エンジニアリング力」、「ビジネス力」の3つに分類しています。

データサイエンティストに求められるスキルセット

為田 光昭
常務取締役
新規事業開発本部長
日本サード・パーティ株式会社

ビッグデータ時代のIT部門の仕事は、継続的な価値の創出、他社との差別化、迅速な意思決定などの観点から、今までのようなアウトソースが難しいと言われています。そのため、人材育成を通した部門強化が、これまで以上に重要になります。

JTPでは、IT部門で実務を積んだITエンジニアが、効率的かつ体系的にビッグデータ関連のスキルを習得し、企業においてデータ活用の中心人物として活躍できるよう、トレーニングを幅広く提供しています。弊社のトレーニングメニューは、データサイエンティスト協会が定義する主要スキルのうち「サイエンス力」および「エンジニアリング力」を網羅しています。

私たちJTPは、IT教育の分野から、日本企業の成長、ひいては、日本経済の発展に貢献したいと考えており、今後も、技術動向の変化に合わせて、継続的にトレーニングメニューを拡充していきます。

データ活用に対する企業の取り組みと人材育成の最新動向

続いて、ビッグデータ活用に対する企業の取り組みや、データサイエンティスト育成の最新動向について、企業向けにHadoopディストリビューションを提供するマップアール・テクノロジーズ株式会社のアライアンス&プロダクトマーケティング ディレクター 三原 茂 氏、データエンジニア マット・ドモリン 氏にお話を伺いました。

まだ活用していない企業が、どのようにして、始めるか?

三原氏: ビッグデータの活用について、日本企業が、海外に比べ、特別、遅れている訳ではありません。すでに活用している企業と、まだ活用していない企業があるという点で、日本も海外も同じです。重要なことは、まだ活用していない企業が、どのようにして、始めるかです。
ビッグデータの活用を始める場合、ビジネス部門とIT部門がチームで、データを使って何ができるか、仮説・検証を繰り返しながら、ユースケースやシナリオを創り、実際のビジネスに組み込んでいくアプローチが必要です。

ビッグデータの活用はビジネスニーズと密接に関係するため、社外に頼らず、なるべく社内で人材を育成し、体制を整えたいと思う企業も多いようです。一方で今直ぐ始めたいがエキスパートがいないという企業にはアウトソースのニーズも根強く、アウトソースを受ける企業もデータサイエンティストという新分野の人材育成のニーズが強まっているように感じます。

日本企業の場合、新しいチャレンジに対して保守的であることも多く、ビッグデータの活用を阻むハードルのひとつになっています。今後、日本企業が、当たり前のようにデータを駆使する海外勢とグローバルな市場で戦うためには、古い意識を捨て、新しいことに、チャレンジしやすい組織に変わる必要があります。

三原 茂

三原 茂 氏
ディレクター
アライアンス&プロダクトマーケティング
マップアール・テクノロジーズ株式会社

マット・ドモリン

マット・ドモリン 氏
データエンジニア
マップアール・テクノロジーズ株式会社

データサイエンティストはスペシャリストかつジェネラリスト

ドモリン 氏: データサイエンティストは、スペシャリストとジェネラリストの両方を持ち合わせた存在です。ITだけでなく、数学や統計の知識、ビジネスに対する理解、そして高いコミュニケーション力が求められます。ビッグデータを活用し、ビジネスに組み込むためには、社内の事業部門との調整や、経営層に対する説明が必要になるからです。

データサイエンティストの育成やキャリアパスについては、社内のITエンジニアからのステップアップが現実的です。ビジネスに対する理解は、個人的な興味・関心からはじめることができます。インフラやプログラミングの経験も必要ですので、企業のIT部門で実務を積んだITエンジニアが、データ活用に必要なスキルを習得することが、一番の近道です。

一方、ビジネス部門のスタッフが、データ活用についてリードする立場になることは大いにありますので、ビッグデータの技術知識を学ぶことも重要です。彼らが、ITエンジニアと、技術の話題を交えて対等にコミュニケーションできると、プロジェクトや社内調整を円滑に進めることができます。

マップアール・テクノロジーズ株式会社

マップアール・テクノロジーズ株式会社について

https://www.mapr.com/jp
MapR 社は、エンタープライズでのデータ活用を目的として設計された独自のファイルシステム上にバッチからリアルタイムまで対応できるHadoopやNoSQL、イベントストリーミングの機能を提供しています。MapRコンバージド・データ・プラットフォームは、ミッションクリティカルかつリアルタイムなビッグデータアプリケーションとして利用が可能です。MapR は米国カリフォルニア州に本社を置き、東京都千代田区に日本法人を構えています。

ビッグデータを活用するために必要なスキルを効率的かつ体系的に学ぶ

ここでは、JTPの講師3名から、ビッグデータ関連の技術トレーニングの概要や特長、実際の学び方について紹介します。

JTPでは、効率的かつ体系的に習得できるよう、ビッグデータ関連のトレーニングを、次の3つに分類しています。

  • データを集める
  • データを加工・整理する
  • データから知識を得る

データサイエンティスト協会が定めるデータサイエンティストに必要なスキルセットから考えると次のようになります

  • データを集める/データを加工・整理する データエンジニア力
  • データから知識を得る データサイエンス力

講師の紹介

関口 大五郎

関口 大五郎
教育ソリューション事業部
教育ソリューション部
エンタープライズ教育
日本サード・パーティ株式会社

講師歴19年。ビッグデータ、データサイエンス、業務アプリケーションなどのトレーニングを担当。数学科出身。一般社団法人データサイエンティスト協会のスキル委員。

西口 晃司

西口 晃司
新規事業開発本部
クラウド・ビッグデータソリューション
プロジェクトマネージャ
日本サード・パーティ株式会社

サポートエンジニア出身。お客様の傾向分析のためデータ分析を学び、現在はJTP社内のビッグデータビジネスのプロジェクトマネジメント及びHadoop関連の講師を務める。

廣畑 義弘

廣畑 義弘
教育ソリューション事業部
教育ソリューション部
オープンソース教育
日本サード・パーティ株式会社

国内メーカー系SIer、外資系コンピュータメーカーなどを経て2015年 JTP入社。主に Hadoop関連のトレーニングのほかDB周りや、Rに関するトレーニングを担当。

まずは「データを集める」ところからはじめよう

関口:今は、データの量と種類が増えていることに合わせて、それらをリアルタイムに処理しなければならないというニーズがあり、そのために、どのテクノロジーを利用するか問われるようになります。ビッグデータでは、「データを集めて、貯める」と、分析できるように「データを加工・整理する」ところに、様々な解決策があるため、何を選択するかが重要です。その後は、アルゴリズムがあるので、分析は、それほど難しくはありません。

西口:データを集めて、貯めるための選択肢としては、Hadoop、NoSQL、インメモリーデータベースなどの選択肢があります。Hadoopのコースでは、SIerに所属するITエンジニアが、導入や構築を学ぶケースが多く、Hadoopは、すでに顧客向けに提案する上で習得しておくべき必須のスキルとなっているようです。

関口:受講される方は、顧客や社内から「データがたくさんあるので、どのように利活用すべきか?」相談を受けており、統計的な手法で、データをビジネスに活かしたいと考えられています。

廣畑:Hadoopのコースは、SIerだけでなく、ユーザ企業のIT部門で、システムを構築されている方の受講も多いと感じています。ただ、受講される方は、Hadoopを学ぶことが目的ではなく、あくまでも、問題解決のための選択肢のひとつであり、覚えておくべきツールの中のひとつとして捉えているような印象です。

西口:最近は、コンサルティングファームに所属する技術系の方が、Hadoopのコースを受講されるケースも増えていますので、その先のユーザ企業でも、データ活用の機運が、本格的に高まっているのではないでしょうか。

関口大五郎 西口晃司 廣畑義弘

データの加工・整理、そして分析を学ぶ

関口:データを集めて貯めるための基盤構築は、IT部門の守備範囲になりますが、どのデータを貯めるかを決めるのは、ビジネス部門です。そして、データを集めて、加工・整理して分析するまでは、IT部門が担当しますが、分析結果を実際のビジネスに落とし込む際に、ビジネス部門に戻ります。そのため、ITエンジニアには、ビジネスニーズを理解して、ビジネス部門と円滑にコミュケーションできる力が求められます。

廣畑:また、Hadoop自体は、単にデータを貯めるだけのものですので、実際に、貯まったデータを加工・整理し、分析するところを知りたいという方も多くいらっしゃいます。現在、この工程の処理を行う様々な製品やソリューションがリリースされており、Hadoopのエコシステムと呼ばれています。何を利用するかは、データの種類、ビジネス課題、分析手法などに依存しますが、トレーニングを利用して、効率的に技術を習得されるのがいいと思います。

関口:データ分析では、R言語を使った統計解析や、機械学習による問題解決などを習得します。統計解析は、商用のツールも充実していますが、R言語は、オープンソースであり、誰でもすぐに利用することができるため、現在、主流のツールだと考えてもいいでしょう。機械学習による問題解決は、人工知能も含め、今後、利用範囲が本格的に拡がると思います。

西口:ビジネス部門の方も、これら技術やツールについて幅広く学ぶことは無駄ではありません。技術やツールについて知識があると、データ収集基盤の構築やデータ分析業務を、IT部門やSlerに依頼する際に、RFP作成やプロジェクトのマネジメントがスムーズになるからです。

関口:データ活用では、技術面だけでなく、最終的には「社内の反対勢力をいかに説得するか?」ということが、いつも課題になります。データドリブンで意思決定を行うことは、今までの勘と経験による経営と大きく異なるからです。特に、データ活用は、従来のBIツールとも異なり、「過去どうだったか?」ではなく、「この先どうなるか?」を予測分析するものなので、「従来の方法でいいのでは?」という社内の反対勢力を説得していくコミュニケーション力が重要になります。

JTPでは、ビッグデータに関する様々なトレーニングを実施しています。受講者のスキルレベルや目的に応じて効率的かつ体系的に学べるトレーニングを数多くご提供しております。ビッグデータ関連トレーニングの詳細はこちらから。


講師によるビッグデータ関連のコラム

JTPのIT教育Webサイトでは、講師やエンジニアによる、ビッグデータに関連する技術コラムを提供しています。ビッグデータ関連の最新技術から、コア技術の掘り下げまで、幅広い内容でお届けしています。

JTPのIT教育

IT教育のサービス詳細や、提供中のトレーニングコース、実務経験豊富な講師陣によるコラムなどは、IT教育のWebサイトを御覧ください。

IT教育の詳細