データサイエンティストになるために必要なことって?

データサイエンティストになるために必要なことって?

2016.02.10

今、注目の職種であるデータサイエンティストになるためにはどんなスキルが必要なのでしょう?

データサイエンティストとは

2012年のHarvard Business Review の記事 「The sexiest job of the 21st century」
にて掲載されて以来、データサイエンティストという職業が脚光を浴びるようになりました。

前時代的な勘と経験と度胸(KKD)による経営ではなく、日々蓄積されるビッグデータをいかに利活用して競争優位性を築こうとしている企業や組織も増加しつつあります。この意味でITのみならず、あらゆる業界でデータ利活用人材の育成が求められています。このデータの利活用には、ビジネス問題の特定、データの収集と加工、データの分析、分析結果の解釈、経営陣などのスポンサーへのプレゼンテーションという工程があります。

この工程では分析チームを構成して対応することになりますが、このチームの中心的な人物が「データサイエンティスト」です。

データ分析の組織

では、データサイエンティストを中心としたデータ分析チームにはどのような人材が存在するのでしょう?ざっとこんな感じで挙げてみます。

  1. R、SAS、SPSSなど統計分析用のツールを操作する人
  2. SQLを使ってデータを操作する人
  3. Java、Pysonなどでアプリケーションを開発する人
  4. BIツールを駆使する人
  5. Hadoopなどの分散環境で大量のデータを処理する人
  6. セキュアなシステムを構築、運用、保守する人

などなど(他にもたくさん考えられます)
もちろん、複数の役割を掛け持ちすることもありますが、基本的にこれらを1人のデータサイエンティストで賄うのは不可能に近いです。従って、チームの各メンバーがそれぞれの得意分野を活かすことになります。また、データサイエンティストには「チームのまとめ役」というリーダーシップも要求されるのです。

データサイエンティストに必要なスキル

では、データサイエンティストに必要なスキルとは何でしょう?
また、どの位のレベルにまで達すれば「データサイエンティスト」と呼ぶことができるのでしょうか?

実は、この辺の基準がまだ、曖昧なまま「データサイエンティスト」という職種だけが注目されていたのです。 私が参加しているデータサイエンティスト協会ではこのデータサイエンティストのスキル定義を去年度行いました。リンクはその関連記事です。
http://news.mynavi.jp/news/2014/12/15/129/

これによると、データサイエンティストの主要なスキルには「サイエンス力」、「エンジニアリング力」、「ビジネス力」などがあります。

サイエンス力は統計や機械学習などの数理的スキルです。今は分析ソフトウェアがあるのでデータをソフトウェアに渡せば結果をすぐに出すことができます。ただ、そもそもどのような分析をすればよいのか、または、そのデータが分析できるデータかどうかを判断するにはやはり数理的スキルが必要不可欠です。

エンジニアリング力はデータベース、プログラミング、セキュリティなどを駆使してシステムを実装するスキルです。大量のデータを処理するHadoopやNoSQLなどの技術も必要です。サイエンス力で理論だけを知っていても、データを分析する仕組みを実装するには様々なICTのスキルが要求されます。

ビジネス力は、ビジネスの問題を理解し分析につないだり、分析結果からビジネス的な意味を読み取り経営陣などに提案したりするスキルです。これらに必要なのは、まずその分野の業務知識です。金融や医療などの知識が無ければこれらのビジネス的な問題を理解するのは困難です。

他にもビジネス力としては、「データを思い込みではなく客観的に読み解く力」「他分野の専門家とコミュニケーションをとる力」「分析結果をもとに経営陣に提案できる力」など多岐に渡ります。

これら3つのスキルをすべて持っている人はそうそういませんので、通常は一人ではなく数人のグループで分析プロジェクトを進めて行きます。また、これらのスキルはいろいろなところで「データサイエンティストに必要なスキル」として考えられてきました。

データサイエンティスト協会では更にデータサイエンティストに関わるレベルを「一般人レベル」「見習いレベル」「1人立ちレベル」「棟梁レベル」に分けてこれらのレベルと3つのスキルのマトリックスを定義しました。

今年度はこのマトリックスから更に自分がどのレベルなのかを測ることができるスキルチェックシートを作成しました。先般のデータサイエンティスト協会のシンポジウムで当スキルチェックシートが発表されました。

データサイエンティストは本当にこれから不足するのか

2011年のマッキンゼー調査結果によると2018年までにアメリカでは約18万人のデータサイエンティストが不足すると言われています。もちろん、世界規模でもデータサイエンティストは今後不足することが予測されます。

一方、今後コンピュータの性能向上や機械学習や人工知能の進化に伴い、データ分析も自動化され、データサイエンティストが不要になるという考え方もあります。ただ、ここではっきり決めておかなければならないのは一体どこまでがデータサイエンティストの守備範囲なのかということです。確かに分析だけを行うのがデータサイエンティストであるならば、このような人材は今後不要になることも考えられます。

しかし、先にも述べたとおりデータサイエンティストの業務がビジネス問題の発見からデータ収集や分析、経営陣への提案など広範囲に渡ることと、IOTなどにより今後増加し続けるデータをどのように利活用しビジネスに役立てるかを考えるとやはりデータサイエンティストやデータを利活用する人材は今後ますます必要になることが考えられます。

以上より、データサイエンティストのみならずデータ利活用人材が今後も不足することが予測できます。日本サード・パーティの教育プログラムもビッグデータ関連トレーニングのラインナップを今後増やしていきます。

記事は、予告なく変更または削除される場合があります。
記載された情報は、執筆・公開された時点のものであり、予告なく変更されている場合があります。
また、社名、製品名、サービス名などは、各社の商標または登録商標の場合があります。