資料請求 LINE相談 学校説明会
オープンキャンパス
業界コラム Column
用語解説

データサイエンティストとは?データサイエンスについても簡単に解説します!

PROFILE
新井賢一 教授(東京情報デザイン専門職大学)

担当科目
数学(確率・統計) / Pythonプログラミング / 機械学習 / ビジネスデザインⅠ / ビジネスデザインⅡ

経歴
1991年、早稲田大学理工学部物理学科卒業。1993年、同大学院理工学研究科修士課程修了。2003年、博士(理学)取得。1993年、日本電信電話株式会社に入社。その後、同社 コミュニケーション科学研究所 研究主任、同社サービスインテグレーション基盤研究所 研究主任を歴任。コミュニケーション科学基礎研究所 主任研究員を経て現在に至る。これまでに信号処理に関する研究開発などを行う。

 

TIDのオープンキャンパス・学校説明会はこちら ▶️

 

データサイエンスとは

身近な例から見るデータサイエンスの定義

データサイエンスという言葉を聞いたことがあるのではないでしょうか。最近、ネットなどで、ビジネスで活用されている例などを紹介している記事を見たことがある人も多いでしょう。何かとても難しいことのように思うかもしれません。しかし、あなたも身近なところで同じ考え方をしているのです。

例えば友人とじゃんけんをするとしましょう。これまでの経験からこの友人は最初にグーをだすことが多いなと思えば、あなたはパーをだすのではないでしょうか。つまり、過去の経験から自分に有利な戦略を考えたのです。これはまさにデータサイエンスの基本的な考え方に通じるものです。その考えとは、過去の経験や情報、つまりデータがあり、このデータに偏りや傾向があれば、これをうまく利用することにより自分に利益をもたらそうというものです。

もう少し典型的なデータサイエンスの例としてネット通販を考えてみましょう。ネット通販で商品を購入したことはあるでしょうか?商品を購入した後、「これも買いませんか」といろいろな商品を推薦された経験はないでしょうか。あなたはさまざまな商品をランダムに買っているわけではなく、自分の嗜好や生活スタイルにあったものを買っているはずです。つまり、あなたの購入商品には偏りがあり、そこから導き出されたもっとも購入しそうな商品を推薦し、売り上げを増やそうという通販会社の戦略です。

ここに共通しているのは、データを集めてきて、そこにあるデータの偏りや傾向を見つけ出し、それを自分たちの利益になるように活用しようという考え方です。ひとつ付け加えるとすると、単にデータ処理を行って機械的に偏りや傾向を見つけるだけではなく、そこから深い考察によって価値を生み出すことがとても重要になってきます。まとめると、データを収集、加工、解析し、そこで得た知見を価値にしようという営みのことをデータサイエンスといいます。

 

データサイエンスの歴史、注目される背景

現代においてデータサイエンスが注目されているのは、いくつかの条件が重なったからです。

ここ数十年の間にコンピュータ周辺技術はたいへんな勢いで進化してきました。計算速度は速くなり、コンピュータ同士はネットワークでつながるようになりました。最近では家電製品もネットワークにつながるようになっています。ソフトウェアも進化しました。データ処理のための効率的な手法や使いやすいソフトウェアも開発されました。これらのことにより、ネットワークにつながった多くのデバイスから集められた大量のデータは、ハイパフォーマンスなコンピュータを使い効率的な計算手法で高速に解析ができるようになります。そうすると、データを解析してその知見をうまく利用できそうだという考えを多くの人が持つようになります。データに基づき得られる知見が、社会や企業を動かすエンジン(原動力)になるという考え方はデータ駆動的思考といいます。

このような考えに基づいてさまざまな場面でデータサイエンスが活用され、その有用性が明らかになります。するとさらに多くの場面でデータサイエンスは活用され、さらに注目されるという正のフィードバックによりますます注目されるようになりました。

さらなる注目の要因として、人工知能ブームがあります。2012年に開催された写真データに写っている物体が何かを当てる国際コンテストImageNet Large Scale Visual Recognition Challenge(ILSVRC)で、カナダのトロント大学のチームがダントツの認識率で優勝しました。ここで使われていたのがディープラーニング(深層畳み込みニューラルネットワークを利用したもの)という技術です。この年以降、ディープラーニングの技術はいっきに注目を集め、ディープラーニングに関する研究は急速に加速し、さまざまな分野でそれまでの記録を塗り替えていきました。この人工知能の技術はデータサイエンスのデータ解析に使うことができます。つまり高性能なデータ解析ツールとなるわけです。このことにより、データサイエンスもさらに進化するということになりました。このように人工知能とデータサイエンスは相互に刺激しあって進化を続けているように思います。

 

データサイエンスの活用事例

 

「エンターテイメント」

ゲーム業界は積極的にデータサイエンスを活用する業界の一つではないかと思います。ソーシャルゲームにおいては利用者の行動履歴などのデータ収集が簡単にできます。これを分析することにより難易度の調整やアイテム価格やイベントの最適化を図っています。その結果として、プレーヤーの満足度の向上や収益の向上に寄与しています。

テーマパークでは、パーク内に設置したセンサや顧客がもつGPSなどから顧客がどのように動き、どういう順番でどのアトラクションに乗ったかをデータとして収集しているところがあります。また、ショップで何を購入したかも重要なデータとなります。これらのデータを解析し、さまざまな顧客のニーズを探り出しそれに合うコンテンツを展開したり、さらにサービス提供のプロセスや顧客の満足度の改善に役立てたりしています。

 

「スポーツ」

あるサッカーチームは、GPSトラッキングにより選手たちの動きのデータを取得しそれを解析しています。これにより、選手たちのコンディションを把握し、それに応じたトレーニングプログラムを開発することにより選手のパフォーマンスが向上します。また怪我のリスク要因を特定し予防策を講じることによりリスク軽減にも貢献しています。また、チームの戦略を立てる際のデータとしても使われています。

世界中のサッカー選手のプレーや身体的特徴のデータを収集し分析しているチームもあります。比較的無名にも関わらず、将来的に大きく成長し高いレベルでパフォーマンスを発揮する可能性の高い選手たちを見つけ出し、継続的にモニタリングしています。このような選手は補強が必要となったときに比較的安い移籍金で獲得が可能となりチーム成績を向上させることができます。

 

小売業界

オンラインショッピングはもちろん実店舗においてもポイントカードや販売情報を即座に処理できるPOSレジの導入により、購買履歴のデータを収集しています。これにより、顧客の購買動向の集積をはじめ在庫や発注管理などに活用しています。購入に至った人の性別や年齢、価値観やライフスタイルなどの傾向から顧客に応じたクーポンやサービスを提供するといったマーケティング施策を実施できるようになりました。

データサイエンティストとは

上で述べたようにデータサイエンスが注目されています。当然データサイエンティストも注目されています。ここでは、データサイエンスをする人、データサイエンティストについて詳しくみていきましょう。

データサイエンティストの歴史、注目される背景

上で述べたようにデータサイエンスが注目されています。当然データサイエンティストも注目されています。

歴史的なことをいえば、2012年に「データサイエンティスト」という職業に大きなできごとがありました。それは、ハーバード・ビジネス・レビュー誌に「データサイエンティストは21世紀で最もセクシーな職業(Data Scientist: The Sexiest Job of the 21st Century)」と題する記事が掲載されたことです。「セクシー」というのは刺激的な言葉ですが、ここでの意味は、稀有な特性をもち、企業などから多く必要とされているという意味だそうです。この記事をきっかけに職業としての「データサイエンティスト」への注目が大きく高まり、認知度も一気に上がりました。当時とくらべてデータサイエンスのすそ野は広がり、その意味合いも変わってきましたが、現在でも多くの企業から必要とされている職業の一つであることに変わりはありません。

さらにデータサイエンティストが注目されている理由があります。それは、国が、「Society 5.0」の実現を推進しているからです。Society 5.0 とは、狩猟社会(1)、農耕社会(2)、工業社会(3)、情報社会(4)に続く5番目の社会形態で、「サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、人間中心の社会(Society)」と定義されています。これを支える人材として、データサイエンスを理解し、実践できる人材の育成に力をいれています。つまり、将来的に活躍する場面が多く想定されていることがここからもわかります。

このように、技術的、社会的、政策的と多角的な視点から注目されていることになります。

データサイエンティストの仕事内容

データサイエンスの活躍事例でみたように、データサイエンティストと一口にいっても仕事内容は多種多様です。ここでは一般企業にデータサイエンティストとして勤めている人の一般的な仕事内容を書きます。大きな流れとしては、まず問題・課題を設定し、それをデータに基づき解決策を見つけ、それを実行する人に伝えます。ただし、業種や企業規模などによってだいぶイメージは違うと思いますのでご注意ください。

問題・課題の設定

まず問題・課題の設定ですが、企業に勤めている以上それは業務に関するものです。例えば、社内の情報システムに関するものや工場における製品製造に関するもの、人材育成に関するものなどがあります。問題・課題は自分で見つける場合もあると思いますが、他の部署などから相談されることが多いと思います。いずれにしても、現状の何が本当の問題なのか、これをどういう状態にするべきなのかをよく解釈することが大切です。ある意味ここがもっとも難しい箇所かもしれません。しかし、これを適切にできるかどうかは、その後問題解決ができるかどうかに大きくかかわってきます。

必要なデータを見定める

次に、設定した問題に対処するためにはどのようなデータが必要かを見定める必要があります。このデータは既に手元にある場合もあります。しかし、どこかから集めてこなければならない場合もあります。この場合データを収集する手法を構築します。そもそも適当なデータがない場合もあります。この場合はデータを作り出す必要があります。データをどう作るかを考えることも仕事の一つです。

さて、データが揃ったとしましょう。「よし、解析だ」とはなりません。たいていの場合、これらのデータはデータの並び方がバラバラだったり、必要な情報の一部が欠けていたりします。このようなデータをコンピュータで処理できるようにきれいにします。これはかなり泥臭い仕事ですが、もちろん重要でなければならない工程です。

データの分析

さていよいよデータ分析です。データに潜んでいる「知見」を見つけます。統計学や人工知能の知識を駆使することになるでしょう。これらを実行するツールやプログラムのパッケージがかなりそろっており、とても便利になってきました。しかし実際には自分でプログラミングをしないといけないことが多いと思います。

さて、この「知見」は最初に設定した問題を解決することに役立つでしょうか。役立つとしたら、どのような行動が必要でしょうか。これらの問題の解決策をまとめる必要がありますね。そして、まとめた内容は問題を解決する人に伝えなければなりませんね。それは、システム運用部署や工場、あるいは人事担当者だったりします。そのために、報告書にまとめたり、プレゼンテーションをしたりすることも仕事の一つです。

この一連の流れとは別になりますが、データ解析の方法は、ものすごいスピードで進化をしています。そのため、データ解析の最新技術・動向の把握も重要な仕事です。

これらの仕事は複数人ですることも多いと思いますので、すべて一人でするケースは少ないと思います。しかし、さまざまな分野のスキルが必要であることは間違いないと思います。

 

平均年収 

データサイエンティストはITエンジニアの中でも高度で先端の知識が必要となり数も限られますので、需要が高く年収も高い傾向にあります。当然経験や能力により変わりますが、未経験で400万円台から、経験が豊富でありや能力が高い場合には1000万円以上のこともあるようです。2022年12月に発表されたでのdodaの「平均年収ランキング」では、データサイエンティストの平均年収は513万円です。また、「求人ボックス 給料ナビ」によると、データサイエンティストの平均年収は約699万円だとわかりました。(2023年6月現在)。

 

データアナリストとの違い

データサイエンティストとデータアナリストの厳密な定義はないと思います。したがって、両者には明確な違いはないと考えられます。しかし、ニュアンスとして、データアナリストはよりデータ解析の部分に重点があり、データサイエンティストはより幅の広い仕事内容が含まれるように思います。

データサイエンティストになるには

求められるスキル

データサイエンティスト協会によると、データサイエンティストに必要な3つのスキル領域があります。

ビジネス力

まずは、ビジネス力(課題背景を理解した上でビジネス課題を整理し解決する力)です。例えば、問題設定や解決策のまとめとその報告で主に必要となるスキルだと思います。問題設定には、表面的なことだけでなく背景を含めた物事に対する深い洞察力が必要です。

データサイエンス力

次に、データサイエンス力(情報処理、人工知能、統計学などの情報科学系の知恵を理解し使う力)があります。データ解析ではプログラミングに加えて、統計学や機械学習などの数理情報学が少し必要になります。

データエンジニアリング力

3つめが、データエンジニアリング力(データサイエンスを意味ある形に使えるようにし、実装・運用できるようにする力)です。つまりデータ収集と解析の部分です。例えば、情報技術のスキル、プログラミングやシステム、データベースに関するスキルが必要です。

この他問題の対象となる分野で専門知識も必要な場合もあるかもしれません。例えば、情報システムや工場の製造過程、あるいは人事関連、そしてビジネスやコンサルティングの知識もあった方がよい場合もあります。ただし、きりがないので、その専門家と共同で仕事をするのが普通でしょう。

また、全般的に求められているのは、論理的な思考力やコミュニケーション能力やプレゼンテーション能力だと思います。

求められるスキルは幅広いものがあります。ただ、すべてのスキルを均等に高く持っている必要はありません。人によって得意不得意はあるのが普通です。なので、チームで仕事をすることになるのが普通だと思います。チームでやるならば、マネジメント、チームワークも必要になりますね。

 

データサイエンティストになるまでのロードマップ

上で3つのスキル領域の話をしましたが、まずは必要なスキルを身に着けます。まず、データサイエンス力ですが、この基礎知識としてあるのが数学や統計学、情報学になります。そして実際にデータを処理するためには、データエンジニアリング力が必要になります。プログラミングのスキルや一般的な情報システムやデータベースに関する知識も必要でしょう。ビジネス力は、知識だけではなく経験が大きく依存するものとなります。これらのことは独力で習得することもある程度は可能だと思いますが、学校などで専門の先生から学ぶのが効率的だと思います。

データサイエンスをやっている会社に就職をして、経験を積んでいくことが必要になると思います。

データサイエンティストの将来性と今後

データサイエンティストを始めとする先端IT技術者は、IT企業に集中しています。一方で、データサイエンティストはさまざまな舞台での活躍が期待されています。自社内にデータサイエンスができる人を集めたいという企業は増えています。このような状況ですので、データサイエンティストもまだまだ人材が足りない状況が続いています。さらに、データサイエンス関連の知識や技術は進化し続けており、海外でも新しい企業やサービスが出現しています。日本の企業では、欧米諸国やアジアの先進諸国と比較して、データ活用が進んでいないようです。その原因の一つが人材不足といわれています。これらのことから、データサイエンティストの人材不足の傾向は将来性的にも変わらないと考えられます。

現時点においても、興味をもつ企業が多く、人材不足になります。

まとめ

これまで見てきたように、データサイエンティストはデータの中にある偏りを見つけ出し、それを価値に変える仕事をする人です。これには、プログラミング、統計学、人工知能、機械学習などの数理的な知識や情報処理技術が必要になります。さらには、課題を見つけ出し、その解決策を提案するといったものごとを多角的に深く考える力も必要となります。

東京情報デザイン専門職大学では、データサイエンティストになるためのプログラミング、統計学、人工知能、機械学習などの情報処理技術について基礎から学習し専門的な知識を学ぶことができます。さらに、課題を設定しその解決策を提案するというビジネス力につながる情報デザインも学ぶことができます。

 

 

 

IT・AI・ゲーム業界に興味のある方へ!

東京情報デザイン専門職大学ではオープンキャンパス・学校説明会を開催しています!

オープンキャンパス・学校説明会
オープンキャンパス・学校説明会

情報デザインを使う企業・業界から講師が来校。興味のある分野を選び「情報デザイン」の一歩を体験してみよう。

  • EVENT OPEN CAMPUS
  • 資料請求
  • 業界コラム