【2024年版】データサイエンティストの日常:役割や仕事、働き方を徹底解剖

「データサイエンティストってデータを分析する人でしょ?」という考えは決して間違いとは言い切れませんが、よくある誤解です。データサイエンティストを目指される方や、これからデータサイエンティストと仕事をする必要があるような方に向けて、データサイエンティストがどのようなミッションを持ち、どのような業務内容で普段仕事をしているのか、現役データサイエンティストへのインタビューやデータサイエンティスト協会の資料をもとに解説いたします。
- 本記事の概要
-
- データサイエンティストの役割(ミッション)は、データから洞察を得て、ビジネスに戦略的な価値を提供すること
- そのためにデータサイエンティストは、打ち合わせや分析を業務として行っている
- データサイエンティストを抱える企業は現状大企業が多いため、労働条件の水準も高く、多様な働き方が考えられる
- 責任の大きい仕事である点がやりがいでもあり、つらいことでもある
データサイエンティストとは
データサイエンティストとは、データを分析し、洞察を得て意思決定を支援する専門家のことです。データサイエンティストがプログラミング、統計学、機械学習等を駆使し、企業や組織に内在している多種多様なデータからパターンを発見し、予測モデルを構築することで、企業や組織は競争力を高めるような戦略的な意思決定を行うことができます。データサイエンティストはデータの専門家であり、現代のビジネス環境で不可欠な存在となっています。
データサイエンティストの役割と仕事
データサイエンティストの役割(ミッション)と、実際の業務内容や仕事について、よく混同されている方がいらっしゃいます。「データサイエンティストの仕事=分析」という、間違いとは言い切れない誤解も、ここが分かりにくいから生まれてしまいます。本記事ではその誤解を紐解き、しっかりとデータサイエンティストの仕事について理解いただくために、役割と業務内容を分けて紹介します。
データサイエンティストの役割(ミッション)
データサイエンティストの役割(ミッション)は、ビジネスにおいて蓄積されるデータや、世界中で公開されているデータから洞察を得て、ビジネスに戦略的な価値を提供することです。膨大なデータを分析し、トレンドやパターンを発見・予測する事で、ビジネスの意思決定をデータ駆動型にし、企業(組織)の競争力を高めることができます。そのためデータサイエンティストはビジネスにおけるニーズやドメインの知識(事業領域における慣習・法令・経験など)を理解している必要があり、だからこそデータ活用による課題解決・価値創造のリーダーとして注目されています。
データサイエンティストの役割は分析をすることだと思われている方が多いのですが、それはあくまで役割(ミッション)を達成するための業務(仕事)の一部にすぎません。
- 単純化した例
- より多くの契約者を獲得したい
- 役割
- 次に行うキャンペーン施策の効率を上げより多くの契約者を獲得する
- 業務
- 過去に行ったキャンペーンとその効果を分析する
データサイエンティストの業務内容や仕事の流れ
データサイエンティストの業務内容は多岐にわたります。主なタスクや仕事の流れとしては以下が挙げられます。
- 打ち合わせ
- データサイエンスを適応する領域に詳しいメンバーや、課題解決のビジネス担当者との対話を繰り返し、プロジェクトで達成したい目標を確認します。
- 問題の定式化
- 打ち合わせで確認し、すり合わせたビジネスの問題を、数理的な問題として定式化(変換)するプロセスです。仮定・仮説を立てながら定式化していきます。
- データ収集
- 定式化ののち、不足しているデータがある場合、データを収集し、データベースやデータウェアハウスに格納します。すでに取得されているデータがある場合、データへのアクセス経路を確立させます。
- データの前処理
- 収集されたデータを確認し、欠損値や外れ値、エラー等を処理します。この作業により、データの品質をととのえ、分析結果の正確性を向上させます。
- 統計モデリングや統計解析・機械学習モデル作成など
- 統計モデルや機械学習アルゴリズムを使用してデータを分析し、トレンドやパターンを発見します。必要に応じて機械学習・深層学習などのモデル(一般的な言葉で置き換えるとシステムが近い)を構築します。
- レポートの作成
- データサイエンスの知見がない方にもわかりやすいように、また解釈の齟齬が起きないように気を付けながらレポートを作成します。
- 論文などで理論や技術のキャッチアップ
- 必要な技術に磨きをかける目的や、新たな技術の獲得のための時間を取ります。
上記タスクはイメージしやすいように簡略化していますが、実際データサイエンティストは上記のようなタスクを、各工程を行き来しながら遂行することで、データ活用による課題解決・価値創造といった役割の達成を目指します。なお、耳にすることも多いかもしれない「データの可視化」というプロセスは、「データの前処理」や「レポート作成」等、複数のプロセスにおいて、異なる目的のため行うことがあるため、ここでは各プロセスに割り振らせていただいております。
データサイエンティストの業務・仕事の割合
1つのデータサイエンスプロジェクトにおけるデータサイエンティストの業務・仕事の割合は以下の通りです。
- 打ち合わせ:5%
- 問題の定式化:20%
- データ収集: 20%
- データの前処理:20%
- 統計モデリングや統計解析・機械学習モデル作成など:20%
- レポートの作成:10%
- 論文などで理論や技術のキャッチアップ:5%
上記の表は、当財団が運営するデータサイエンススクール「Tokyo iX」のメンターも務める、現役データサイエンティストSさんのインタビューをもとに作成をした表になり、本人曰く感覚値になります。実際にデータサイエンティストとして転職する場合や、データサイエンティストとして配属が決まった場合、気になるのであれば事前業務の割合を人事担当者や先輩社員に確認することで、どのようなスキルが求められ、どのような働きを期待されているのかが分かります。
データサイエンティストの1日
データサイエンティストの1日の時間の使い方は、データの収集や整理だけを行う時期もあれば、分析だけを行う時期もあります。時間の使い方は基本的には勤めている企業や組織の規模、プロジェクトの工程によって変化します。大きなプロジェクトに加えて複数のプロジェクトを抱える場合も1日の過ごし方は変わってきます。
大きなプロジェクトの一員としてデータサイエンティスト業務を行うケースのうち、工数を管理するPM(プロジェクトマネージャー)がつく場合には、各工程の納期にしたがって成果を上げる必要があります。
一方で個人の裁量が大きな場合には、自分でしっかりと工数管理をしながら業務を行う必要があります。
ここではメンターのSさんに聞いた、データサイエンティストの1日を紹介いたします。
- 9:00:出社
- 10:00:プロジェクトAの分析で用いるためのデータの抽出・加工
- 12:30:お昼(1時間)
- 13:30:プロジェクトBで運用している機械学習モデルの性能についてレポート化
- 15:00:プロジェクトの進捗報告会議
- 16:00:チーム内で論文のリサーチ発表
- 17:00:プロジェクトCの分析のための重い計算(朝までかかる処理)をコンピュータで実行
- 18:00:退社
データサイエンティストの働き方
データサイエンティストの雇用形態は企業により異なりますが、フルタイム、パートタイム、契約社員など多様な働き方があります。十分な経験を積めばフリーランスなど柔軟な働き方も可能で、自身のライフスタイルに合わせて働くことができる方もいます。
データサイエンティストにはドメインの知識(対象となる事業領域に関する経験、知見、法令、習慣などの知識)が必要不可欠なことや、専門性・機密性の高いデータをあつかうことからも、正社員として雇用されるケースが主流です。
フリーランスの道としてはいくつかのパターンが考えられますが、基本的には以下の3つが考えられます。
- データサイエンス・データ分析の業務委託を受けるフリーランス
- データサイエンス・データ分析のコンサルティングを行うフリーランス
- データサイエンス・データ分析の人材育成・研修を行うフリーランス
データサイエンティストの勤務時間・休日・生活
データサイエンティストの勤務時間や休日は企業やプロジェクトにより異なりますが、データサイエンティストの雇用を積極的に行っている企業は一般的に大企業に分類される企業が多いです。そのため「日勤」の勤務形態で、通常8:00~19:00の間が就業時間になります。
デスクワークが中心なことや、大企業が雇用企業として多いことからも、「在宅勤務制度」や「フレックス勤務制度」を導入している職場も見つけやすいでしょう。
また就業時間外や休日は、勉強に充てる人材が多い職種でもあります。データサイエンスの分野はまだまだ発展途上でもあること、技術の進歩が激しいことなどもあり、技術のキャッチアップやさらなる向上のために自学自習する方や勉強会等に参加し、スキルアップを目指す方が多いです。
データサイエンティスト向けのコミュニティに参加することや、KaggleやSIGNATEといったデータサイエンスのコンペに挑戦することで、技術力を高める方法もあります。
データサイエンティストの求人・就職状況 - 新卒の場合
新卒のデータサイエンティストの求人・就職状況は、現代のデータ駆動型経済において非常に活発です。経済産業省が定めた「デジタルスキル標準(デジタルスキル標準 (METI/経済産業省)
)」において、データサイエンティストという職種が明記されたことで企業が準備をはじめ、大学を管轄する文部科学省が「数理・データサイエンス・AI教育プログラム認定制度(数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル):文部科学省
)」を定めたことで、大学での育成も活発になりました。
企業がデータによる意思決定を強化し、競争力を獲得するためにデータサイエンティストの需要は年々増加しています。
採用を開始している企業は日立製作所 や博報堂などをはじめとする大企業、業界としてはIT、金融、ヘルスケア、広告、ゲーム、アパレル、日用品業界など、多岐にわたる業界で今後もさらなる求人の拡大が期待されます。
Job型雇用が中心となっていくこれからの時代において、新卒にも特定のスキルが求められるようになってきます。データサイエンスの領域はそういった時代においても専門性を高く評価してもらいやすく、また現状雇用は大企業中心なことから、初任給は平均の倍以上となるケースも少なくないです。
新卒でデータサイエンティストとして大手企業への就職を目標に大学を選ぶ際は、データサイエンスを専門的に学習できる大学を選びましょう。
データサイエンティストの求人・就職状況 - 中途の場合
データサイエンティストはそのスキルの専門性から、転職市場でも非常に注目されています。中途の場合は新卒以上に給与水準が高く魅力的に映りますが、中途採用のほとんどが「即戦力」「経験者」を求めるものです。
一方でデータサイエンティストの約7割は転職未経験というアンケート結果(※)もあり、データサイエンティストの転職市場は売り手市場とも言えます。ある程度経験のある方であれば、転職は成功しやすいでしょう。
また第二新卒、もしくは未経験枠としてデータサイエンティストを募集している企業も、まだまだ少ないですが確実に増えてきています。データサイエンスの初歩スキルをすでに獲得していることが前提になりますが、特に業界を変えない場合、通常のドメイン知識があることに加えてデータサイエンスの初歩スキルを身につけている人材というところをアピールできれば、転職に成功する可能性は十分にあると言えるでしょう。
(※)出典:データサイエンティストの就労意識(データサイエンティスト協会)
未経験からデータサイエンティストになるには?
データサイエンティストになるためには、データサイエンスやデータサイエンスに関連する知識やスキルを身につける必要があります。データサイエンスを学ぶ前提としてPythonやRをはじめとするプログラミング言語を使いこなすスキルや、数学・統計といった知識も必要になるため、データサイエンティストは未経験からの挑戦ハードルがかなり高い職業と言えるでしょう。データサイエンティストやデータアナリストを目指す場合には、まずPythonや数学・統計といった事前知識を身につけてから、データサイエンスに関する専門知識を付けていく形が理想的です。
また「データサイエンティスト」という肩書に重きを置きたい場合、特に30代以上の方は年齢が高ければ高いほど、いきなりの転職はかなり難しいです。データサイエンスについて学習したら、まずは自身の職場において学んだ知識やスキルを実践し「経験」と「実績」を積み上げることで、遠回りではありますがキャリアとしては成功と言える転職が行えるでしょう。
一方で第二新卒の募集はここ最近で増加傾向にあるため、20代前半の方は比べて挑戦がしやすいといえます。
どちらのケースでも、データサイエンスについて自身で学習し始めていること、学習し終わったことを示す必要があります。最低限、前提知識と言われるPythonや数学・統計などを理解しておきましょう。
「Tokyo iX」のメンターは皆、未経験からデータサイエンスを学び、データサイエンティストとして転職し第一線で活躍しているメンバーです。そんなメンターから直接指導を受けられる「Tokyo iX」では無料相談を実施しています。
無料相談するデータサイエンティストは女性でもなれる?
データサイエンティストは性別に関係なく誰でもなれる職業です。近年、女性データサイエンティストの数も増加しており、多様性を尊重する企業が増えています。性別に関わらず、データサイエンスのスキルと情熱を持つ人は歓迎されています。
データサイエンティストのキャリアパス
データサイエンティストは専門性の高いキャリアであるため、継続してデータサイエンスの専門性を高めることで見習いから一人前、そしてリーダーやシニアになっていくといったストレートなキャリアパスが描きやすいでしょう。ためには、知識やスキルを磨き続けることがキャリアの発展に繋がります。実際にデータサイエンティスト協会が現役データサイエンティストに行った調査結果(※)でも、ほぼ100%のデータサイエンティストが継続的にスキルを磨いています。
(※)出典:データサイエンティストのリアル(データサイエンティスト協会)
またその専門性を活かしてキャリアをシフトチェンジすることも可能です。
データサイエンスの知識に軸を置いた場合
データサイエンス・データ分析のコンサルタントや、データサイエンス・データ分析を行う人材を育成・指導していくような道があります。
データサイエンスのスキルに軸を置いた場合
新たな専門性を獲得することで、気象データアナリストや金融アナリスト、データマーケターといった2種類の専門性持った人材になっていくという道があります。
データサイエンティストの志望動機や目指すきっかけ
データサイエンティストになりたいと考える人々にはさまざまな動機があります。実際に当財団でメンターとして活躍しているデータサイエンティストや、当財団の運営するデータサイエンススクール「Tokyo iX」の修了生に聞いた志望動機としては、以下が挙げられます。
- 木村さん(修了生)
- エンジニアとして働く中で、データサイエンスを学ぶことで業務に貢献できるのではと考えたため。また大学でPythonや数学・統計に触れていて、その知識を生かせるのではと考えたため。
- 辻さん(修了生)
- ニュースでデータサイエンスやAI、プログラミングという単語を聞く機会が増え、自分も何かしなければという危機感が芽生えた。その中でもデータサイエンスは業務で扱うデータを使って新しい事がしたいというイメージがわいたため。
- Wさん(メンター)
- 高収入である点や社会的地位が認められること。そのおかげで安心して技術を磨くことや仕事に集中することができると思っているので、まったく悪い考えだとは思わないですし、恥ずかしい事と思う必要もないです。もちろんそれだけではなく、プログラミング自体が仕事であるプログラマーに比べて、データサイエンティストはプログラミングを道具として価値を生み出すことに重きが置かれる点も、自分の得意を活かせることから魅力的でした。
- Sさん(メンター)
- もともと教育関係の仕事をしており、「学習者ごとに、どのような働きかけをすれば最も成長するか」に関心がありましたが、同時に教育者の経験だけをもとに解を出すことに限界を感じていました。そこで、機械学習・データサイエンスという領域を知り、多くの問題が解けそうだという直感が働き、学び始めてみると、理論や技術自体の面白さにも魅力を感じたのが、データサイエンティストとして転職してみようと思ったきっかけです。
またデータサイエンティスト協会がデータサイエンティスト向けに行ったアンケートの調査結果(※)では、現役データサイエンティストはデータサイエンスという職種に以下のようなイメージを持っているようです。
- 専門性が高い:71%
- 将来性がある:60%
- 人の役に立つ:43%
- 自己成長できる:40%
- 実力主義:39%
- リモートワークができる:38%
データサイエンティストのやりがい・楽しさ
データサイエンティストのやりがい・楽しさは、高い専門性を持ちビジネスに大きな影響を与えることができることにあります。
その役割(ミッション)からもわかる通り、自分の仕事の成果でもあるデータ分析の結果やそこからの提言をもとに、売上が上がったりコスト削減につながったりすれば、自身の職務経歴として誇れるだけでなく、大きな達成感を得ることもできるでしょう。
またビジネスの方向性に大きな影響を与える業務であるだけに、経営陣や管理職社員と日常的にコミュニケーションをとることも多いので、責任感をもって仕事をしたい方や、誇りを持って働きたい方にはおすすめです。
データサイエンティストのつらいこと・大変なこと
やりがいである一方、同時につらい事でもあるのがその責任の大きさ、重さにあります。
データ分析の結果が間違えている。データ分析の結果を都合よく解釈されてしまった。などといった形で、誤った意思決定を誘発してしまった結果、収益が悪化してしまった等ということは、どのデータサイエンティストにとっても一番避けたいことでしょう。
データサイエンティストはデータの分析結果に責任を持つことはもちろんのこと、解釈の誤りがないように注意深く説明する必要があります。
まとめ
データサイエンティストの仕事は多岐にわたり、データから価値を引き出すことで企業に大きな影響を与えています。やりがいと楽しさがありつつも、課題も存在し、データサイエンティストとしてのスキルを磨く姿勢が重要です。与える影響が大きい分、強い責任感がある方や、責任をもって業務に取り組みたいと考える方にはお勧めと言えます。専門性や将来性の高さ、魅力的な年収、柔軟な働き方、求人の増加といった点から見ても、データサイエンティストは非常に魅力的な職業と言えるでしょう。
本ブログを運営するAI人材育成機構では、完全未経験から約半年でデータアナリスト・データサイエンティストを目指すデータサイエンティスト育成スクール、Tokyo iX『データサイエンス学科』を運営しています。Tokyo iXでは、Pythonや数学・統計といった事前知識がない方へサポートを無料で提供しており、文系出身営業職の方の修了実績も少なくありません。また、週の学習時間が10時間のため、業務と並行して学び、学んだことをすぐに実践いただくことができます。
データサイエンス学科は経済産業大臣の認定を受けた第四産業革命スキル習得講座(Reスキル講座)となっており、費用に関しても、厚生労働省の専門実践教育訓練給付金の対象講座です。一定の要件を満たす場合は授業料の50〜70%の支給を受けられます。
オンラインで受けられる無料の個別相談を実施していますので「データサイエンティストの仕事についてもう少し詳しく知りたい」「講座に興味はあるが、自分に出来るのか(自分が目指すべきなのか)不安がある」という方もぜひお気軽にお申し込みください。
無料相談する筆者あとがき
データサイエンティストの仕事とは何なのか。知り合いのデータサイエンティストは「データサイエンティストとして世界を見る目を身につけて、それを活用すること」と言っていたことを強く思い出します。
どのような仕事もそれぞれの専門性の中、付加価値を上げることでお給料をいただいているものと思います。データサイエンティストの年収が高いのは、習得が難しい希少なスキルであり付加価値が高いことに加え、それを持っている人材がいないという人材の希少性もあると思います。
ここ数年急速に拡大し、活用が期待されるAIの出現により、データ活用のスキルを持つ人材を採用したいというニーズはより増加していきます。一方で高校生は情報Ⅰとしてデータサイエンスの入り口を学ぶなど、データネイティブな若者たちも増えていくでしょう。
学習開始に「遅い」ということは一切ありませんが、今ならむしろ「早い」ともいえるタイミングです。ぜひご自身のキャリアの強化のために、少しでも学び始めてみてはいかがでしょうか?
学習が大変なのはご想像の通りですのでデータサイエンティストを目指す際に“覚悟”は必要ですが、決して不可能ではないです。我々はそんな覚悟を持った本気の人材に対しての支援を惜しみません。
