データサイエンティストになるには|未経験から転職までステップ別解説
更新日:

「データサイエンティストになるにはどうすればいいの?」「何から手を付けたらいいんだろう?」
まったくの未経験から、データサイエンティストとして業務を行えるようになるまでに必要な知識やスキルを、学習フェーズごとに分けて紹介いたします。
また気になる方はぜひ、自分が向いているタイプなのかそうでないのか、記事の序盤で確認してみてください。
- 本記事の概要
-
- データサイエンティストに向いているのは、コミュニケーションスキルがあり、ビジネス課題の解決に興味を持っていて、好奇心と問題解決意欲が高く、数学的な思考力があり、忍耐強くコツコツと仕事ができる人
- データサイエンティストになるには、Pythonや統計といった前提知識を身につけ、データの前処理、統計的データ処理、可視化の実装方法を学び、実践を積みながら知識を深めるのがよい
目次
データサイエンティストとはどんな仕事?
データサイエンティストとは、現代のデータ駆動型社会において、データを分析し活用する専門家で、ビッグデータから意味ある情報を抽出し、企業や組織の意思決定を支援します。必要とされる知識は幅広く、統計学、機械学習、プログラミング、ビジネス洞察力などの知識が必要です。データサイエンティストは、データの収集、前処理、モデリング、可視化、結果の解釈といった全ての段階で重要な役割を果たし、データ駆動の意思決定を可能にします。
データサイエンティストに必要なスキル
データサイエンティストに必要なスキルをデータサイエンティスト協会では「データサイエンス力」「データエンジニアリング力」「ビジネス力」の3つと定義しています。
- データサイエンス力
- 情報処理、人工知能、統計学などの情報科学系の知恵を理解し使う力
- データエンジニアリング力
- データサイエンスを意味のある形に使えるようにし実装・運用できるようにする力
- ビジネス力
- 課題背景を理解した上でビジネス課題を整理し解決する力
データサイエンティストに向いている人の特徴・適性
データサイエンティストに向いているのは、
- コミュニケーションスキルがあり、
- ビジネス課題の解決に興味を持っていて、
- 好奇心と問題解決意欲が高く、
- 数学的な思考力があり、
- 忍耐強くコツコツと仕事ができる人
データサイエンティストは分析の結果からビジネス課題の解決や価値創造を行うことが仕事なので、分析をするだけの人というイメージを持っていた人からすると意外な項目も多いかもしれません。
それでは、データサイエンティストに向いている人はどのような人なのか、各項目に分けてみてみましょう。
1. コミュニケーションスキルがある人
データサイエンティストの仕事は、ビジネス課題をデータ分析により解決することであり、部門責任者や経営層と対話機会も多くなります。その際に「課題が何なのか聞き出すこと」や「分析結果を解釈の齟齬がないように伝えること、わかりやすくつたえること」、つまりコミュニケーションスキルが必要になります。
課題を解決したい人、データを管理している人、分析を一緒に行うメンバーなど、意外とコミュニケーションをとる相手が多いことは、想像と違うかもしれません。
コミュニケーションが得意だなという人はそれが大きな武器になるでしょう。
2. ビジネス課題の解決に興味を持っている人
データサイエンティストが取り組むデータは通常、ビジネス上の課題や目標に関連しています。ビジネスの基本的な理解がある(もしくは興味を持てる)方であれば、「相手が本当に解決したい課題が何なのか」を導きやすくなります。
<ドリルの穴理論:『マーケティング発想法』(1968年)セオドアレビット>
『ドリルを買いに来た人が欲しいのは、ドリルではなく“穴”である』というマーケティングの有名な格言があります。穴が欲しい人に、いくらドリルの性能の話をしても刺さりません。顧客はいち早く穴をあける方法を探しているかもしれません。
データサイエンティストも、分析の依頼を受けたときには、自分目線で質問に答えるだけでなく、依頼者の事業や部署が持つ課題は何なのか、コミュニケーションを通して引き出す必要があります。
データサイエンティストにドメインの知識(事業領域の商習慣、法令、知見や経験)が必要と言われる一つの理由はココにあり、だからこそ好奇心旺盛でビジネスに係る様々なことに興味がある方は向いているでしょう。
3. 好奇心と問題解決意欲がある人
データサイエンティストは、問題を解決し、データから価値を引き出すことが目的です。上位の目的が定まったら、データからどのように課題解決ができるのか、イメージを膨らませる必要があります。
くわえて、解決したい課題というものに「これで終わり」というタイミングがあるものは少なく、より良くするためにはどうするべきか、常に新たな課題に対して好奇心を抱き、解決への情熱を持っていることが重要です。
データサイエンスによる課題解決のビジネスに与える影響は大きいため、上記に加えて大きな達成感がモチベーションになる方にも向いています。
4. 数学的な思考力がある人
データサイエンティストは、課題解決の手段としてデータ分析をしますが、そのために統計学や数学的手法を理解し、データを解釈する能力が求められます。数学や統計学が好きな方、そこまでは未経験でも数字が好きな方、物事を直感ではなく整理して考えるのが得意な方に向いています。
数学・統計学に加えて、プログラミング(主にPythonやRといった言語)を用いて分析を行いますが、プログラミングにも同様の考え方が必要になります。
プログラミングの経験がある方は、データサイエンスの道にも進みやすいです。
5. 忍耐強くコツコツと仕事ができる人
データサイエンスは試行錯誤のプロセスが非常に多いです。エラーデータや外れ値、データの形式を整えるデータクリーニング(データの前処理)のプロセスはもちろんのこと、仮説を立て分析を行った結果、もう一度仮説を立て直すことも少なくありません。
すぐに結果が出る仕事ではないため、忍耐強くコツコツと仕事をすることが得意な方に向いています。
データサイエンティストに向いていない人の特徴
データサイエンティストに向いていないのは、
- コミュニケーションが苦手で、
- 細かい作業が好きではなく、
- 理論よりも直感で動く人
データサイエンティストに向いていない人の特徴は、データサイエンティストに向いている人の特徴の正反対とも言えます。
年収が高く、多くの企業から求人もあり注目も浴びている職業ではありますが、自分との相性を考えずに学習を始めてしまうと苦労するかもしれません。
以下の項目に当てはまる方は一度、それでも本当にデータサイエンティストになりたいのか考えてみてください。
1. コミュニケーションが苦手な人
データサイエンティストの仕事は一人で完結することはありません。1日中パソコンと向き合って分析をしている日もあるかもしれませんが、反対に打ち合わせだけでほぼ1日が終わる日もあります。
なるべく人と話さない仕事をしたい、提案やプレゼンなどをするのが苦手、という方はエンジニアよりの仕事の方が自身に向いている可能性があります。
2. 細かい作業が苦手な人
データサイエンティストは、ケースによって数千億レコード以上のデータを扱うこともありますし、プログラミングを通して処理をおこなうため、慣れるまではエラーとの闘いになることもあります。
今はChatGPTをはじめとした生成AIツールも活用できますが、自分の力で理解できるようになるまでは分析途中で生成AIを活用するのは非常に危険です。
万が一誤った分析結果を出力してしまうと、それにより誤ったビジネス上の意思決定につながる危険性もあります。
こまかな作業が苦手な方は、実務者ではなく、データサイエンスの知識を持ったプロジェクトマネージャーになるなどで、データサイエンスの知識を生かしながら活躍する方が、向いている可能性があります。
3. 理論よりも直感で動く人
データサイエンティストの仕事は理論の積み重ねでできており、直感だけで仕事をすることは不可能に近いです。
データサイエンティストに興味があるけど当てはまってしまった方へ
データサイエンティストに向いていない人の特徴に当てはまってしまった方も、気を落とす必要はありません。
前提として、下記のような苦手を克服するという手段もあります。苦手だと認識しつつも、目指したい気持ちがあるという事は、それだけ本気である証拠です。もちろん、得意としている人よりも苦しい道のりにはなりますが、その気持ちをぜひ無駄にしないでいただきたいです。
そのうえで、それぞれのタイプ別に、データサイエンスに係るどのような道があるのかご提案いたします。
1. コミュニケーションが苦手な場合
データサイエンティストとして就職する際に、働き方について企業側にしっかりと確認を取りましょう。組織が大きい会社のデータサイエンティストとして働く場合、コミュニケーションは得意な人に任せているといったケースもあり得ます。
「入社してみたら想像と違った」という事をなくすためにも、自分の苦手を正直に伝え、理想の働き方ができる職場を探しましょう。
2. 細かい作業が苦手な人
データサイエンスの業務は課題の整理やプログラミングが重きを占めるため、細かい作業が苦手なことは致命的ともいえます。一方で、データサイエンスの業務は工程ごとに区切ると「同じことの繰り返し」ではないことに気が付くでしょう。またなによりも、プログラミングにまだ触れたことが無い人は、一度触ってみることもオススメします。細かい作業が苦手でも、プログラミングは好きで楽しめるという方も少なくありません。
3. 理論よりも直感で動く人
データサイエンティストの業務の中で、ひらめきや思考力が必要なシーンは貴方が思う以上に多いです。そのスキルは必ず役に立ちますが、それ以上に論理的に物事を整理し、理論立てて説明する必要があります。しっかりと学習し、新たな武器を身につけることで、データサイエンティストと共に客先に赴き、顧客の課題を解決する、コンサルタントとして企業に貢献していくという道もあります。
データサイエンティストになるには? 必要な資格やスキルを紹介
データサイエンティストになるためには、以下のスキルが必要となってきます。
- 統計学の知識
- データ解析には統計学が欠かせません。基本的な統計学の知識を身につけることが必要です。
- プログラミングスキル
- データの処理と分析にプログラミングが不可欠です。PythonやRなどのプログラミング言語を習得しましょう。
- 機械学習
- 機械学習アルゴリズムを理解し、適切に適用できる能力が求められます。
- データベース管理
- データベースを操作し、データの取得と保管を行うスキルも必要です。
- ビジネス洞察力
- データをビジネス上の課題に結びつける能力が重要です。
データサイエンティストの職業には特定の資格が必要ではありませんが、専門資格はスキルの証明に役立つことがあります。例えば、データサイエンス関連の認定資格や大学院の修士号があります。難易度は資格によって異なり、スキルと経験に応じて選びましょう。
未経験からデータサイエンティストになるまでの道のり
未経験者がデータサイエンティストになるためには、以下のステップを踏むことが一般的です。
- 1. 前提知識を習得する
- プログラミング、統計学、データベース管理などの基本スキルを習得します。第二新卒など経験がそこまで重視されない場合、この段階で採用となるケースもあります。
また新卒や業界を変えての転職にチャレンジする場合、業界に関する知識もこの段階で習得をしておくと採用で有利に働くでしょう。
- 2. 基礎知識を習得する
- Pythonの各種ライブラリの使い方や、機械学習・応用学習などの技術スキルを習得します。基本的にはこの程度の知識・スキルに加えてある程度の経験が転職には求められるでしょう。
- 3. 経験を積みながら応用知識を習得する
- 基礎知識の習得が終わったら、今までの学習内容を業務で活用し経験をつみながら、深層学習や強化学習、自然言語処理や音声データの処理方法など、必要に応じて専門的な応用知識を伸ばしていきます。データサイエンティストとしての転職を考えている方は、現職でデータを使って分析したり、機械学習などのモデルを作成した経験がつめると理想的です。
以下では各ステップについて、より詳細に解説いたします。
学習の前に
近道だけど半人前のデータサイエンティストで止まってしまう道と、難しい道だけど一人前のデータサイエンティストになれる道があるとしたら、キャリアパスとしてどちらを選びたいでしょうか。以下に示すステップは後者の一人前のデータサイエンティストを目指す道になります。一見遠回りであり、ここまでの内容は「最初は不要ではないか」という人もいますが、前提知識などの理解度によって、データサイエンティストに何よりも重要な基礎知識や応用知識の吸収度合いが大きく変わります。「時間に余裕がある方」や、「一人前を目指したい方」はぜひ前提知識の習得から目指されることをお勧めします。
1. 前提知識を習得する
データサイエンティストになるために学習を開始する場合、PythonやRといったプログラミング言語の知識、統計学の知識、数学の知識、基礎的なITスキルからデータベースの取扱いに関する知識などが必要になります。
前提知識は完全無料でも学習ができなくはない範囲です。もちろん、書籍やeラーニングはそれだけ価値が詰まっていますので、自分に合う方法で学習を進めましょう。
PythonやRといったプログラミング言語
データサイエンスに活用されるプログラミング言語には、PythonとRの二つがあります。どちらを選んでもよいですが、使い手やサポート記事が多く、初心者にもわかりやすい言語と言われるPythonをお勧めします。
Pythonを学習するといっても、Pythonのエンジニアになるわけではないため、通常の学習よりも学習項目は少なくて済みます。目安として、まずは以下の項目を使いこなせるレベルを目指しましょう。
- データ形式や基本文法と四則演算
- 制御文
- 関数
- オブジェクト指向
統計学
データサイエンティストは統計学に基いて様々な意思決定をおこなうため、統計学の知識が必要不可欠です。この段階では統計検定2級レベルの知識習得を目指しましょう。
株式会社社会情報サービスが運営するウェブサイト「統計学の時間|BellCurve
」では、完全無料で統計検定2級合格を目指せる内容の解説が行われています。ぜひ活用しましょう。
数学
数学の知識は、統計学の理解を深める目的や、機械学習などの技術を理解するために必要なさらなる前提知識となります。一昔前までは高校の指導要領に含まれていた範囲でしたが、現在は大学での学習範囲になるため、数学科や関連する学科を卒業した方でない場合聞きなじみがないかもしれません。以下を目安に学習を進めましょう。
- 中学数学の知識
- 微分・積分
- 指数関数
- 線形代数
- 行列
- 確率
基礎的なITスキルからデータベースの取扱い
データサイエンティストが業務の対象とする「データ」の扱い方について理解する必要があります。具体的にはデータベースに関する知識と、データベースの操作に関する知識の二つが必要です。
SQLというデータベースを操作する言語がありますので、SQL文に抵抗が無くなるレベルを目指しスキルを習得しましょう。
2. 基礎知識を習得する
前提知識の習得ができたら、基礎的なデータサイエンスの知識習得を目指しましょう。基礎知識の内容としては、データの前処理や統計的データ処理、可視化まで広く範囲があります。もしも目指しているポジションの求人がある場合、どの程度のスキルをどこまで求められているのか確認してから学習を開始するとよいでしょう。
基礎知識からは、一部を除いて完全に無料で学習することが難しくなってきます。eラーニングや書籍、スクールに通う方法などが主流です。
データの前処理
PythonやRなどのプログラミング言語を使って、適切にデータを整形するスキルです。統計学に基づき、エラーデータや抜けのあるデータの処理や外れ値に対処する方法を学びます。データサイエンティストの業務のうち、データに触れる最上流工程になります。ここがしっかりできないと、以降の分析処理の結果が大きくずれてしまうこともあるため、非常に重要な点です。
以下はデータの前処理における代表的な手法です。
- 欠損値の処理
- 欠損値を放置する
- 欠損値を含むケースを削除する
- 欠損値に平均値を代入する
- 欠損値を含むケースと類似属性の値を代入する
- 重回帰式などによって推計した値を代入する
- 文字列の処理
- ワンホットエンコーディング
- ラベルエンコーディング
- バイナリーエンコーディング
- カウントエンコーディング
- ターゲットエンコーディング
- スケーリング
- 正規化
- 標準化
- Robustスケーリング
- 次元削除
- 線形アプローチ
- 非線形アプローチ
- 特徴選択
- フィルター法
- ラッパー法
- 埋め込み法
データ分析・解析
様々な統計的データ処理の実装方法を学びます。データの前処理の段階で活用するものから、プロジェクトの根幹となるようなものまで、その対応範囲や難易度も様々です。
以下はデータの分析・解析の代表的な手法です。
なお応用的な内容に入るか基礎知識として紹介するか悩ましい項目もありますので、学習を始めて難しすぎると感じたら、より初歩的な内容からの習得を目指しましょう。
- データを理解する
- 基本統計量の確認
- クロス集計
- データの可視化
- 関係を探る
- 相関分析
- 散布図
- データの差を統計的に比較する
- t検定
- カイ二乗検定
- 分散分析
- データの差を統計的に比較する
- t検定
- カイ二乗検定
- 分散分析
- 予測する
- 線形回帰分析(単回帰分析・重回帰分析)
- 決定木分析
- ランダムフォレスト
- コンジョイント分析
- 分類に分ける
- 階層・非階層型クラスター分析
- 潜在クラス分析
- 要約する
- 主成分分析
- 因子分析
- 多次元尺度構成法(MDS)
- コレスポンデンス分析
- 効果を検証する
- 差の差分析
- 傾向スコアマッチング
データの可視化
データの可視化はデータサイエンス業務において様々な工程で活用されます。誰かに分析結果を報告する際に使うというイメージが一番つきやすいですが、実は前処理の段階でデータの内容を確認したり、予測や分類の結果を確認したり、統計的データ処理の工程の中で使うケースも多いです。可視化ができるだけではなく、データの属性や、データから理解したいことによって適切な可視化手法を選択できるようになる必要があります。
以下は代表的な可視化手法の一覧です。
- 散布図
- ヒストグラム
- 棒グラフ
- 積み上げグラフ
- 折れ線グラフ
- 箱ひげ図
- レーダーチャート
- 円グラフ
- ヒートマップ
3. 経験を積みながら応用知識を習得する
データの前処理と統計的な処理、データの可視化がある程度できるようになっていれば、データサイエンティストとしての転職も不可能ではなくなってきます。ただし中途採用で重視されるのは(第二新卒でない限り)実践経験や実績となりますので、在職中の内から上記のようなスキルを活用して実績を積み重ねることをお勧めいたします。
経験を積みながら応用知識を習得するとは、業務で学習内容を活用しながら必要に応じてスキルを習得するという意味でもあります。機械学習や強化学習、深層学習といった手法から、自然言語処理、画像処理といった特定のデータ形式に活用される手法まで、かなり枝分かれしていきますので、ご自身の業務やキャリアの中で身につけるべきスキルを取捨選択し、学習を積み重ねましょう。
まとめ
データサイエンティストになるには、まずPython、数学、統計学などの前提知識を身につけ、データの様々な処理方法などの基礎知識の習得を目指します。業務でそれらの知識を活用しながら実績を積み重ねることで、データサイエンティストとしての募集要項に多い①実務経験と②実務実績を積むことができます。
本ブログを運営するAI人材育成機構では、完全未経験からデータアナリスト・データサイエンティストを目指すデータサイエンティスト育成スクール、Tokyo iX『データサイエンス学科』を運営しており、受講申し込みをいただいた方に前提知識習得のための事前学習の無料サポートを提供しております。データアナリストコースでは6週間で基礎知識まで、データサイエンティストコースでは4.5ヶ月で数多くの応用知識が習得でき、短期間でデータアナリスト、サイエンティストを目指せるコースとなっています。
またデータサイエンス学科は経済産業大臣の認定を受けた第四産業革命スキル習得講座(Reスキル講座)となっており、費用に関しても、厚生労働省の専門実践教育訓練給付金の対象講座です。一定の要件を満たす場合は授業料の50〜70%の支給を受けられます。
オンラインで受けられる無料の個別相談を実施していますので「データサイエンティストの仕事についてもう少し詳しく知りたい」「講座に興味はあるが、自分に出来るのか(自分が目指すべきなのか)不安がある」という方もぜひお気軽にお申し込みください。
無料相談する筆者あとがき
データサイエンティストの年収が高く魅力的なのは、人材不足という側面がありますが、人材不足になるのも頷けるほど高いスキルを要求される職業であるという事がこの記事からも伝わったのではないでしょうか?
「才能とは努力を継続できる力である」という言葉は将棋棋士の羽生善治氏や元メジャーリーガーの松井秀喜氏の座右の銘としても有名ですが、まさしくその通り。データサイエンティストになるために一番重要なのは、「ハードな学習を継続できるかどうか」かもしれませんね。
そういう意味では、この記事を読んでも「データサイエンティストになりたい」と思えているあなたは、それだけでデータサイエンティストに必要な素養を備えています。