AI時代のデータサイエンス|将来性はない?何が違う?

ChatGPTをはじめとする生成系AIの出現により、「データサイエンティスト」は不要なのではという意見を目にするようになりました。本記事では、データサイエンスとAIの違いを理解し、AI時代におけるデータサイエンティストの必要性を深堀していきます。
目次
データサイエンスとは?
データサイエンスは、データから情報や知識を抽出し、意思決定に役立てるプロセスであり、それを行う「人」が主体です。データサイエンスのプロセスには、データの収集、前処理、分析、可視化、機械学習モデルの構築等が含まれます。また、データサイエンスを行う専門人材の事をデータサイエンティストと呼びます。
AI(人工知能)とは?
AI(Artificial Intelligenceの略)または人工知能とは、コンピュータープログラムに人間のような知的な能力を模倣させる技術の総称です。
かつてのAIは、あらかじめ設定されたルールに従ってタスクを実行するものが主流でしたが、現在では「機械学習」と呼ばれる、大量のデータから機械が自らルールを学習する方法が確立され、AIが対応できるタスクも大幅に進歩しています。
例として、「質問に対して自然な返答をする(例:ChatGPT)」「履歴からその人にあったおすすめをする(例:Netflix)」といったようなことがすでにAIによって実現しています。
AIの定義
AIの定義は「機械」が人間のように認識、学習、推論する能力を指すものと解釈されており、また、タスクを自動化するためのプログラムやアルゴリズム全般を指す場合もあります。一般的には、AIの定義は広範であり、専門家や研究者によって異なる解釈がなされています。
AI(人工知能)には4つのレベルがある
AIはそのAIの持つ知能によってレベルが設けられており、AIは一般的に以下の4つのレベルに分類されます。
1. 単純制御プログラム
あらかじめプログラムされたルールに従ってタスクを実行するAIです。現在においてはもはやAIのイメージから乖離しており、単純なプログラムとされていて、すでに私たちの身の回りにごく普通にあふれています。制御プログラムの内容としては基本的な条件分岐で構成されており、大抵のシステムはフラグに応じて単純な出力を行います。AI(人工知能)の始まりであり、限られた範囲のタスクに特化したAIです。
例:自動制御家電(特定の温度に達したら電源を切る、つける)
2. ルールベースのAI
このレベルのAIは、単純制御プログラムと比較して一定程度複雑な処理を行うことが可能であり、一見するとAIが自ら考えているように見えますが、結局は人があらかじめ大量のルールを記述する必要があります。入力に対して様々なルールの元適切な答えを返します。
例:チャットボット(あらかじめ用意された回答の中から質問に適したものを判断する)
3. 機械学習AI
AI自らが学習することで、パターンを見つけ出し、入力に応じた出力をその都度多数のパラメータから判断して答えるようなAIです。学習のためのデータや、参照するべき特徴量は人間が設定する必要があるため、完全に自立した学習を行うわけではありませんが、機械学習AIのレベルになると、多様な出力を行うことができ、AIを活用できる分野も広がりを見せています。
例:検索エンジン
4. 深層学習AI
AIが自ら特徴量の設定まで含めて学習を行うことができるAIで、機械学習に比べてはるかに複雑な判断や、ビッグデータと呼ばれる大量のデータを処理できます。深層学習の出現により、自動運転をはじめとして近未来に実現可能と言われていた多くの技術が実現しています。
例:自動運転技術
データサイエンスとAIの違い
データサイエンスとAIの違いは、AIは「機械」が主体であり、データサイエンス(データサイエンティスト)は「人」が主体である点にあります。
データサイエンスとAIの違いはまとめると以下2点です。
1. 自律性の差異
- AIは、あらかじめ想定・設計された用途において入力を受けた際に、時に機械が自ら学習し、状況に合わせて自律的に結果が出力されます。
- データサイエンスは、機械学習や統計手法を使って情報から知見を引き出す点ではAIと同じですが、プロセスの設計や最終的な結果の出力は人間が下します。
2. 判断の主体
- AIは、あらかじめ想定・設計された用途において入力を受けた際に、時に機械が自ら学習し、状況に合わせて自律的に結果が出力されます。
- データサイエンスは、機械学習や統計手法を使って情報から知見を引き出す点ではAIと同じですが、プロセスの設計や最終的な結果の出力は人間が下します。
データサイエンスとAIの共通点と相互補完性
データサイエンスとAIは異なるアプローチを持ちながらも、相互に補完し合う関係にあります。データサイエンスが提供する洞察をもとに、AIモデルの学習データやパラメータを最適化することができ、逆に、AIの予測結果をデータサイエンスが解釈し、ビジネス上の価値を生み出すことが期待されます。
結論として、データサイエンスとAIは異なるが、組み合わせることでより強力な結果を生み出すことができます。膨大な情報の処理や分析を行う際に、技術の進化とともに、これらの分野の相互作用はますます深まることでしょう。
データサイエンティストとAIエンジニアの違いと共通点
データサイエンスとAIの違いは理解できたとして、データサイエンティストとAIエンジニア(AI作成のスペシャリスト)にも違いと共通点があります。
違い①:目的が異なる
データサイエンティストの目的
データサイエンティストの目的はデータから価値を生み出すことにあり、抱えているデータから解決したい課題の解決や新しい価値の創造を行うことにあります。
AIエンジニアの目的
AIエンジニアの目的はAIの作成であり、作成するAIが目的を達成できるように、AIを設計しプログラムを作成していくことがメインのミッションになります。
違い②:重要となるスキルが異なる
データサイエンティストに重要なスキル
データサイエンティストの業務は、課題をいかにデータで解決していくか考えることにあります。仮説を立ててデータを分析し、その結果をもってまた仮説をたてなおし、最終的にビジネスや社会課題解決のために価値を見出していくことが目的のデータサイエンティストにとっては、統計学をはじめとする学問やドメインの知識等における理論的な理解が、どれほどあるかがより重要視されるでしょう。
AIエンジニアに重要なスキル
作成するべきAIの出力目標が決まっているAIエンジニアは、いかに高性能なAIを構築できるかという技術力がより重要になります。同じタスクをこなせるAIをいかに効率よく作成できるか、AIの出す結果の精度がどれほど高められるかといった点が評価につながることからも明白です。
共通点:共通して必要なスキルが多い
データサイエンティストとAIエンジニアのどちらも、以下のスキルが共通して必要です。
- プログラミング(Pythonなど)
- 数学・統計学(線形代数、微分積分、確率など)
- データ分析(前処理、分析、可視化など)
- ビジネス理解(業務を行う対象ドメインの知識)
- ビジネススキル(コミュニケーション、チームワークなど)
- データサイエンススキル(機械学習、深層学習など)
データサイエンティストがなくなるとされる2つの理由とその反論
データサイエンティストがなくなるとされている意見をまとめると、以下のような意見が見受けられます。それぞれに対しての反論を合わせて説明します。
1. 自動化の増加
「データ分析の多くのタスクは自動化されつつあり、機械学習モデルやデータ処理ツールが進化していて、一部のルーティン的なタスクであれば、データサイエンティストが介入することなく自動的に行えるのではないか」
データサイエンティストの業務は単純な分析だと誤解されがちですが、分析には根拠を基にした仮説が必要です。その自動化を設定するのはデータサイエンティストであり、会社や組織にある無数の属性のデータごとの関連性を分析によって探索するのもデータサイエンティストの仕事です。もちろん自動化によりその分析はデータサイエンティストが行う必要はなくなりますが、データサイエンティストはルーティン的なタスクではなく新たな分析を行う時間を確保できるのです。
2. ツールの増加
「ローコード/ノーコードツールの普及により、データ分析やモデル構築のためのツールに非専門家もアクセス可能になり、データサイエンティストの必要性が減少する」
こちらもデータサイエンティストの業務を単純な分析だと誤解している可能性があります。自動化と同様に、ローコード/ノーコードツールの出現により、「合計が見たい」「平均が見たい」「関連性を確かめたい」といった簡単な分析であればだれでもできるようになるでしょう。そうしたデータの活用により、さらに多くのデータが収集可能となることで、データサイエンティストとしての活躍の場が生まれます。
データサイエンティストに将来性がある根拠
AI技術の目覚ましい発達と比例して、データサイエンティストへの期待も高まっています。現役のデータサイエンティスト向けの調査でも、8割を超えるデータサイエンティストが将来性を感じると答えています(*1)。その根拠に迫ってみましょう。
1. AIの限界とデータサイエンティストの重要性
AIは素晴らしい進化を遂げ、様々なタスクにおいて驚くべき成果を上げています。しかし、AIには限度があります。AIはデータから学習し、パターンを見つけ出すことが得意ですが、人間の洞察や創造性、倫理的判断といった側面においては限界が存在します。データサイエンティストは、こうした領域でAIが届かない範囲で重要な役割を果たします。人間の視点とAIの力を組み合わせ、より深い理解と洞察を提供できるのがデータサイエンティストの強みであり、AIの登場によりむしろデータサイエンティストの重要性はさらに増すでしょう。
2. 仕事の需要の拡大
デジタル時代が進む中、世界にあふれるデータはますます膨大かつ複雑になり、その価値を最大限に引き出すことが求められています。デジタル化の推進により、企業や組織はますます多くのデータを生成し、そのデータから得られる情報をビジネスの意思決定に活かすことが不可欠です。データサイエンティストはこの需要に応える存在であり、データサイエンティストのスキルと知識はますます重宝されるでしょう。データサイエンティスト協会の調査(*2)によると、データサイエンティストを目標通り確保できなかった企業は2021年には6割を超えています。今後も新たな産業や分野でデータサイエンティストの需要は高まることが予測されています。
3. 政策で重要視されている
内閣府が定める科学技術・イノベーション基本計画
において、人材育成や研究力の強化が重要視されています。経済産業省もIPAとDX推進スキル標準をさだめ、DXを推進するために必要な人材類型としてデータサイエンティストの重要性が提起されています。同じく厚生労働省も、経済産業省と協力体制のもと、一定の基準を満たしたデータサイエンス分野の学習者個人や法人に、補助金や助成金を出す仕組みの運用を開始しており、文科省でも大学にデータサイエンス系の学部設立を促しています。
まとめ
データサイエンスとAIは、デジタル時代において重要な役割を果たすテクノロジーです。AIは人間の知的な能力を模倣し、機械学習などの手法を通じてタスクを自動化します。一方、データサイエンスはデータから情報を抽出し、意思決定に活用するプロセスです。データサイエンティストはデータサイエンスを実践する専門家であり、AIを活用しながらビジネスに価値を提供します。
AI技術の発達によりデータサイエンティストは不要という声も聞かれますが、AIのレベル的にも、まだまだデータサイエンスをはじめとする多くの職業がなくなる時代ではありません。
また、AI発展のためにも、現時点でのデータサイエンスのためにも、データサイエンティストがその知識を活かしてAIを活用していくことで、データの活用は飛躍的にも進歩する可能性を秘めています。将来的にもデータサイエンスの分野は成長し続け、AIを高いレベルで活用できるデータサイエンティストの役割はますます重要となるでしょう。
本ブログを運営するAI人材育成機構では、完全未経験からデータアナリスト・データサイエンティストを目指すデータサイエンティスト育成スクール、Tokyo iX『データサイエンス学科』を提供しております。データサイエンティストに必要なスキル項目を網羅し、AI技術にも含まれる機械学習や深層学習といった技術を実務レベルで学べる講座となっており、データサイエンティストを目指す人だけでなく、AIエンジニアを目指す方にもおすすめの講座です。
データサイエンス学科は経済産業大臣の認定を受けた第四産業革命スキル習得講座(Reスキル講座)となっており、厚生労働省の専門実践教育訓練給付金の対象講座です。一定の要件を満たす場合は授業料の50〜70%の支給を受けられます。
オンラインで受けられる無料の個別相談を実施していますので、「講座について詳しく知りたい」、「講座に興味はあるが、自分に出来るのか不安がある」という方もぜひお気軽にお申し込みください。
無料相談する筆者あとがき
機械学習(人ではなく機械に処理をさせる)という考え方は、古代ギリシアの時代からあったと言われているほど古い考え方ですが、実は1950~60年代が1次ブーム、1980年代が2次ブーム、そして2012年以降から現在までが3次ブームと言われており、コンピューターの処理能力の向上により、ようやく最近実現し始めた分野となっています。
映画「スターウォーズ」のC3-PO(人型の機械で、600万を越す言語、暗号、各種族の儀礼にも精通するロボット)や、映画「アイ,ロボット」のサニー(本来持たないはずの人間に近い感情を持ったロボット)のようなAIの実現には、まだまだいくつかの技術的ブレイクスルーが必要と言われていますが、近年のChatGPTをはじめとする生成系AIの精度を見る限り、そう遠くない未来には、特定の分野において人類を超越するようなAIが誕生するかもしれませんね。
我々人類ができることは、人が主体の「データサイエンス」知識を活かし機械である「AI」を活用し同時に「AI」の発展にも寄与していくことではないでしょうか。