漫画家イエナガの複雑社会を超定義

「社会を変える超頭脳!データサイエンティストって?」

初回放送日: 2023年1月27日

世界大注目!データサイエンティストを俳優・町田啓太が超速解説!アメリカで平均年収1700万円!ビッグデータから社会を変える超人?難しい事を漫画やCGで楽しく学ぶ 漫画家イエナガ(町田啓太)が編集者(橋本マナミ)にプレゼンするテーマは「データサイエンティスト」。近年“稼げる職業”として世界各国で大人気!いったいどんな仕事なのか?世界の情報量が爆増する中、ビッグデータにAIや統計学などを駆使し、難問を解決に導く!?スゴすぎな超頭脳!実は、僕らの選択や行動もコントロールされている・・・?衝撃の事実が!そして日本の意外な実態とは?未来の命運を握るお仕事を超速解説

  • 番組情報
  • その他の情報
  • 詳細記事

目次

  • “稼げる職業”データサイエンティストって?

“稼げる職業”データサイエンティストって?

人気のデータサイエンティストって?

Q、人気のデータサイエンティストって?

今、 “稼げる!”と世界各国で大人気な職業なのがデータサイエンティスト。

アメリカで毎年発表されている職業の魅力度ランキングでは、ここ数年必ず上位にランクイン!なんとその平均年収はおよそ1750万円(2021年度)なんだとか…!それっていったいどんな仕事なの…?と思いませんか?

データサイエンティストは、データを分析し、新しい価値を創造する人のこと。世界の情報量が爆増する中、ビッグデータにAI、統計学などを駆使して、難問を解決に導いたり、我々の暮らしからビジネスのあり方まで一変させてしまうかもしれない職業なのです。日本の意外な実情もあわせて未来の命運を握るデータサイエンティストの仕事を超速解説します!

Q、なぜ注目されているの?

データサイエンティスト なぜ注目されているの?

この職業が今、注目されている背景には、ビッグデータの存在があります。IT技術の進化やスマホの普及によって、世界のデータ量は、2000年と比べ、およそ1万倍に増加!この天文学的な量のデータをうまく活用できるかどうかが、企業の業績や国の経済成長を左右すると言われています。最近では、医療に軍事、スポーツなど、あらゆる分野でデータサイエンティストが活躍中。

2007年以降、スマホの普及が加速し、企業は、常に位置情報、乗車記録、決済記録など、個人のデータを収集できるようになりました。これを分析することで、よりパーソナライズ化されたマーケティングができるようになりました。スマホの登場によって、データサイエンティストの活躍の場がさらに広がっていったのです。ちなみにどんな事ができるようになったのか、いくつか例をご紹介すると・・・

① 顧客の乗車履歴から行動予測が可能に

 →近くのお店のバナー広告をリアルタイムで表示し、おススメできる!

② 位置情報から、20代の女性が多くいる場所がわかる

 →ユーザーの好みに適した広告出稿が効率化できる!

③ 文字や画像まで分析可能

 →SNSのデータから流行までも予測してしまう!

2027年には、データ分析の市場規模はおよそ62兆円に達すると予測されています。

データサイエンティストの注目度は急上昇し、2012年にはバズワードに。その後、アメリカの権威あるビジネス誌がデータサイエンティストを取り上げると、求人数は爆発的に増え、職業の魅力度ランキングで常に上位に入るようになったんです。

Q、データサイエンティストの仕事とは?

Amazonを飛躍させたデータサイエンティスト

Amazonを飛躍させたデータサイエンティスト

データサイエンティストは具体的にどんなことをしているのか。

大学院でAIを学んだグレッグ・リンデンは、卒業後、シアトルにある小さなオンライン書店、Amazonに入社。創業間もない当時は、本しか取り扱っておらず購入サイトの仕組みも、欲しい本をピンポイントで検索して購入というシンプルなものでした。あるとき、リンデンは「オンラインショップでも、もっと買い物を楽しめる方法はないか?」と考え、「偶然興味のある本に出会える」というリアル店舗のワクワク感をオンラインショップで実現できないかというアイデアを思いつきます。

リンデンが目をつけたのは、サーバーに蓄積されたお客さんのデータ。例えば「同じ本を買ってる人がいる!」、「この2人、買い物傾向が似てるな~!」「こっちがまだ買ってない本をオススメしよう!」という感じのレコメンデーションシステムを思いつきました。でも、これを実行するのがとても大変でした。

1、ユーザーの買い物傾向がどのぐらい似ているのか、数値化する

2、やっとできたと思っても、誰かが買い物をするたびに全部1から計算し直す必要あり

3、当時、ユーザーは既に数百万人。常に誰かが買い物をしていたため、計算量が膨大で当時の技術的に実現不可能だった

ユーザーの類似性ではなく、商品の類似性に着目

そこで思いついたのが、ユーザーの類似性ではなく、商品の類似性に着目するという方法でした。

例えば『ハリーポッター』を買った人がいたら、よく一緒に買われる『ファンタスティック・ビースト』をオススメする。これなら、計算が簡単で、当時の処理技術でも十分対応することができました。

このように、リンデンはこれまであまり活用されていなかった顧客データを独自の視点で分析することで、オンラインショッピングでもリアル店舗のワクワク感を味わえるという価値を生み出しました。

1998年、このシステムが導入されるやいなや、会社の売上は1年でおよそ3倍に増え、10年後には300倍以上にもなり、売上の35%をレコメンデーションシステムが牽引するまでになりました!

実際にデータサイエンティストになったつもりで考えてみよう!

実際にデータサイエンティストになったつもりで考えてみよう!

例えば、今回の目的は、「クレジットカードの不正利用を減らす」ことにしましょう。手順は大きく分けて4つで、仮説構築、データ加工、データ分析、評価適応です。

①仮説の構築

「短期間で高額利用をしていたら怪しいんじゃないか?」とか、「換金性の高い商品を大量に購入していたらまずいんじゃないか?」とか、データからわかりそうな不正利用のケースを考えます。

②データの加工

カード会社が持っている膨大なデータから整理分析に必要そうなものを集める。一方で、分析に不要なものを外したり、データが欠損しているものを埋めたりして整えていく。

③データ分析

統計学的なものから、AIを利用したものまで30種類以上あり、目的などに応じて最適なものを選ぶ。今回は、クラスタリングという手法を選択。これを使うと、購買パターンによってカード会社のユーザーをいくつかにグループ分けすることができる。

すると、「日頃、地元のスーパーやショッピングモールだけでカードを使っているグループ」の人が、急に「ネットで高額な商品を買うグループ」の動きをしたら不正利用されたんじゃないか、と疑える。実際には、いくつかの分析手法を組み合わせて、精度高く不正利用を検知できるようにしていく。

④評価適応

分析結果をもとに、どんな判定ルールを作ったら、ユーザーの使用感を損ねずに不正利用を減らせるか、ということに落とし込んでいく。具体的には、過去の不正利用のうち、何%を止められるかをシュミレーションして、現実的な適応を決めていく。こうして、「データに基づいて意思決定をする」ことを「データドリブン」と言います。

Q、データサイエンティストは日本で活躍している?

データを理解し役立てる人材が圧倒的に少ない!!

データサイエンティストに求められるのは、統計学やAIに関する知識、情報処理能力、それに加えて、課題解決やプレゼンなどのビジネススキルも必要なんだ。

一方で、アメリカ・ペンシルベニア大学が主要10カ国背景を対象に行った調査では、日本の企業のデータリテラシーは100点満点中およそ55点で最下位。いくらデータサイエンティストがいても、データを理解し、ビジネスに活用できる人材が企業の中に圧倒的に少ないことがわかりました。

その原因の1つが、理系人材の不足です。理系を専門に学んだ人の割合が40%を超える国が多い中、日本は35%。さらに、理系学生の数は世界的には増加傾向にあるのに、日本はなぜか減少しています。つまり、ただでさえ人材不足なのに、将来を担う学生も減っているのです。

こうした事態に危機感を募らせているのが日本政府。2019年、デジタル社会の「読み・書き・そろばん」として、「数理・データサイエンス・AI」の基礎をすべての国民が学ぶことを目標に定めました。

これを受け、小学校ではプログラミング教育が中学校では情報Ⅰが必修化。高校では全ての生徒がデータ分析を学ぶことになりました。政府は「2032年頃までに理系学生の数を現在の35%から50%にする」と宣言していて、奨学金拡充など政策を進めています。

Q、データサイエンティストの問題って?

データサイエンティストの倫理的な問題って?

5年前の2018年、1人のデータサイエンティストの告発が世界を震撼させました。イギリスの選挙コンサル会社がフェイスブックから最大8700万人分の個人情報を不正流用し、2016年のアメリカ大統領選で世論を誘導したというのです。

有権者1人ひとりのデータを分析し、陰謀論などに影響されやすい人を抽出し特定の候補者に有利な選挙広告を大量に送りました。これは選挙戦を混乱させ「データが民主主義を破壊する」として問題になりました。データサイエンティストには、“公正さ”といった倫理観も強く求められると言えそうです。

社会の気づきにくい課題を発見し、データを裏付けにアイデアを提案するデータサイエンティスト。彼らによって未来の社会はさらに効率化され、あらゆる意思決定がデータに基づいて下される時代が来るのかもしれません。ただ、データが恣意的に使われていないか、導き出された答えに疑問はないか見極めるためにも、我々自身がデータについて知る必要があるのかもしれません。

Q、今後について、専門家は?

データサイエンティスト協会会長の高橋隆史さんに聞いてみました。

「ツールの高度化もどんどん進んでいて、どんどん分析できる環境っていうのが整っています。一般的な分析は多くの人ができるようになってしまうので、よりデータサイエンティストっていうのは高度なことをやっていく必要っていうのが出てくる、各専門性が高まっていく。小売専門のデータサイエンティストですとか、物流専門のデータサイエンティストですとか、そういう形で、ある種専門化が1つ進んでいくのかなと思います」

「社会を変える超頭脳!データサイエンティストって?」#32 相関図