【漫画で解説】注目のバズワード「ジェネレーティブAI」が社会を変える!?

NHK
2023年5月12日 午後11:30 公開

#40「もはや創造主!?ジェネレーティブAIがマジやばい!」の巻

世界に激震 「ジェネレーティブAI」

文字を打ち込めばゴッホやピカソのような絵もほんの一瞬で描くことができる「ミッドジャーニー」や「スティーブル・ディフュージョン」といった画像生成AI。さらに論文を書くことができたり、司法試験まで突破できる「ChatGPT」という全知全能感のある対話式AI。これらの「ジェネレーティブAI」が2022年から大ブームになっています。

今、このビッグウェーブに乗り遅れまいと企業間では競争が激化中!2023年1月には業界をリードするオープンAIにマイクロソフトが100億ドルの超大型投資をするほど熱が入っています。さらに、このAIに文字で指示を出す「プロンプトエンジニア」という新たな職業も生まれていて、ビジネスや仕事のあり方まで一変する可能性も。今回はそんな進化の真っただ中のジェネレーティブAIを超速解説します!

驚異のAI超進化!

Q、そもそもAIってどうやって生まれたの?

実はAIは「人間の脳を人工的に再現できないか」という発想でおよそ70年前に生み出されました。そこからAIがどう進化してきたのか、カレー作りを例に説明します!

①  AI第一世代:特定の問題に対して答えを提示する探索・推論が可能に!

およそ70年前、1950年代~60年代に生み出されたAIでは、特定の問題に対して答えを提示する「探索・推論」が可能になりました。カレー作りでいうと、必要な材料を揃えて、「この材料を使えばカレーができます」というルールをあらかじめ入力。すると集めた材料から作れる料理を自動的に出すことができるようになりました。しかし味の保証がされるとは限りません。

②  AI第二世代:専門分野に特化した受け答えができるエキスパートシステムが実現!

次の段階は、1980年代~90年代、専門分野に特化した受け答えができる「エキスパートシステム」を実現しました。例えば、「肉が厚めの場合は炒めるのに何分」とか、「スパイスの量はこのくらい」とか、カレーを作るための調理法など、カレーの専門家の知識をプログラムに組み込みました。すると、教えた通りのおいしいカレーを作ることができるようになったのです。ただ、別の種類のカレーを作る場合は、新たに専門家を呼んでイチから教える必要がありました。

③  AI第三世代:AI自身が大量のデータを獲得できる機械学習が実用化  

2000年代、AI自身が大量のデータを獲得できる「機械学習」が実用化。人間が色々教えるのは大変なため、AIに自分で学習してもらおうという風に変わっていきました。甘さや酸味などの要素や、具材や調味料のバランスなどの特徴を自動的に学び、「もっとおいしいカレーとは何か」までたどり着けるようになったのです。しかし、ここまではある程度予測可能で、既存の味わいに基づくカレー作りでした。

そして今、このカレー作りが異次元の進化を遂げています!なんと、誰も見たことのないカレーを生み出すというのです。このような感じで、私たちが見たことのない画像をAIが生み出せるようになった、ということです。これが2023年のAIの進化の現在地、「ジェネレーティブAI」です。

創造主!?ジェネレーティブAI誕生物語

実は、ジェネレティーブAIが誕生したのは、いくつかの革新的な技術の出会いがあったからです。始まりは2015年、人工知能研究機関の「オープンAI」が設立されたこと。そこでは対話式AIを作ろうと、膨大な言語や文法を学習させて、人間のように推論させる技術を研究していました。そのころ、AI開発の世界では、「画像をAIに学習させる研究」が進んでいました。オープンAIは、その技術と「言語を学習する技術」を応用すればもっと画像の理解をさせることができるのではないか、と考えました。

つまり、どういうことかというと、画像とセットとなる言葉をどんどんラベル付けし、そのラベル付けされた巨大な表をさらに学習させました。こういった要領で、ありとあらゆる画像と言葉の組み合わせを何十億と学習させます。そうすることで、文字を打ち込めば、ラベル付けされた巨大な表をヒントにジグソーパズルを組み合わせる感じで、見たことのない画像を生成することができるようになりました。

2つの技術が生んだ画像生成AI

この技術をもとに2021年1月に誕生したのが「DALL・E(ダリ)」という画像生成AIです。「これは大きな一歩だ」と話題になりましたが、オープンAIの研究者たちはもっと高精度な画像を生み出せるのではないかと考えていました。そこで目をつけたのが、スタンフォード大学の研究チームが開発していた「ディフュージョンモデル」という技術です。どういうものなのか、粗い画像のVHSと、それをきれいにしたデジタルリマスター版の例え話でわかりやすく説明します!

デジタルリマスター版を少しずつ粗くしたものと、もう一度きれいなデジタルリマスター版に戻していく過程を全部学習させます。そして別の粗い画像を放り込むと、AIが勝手に『元はこんなにきれいな画像だったのでは?』と学習したデータをもとに新しい高精度の画像を作ってくれます。これが「ディフュージョンモデル」の考え方なんだそうです。

文字から画像を作れる「DALL・E(ダリ)」と、キレイな画像を作れる「ディフュージョンモデル」が出会い、ついに誕生したのが、文字から高精度の美しい画像を作れる画像生成AI「DALL・E2(ダリ・ツー)」です。

誰でも使えるお絵かきAIが大ブームに

2022年7月、サンフランシスコで起業したスタートアップが「Midjourney(ミッドジャーニー)」という画像生成AIを公開。このAIは一般ユーザーでも利用できるものでした。そのことから世界中で瞬く間に大人気になり、AIお絵かきブームが到来したのです。

さらに、8月には画像生成AIのビッグバンとも言える出来事が起こります!イギリスのスタートアップが一部の研究者やエンジニアしか触ることのできなかったソースコードを全世界に無料で公開し、それを使えば誰でも画像生成AIのアプリを作れるようになったのです。すると、パソコンだけでなくスマホでも手軽に使える画像生成AIアプリが雨後の竹の子のごとく誕生!身近なところでも目に触れるようになってきています。

新たな職業も誕生!「プロンプトエンジニア」って?

しかし、キーワードを入れるところに、やみくもに文字を入れれば思い通りの画像が生成されるわけではありません。重要なのは、「プロンプト」と呼ばれる指示文です。プロンプト(指示文)を作成して新たなコンテンツを生み出す「プロンプトエンジニア」という専門職も生まれています。これが〝稼げる仕事〟として、とても注目されているのです。すでにアメリカではプロンプトエンジニアの求人マッチングサイトまで登場。「SNSをバズらせる画像」や「クライアントに大ウケする斬新なデザイン」などの案件が高額で募集されています。

Q、どうやってAIを使いこなすの?

画像生成AIを使いこなしているというデジタルハリウッド大学大学院の白井暁彦客員教授にコツを教えてもらいました。

例えば、このように「girl(女の子)」とだけ入力するとイメージした画像はできませんが、そこに服装や場所、どんな画風かなど具体的な指示を付け加えていきます。

① シチュエーション

まずは、「girl in a cafe(カフェにいる女の子)」のようにシチュエーションを追加します。

② 対象のディテール

次に、「girl with red skirt and smartphone ,in a cafe.(スマートフォンを持った赤いスカートの女の子がカフェにいる)というように対象のディテールを足していきます。

③ 画角やサイズ

さらに、「portrait(人物を強調)」というように画角やサイズを追加します。

➃ 画像のタッチ

さらに、画像のタッチを追加し、画家のミュシャ風に。

「girl with red skirt and smartphone, in a cafe, portrait, by Alfons Mucha(ミュシャ風に描かれた、カフェにいるスマートフォンを持った赤いスカートの女の子)」というように、シチュエーション、対象のディテールなど4つの指示を行うと、絵を自ら直すことなく、たった40秒で完成させることができました。

このように文字を入れるだけで新しいものをどんどん生み出せますが、生み出せるもののクオリティはプロンプトしだいということです。

Q、対話式AI「ChatGPT(チャット・ジー・ピー・ティー)」とは?

ジェネレーティブAIの進化は止まらず、世界を驚かせているのが対話式AIの「ChatGPT」です。ビジネスシーンで大きく広がっており、企画書やプレゼン資料、レジュメの作成、さらにプログラミングのコードまで書けちゃうっていうから驚きですよね。

ただ、優秀過ぎるがゆえに、アメリカでは司法試験や医師免許試験を受けて合格点を取得するという事態が起きています。さらにアメリカの学校では、小論文や数学などの課題をChatGPTにやらせるといったケースが発生。ニューヨークでは生徒の学習能力に悪影響を及ぼすとその使用を禁止しました。

東京大学大学院工学系研究科の松尾豊教授に、ChatGPTについて聞いてみました。

【東京大学大学院 松尾豊教授】

「近い将来、文章を人間は書かなくなる。要するに要点だけ言って、AIに書いてもらってチェックするっていうふうになってくると思うんですよね。そうすると昔は文章って一言一句人間が書いていたんだよって言うと若い人はみんなびっくりするみたいな。そういうふうになるんじゃないんですかね。」

Q、AIはどこまで進化するの?

実は今、進められている研究が、データのない世界でも活躍できる「脱データ化」したジェネレーティブAI。これが実現すると、少ないデータからあらゆるシミュレーションが可能になります。例えば、これまで開発に10年かかっていた新薬の開発が短期間でできたり、100年に一度の確率で起こる気象現象の予測ができたり、人間には不可能だったことができるようになるかもしれません。一方で、情報の信頼性はどうなのか、サイバー犯罪や差別・偏見などにつながらないか、慎重に見極める必要もあります。

将来人間はAIとどう付き合っていけばいいのか、松尾教授とAIにその未来について聞いてみました。

【東京大学大学院 松尾豊教授】

「もう次の時代に入ったんですよ。なので、もう戻らないです。新しい時代をどうやって生きていくのか。自分が何をやりたいのかとか、誰とやりとりしたいのかとかそういった意志をしっかり持っておくというのがすごく大事だと思いますね。」

【対話式AI ChatGPT】

「ジェネレーティブAIは、将来的に私たちの生活の中で重要な役割を果たすことが予想されます。例えば、芸術や医療の分野で利用が進むかもしれません。ただし、私たちはAIを慎重に利用し、常にその責任を持つ必要があります。」

人間の脳を人工的に作ろうという試みからおよそ70年。今やAIは、私たちが見たことのないものまで創造できる領域に達しています。AIと共に生きることが当たり前になりつつある現代、AIは私たちに「何がやりたいのか?」「どう生きていくのか?」という人間の本質について問いかけているように思えてきませんか?