「ChatGPT/ジェネレーティブAI」

Keyword

ChatGPTとは、米OpenAIが開発した対話型AIの名称で、ユーザーの質問にAIがチャット形式で回答するサービス。ジェネレーティブAIとは、学習データを元に創造的なアウトプットを自動生成するAI全般を指す言葉。
テキストを生成できるChatGPTやBard、画像を生成できるMidjourneyやStable Diffusionなど、多種多様なモデルが存在する。

史上最速で1億ユーザーを突破したB2Cウェブアプリ「ChatGPT」

 ChatGPT(チャットGPT)とは、AI研究所の米OpenAIが2022年11月30日にリリースした対話型AIのこと。質問への回答を会話形式で生成するAIチャットボットで、人間と錯覚するほど自然な対話ができると話題になった。ユーザーとの会話履歴を記憶しており、会話の流れを踏まえた回答を生成できるなどの特徴がある。リサーチ結果の要約から旅行プランの作成、プログラミングコードの生成やデバッグ、作詞作曲や小説などのクリエイティブな回答まで、従来のチャットボットよりも広範な回答ができる。ちなみにGPTとは、OpenAIが自然言語AI「Transformer」を元に開発したAIモデル「Generative Pretrained Transformer」の略称で、初代GPTは2018年に登場した。ChatGPTは、2021年までのネット上にある各種情報を蓄積したGPT-3.5をベースとしている。2023年3月14日にはGPT-4が発表され、月額20ドルの「ChatGPT Plus」を通じて提供されている。

▲米OpenAIは2023年3月14日に「GPT-4」を発表、「ChatGPT Plus」を通じて提供を開始した。OpenAIは、2015年末にサム・アルトマン、イーロン・マスクらが設立したAI研究所で、画像生成AI「DALL-E 2」などの開発元でもある。

 スイスUBSのアナリストによれば、ChatGPTはユーザー数の伸びが史上最速のB2Cウェブアプリケーションであり、公開から約2ヶ月後の1月31日時点でユーザー数が推定1億2300万人に達したとされる。アクティブユーザー数が1億人に到達するまでの期間は、Tiktokが約9カ月間、Instagramが約2年半、Facebookが約4年半、Google翻訳が約6年半かかっており、ChatGPTの成長ペースの速さが窺える。ChatGPTは回答が不正確だったり情報ソースが不明確だという指摘もあるが、米ペンシルベニア大学ウォートン校のMBAに合格するレベルの答えを書いたとの報道が出るなど各分野から注目を集めており、このような対話型AIをさまざまなサービスに応用する動きも出てきている。

▲Microsoftは2023年3月17日に「Microsoft 365 Copilot」を発表。すでに対話型AI検索を実装済のBingやEdgeに加えて、WordやExcelなどの作業支援をチャット形式で利用できるGPT-4ベースの対話型AIの実装プランを明らかにした。

 Microsoftは2023年2月7日、検索エンジン「Bing」とWebブラウザ「Edge」に対話型AI検索機能を実装すると発表した。従来のキーワード型検索ではなく、質問をチャットに投げかけるとAIが検索結果を要約する新機能で、GPT4を検索専用にカスタマイズした開発コード名「Sydney」というAIを搭載している。ChatGPTと異なり回答の情報ソースが表示されるため、回答の正確性をユーザー自身が判断しやすい。GPT開発元のOpenAIは2015年末にサム・アルトマン、イーロン・マスクらが設立し、初期から資金提供を続けているMicrosoftと友好関係にあるため、今後Microsoftのサービス群にOpenAIのAI技術が実装されていく可能性が高いとされる。

 Googleも2月6日、自社開発のAI「LaMDA」をベースとした対話型AI検索「Bard」を急遽(きゅうきょ)発表して限定公開した。他にもSnapChatや百度(バイドゥ)をはじめ、国内外でさまざまな企業が類似のAIサービスを発表、公開している。OpenAIもすでに、GPT-4を活用して学生向けAI講師を作成しているKhan Academy、目の不自由な人が世界を移動するための技術を作る会社Be My Eyesなどの組織と提携しており、各分野で対話型AIを実装する流れは今後加速するだろう。

テキスト、画像、動画、音声などを生成できる「ジェネレーティブAI」

 ChatGPTのように、さまざまなコンテンツを生成できるAIは「ジェネレーティブAI」と呼ばれる。米調査会社Gartnerの定義によれば、ジェネレーティブAIとは「コンテンツやモノについてデータから学習して、創造的かつ現実的な、全く新しいアウトプットを生み出す機械学習モデル」のことだ。一般的にAIは膨大なデータを学習するが、ジェネレーティブAIは学習データそのままではない創造的な(ように見える)コンテンツを生成できる点が特徴のひとつだ。ChatGPTのようなテキスト生成だけでなく、画像、動画、音声、3Dモデル、アバター生成など、さまざまなジャンルやタイプのジェネレーティブAIが存在する。

▲米Stability AIは2023年3月17日、画像生成AI「Stable Diffusion」の新機能として、一枚の画像から類似する画像を無限に生成できる「Stable Diffusion Reimagine」を発表した。画像生成を扱うジェネレーティブAIも日々進化を続けている。

 たとえば画像生成AIは2021年頃から話題となっており「Imagen」「Midjourney」「DALL-E 2」「Stable Diffusion」などさまざまなモデルが登場している。英Stability AIが2022年8月23日に一般公開したStable Diffusionは、人間が描いたような画像を数十秒から数分で生成できると話題になり、ユーザーが生成した大量の画像がSNSで拡散した。3Dモデル生成AIでは米NVIDIAが、2D画像からテクスチャ付き3Dモデルを生成する「GET3D」、顔のスキャンから頭部の3Dメッシュを生成する「Lumirithmic」、体の動きからアニメーションを生成する「Move.ai」、360°の映像記録からリアルな製品の3Dモデルを生成する「Elevate3D」などを発表している。これはメタバースやアバター市場の拡大を意識した動きと見られている。また動画生成AIでは、テキストから動画を生成できる「Runway Gen 2」、動画写真や動画に写っている物体や人物、シーンなどを認識して動画を生成できる「PictoryAI」などが登場している。

▲米NVIDIAの「GET3D」は、2D画像からテクスチャ付き3Dモデルを生成するジェネレーティブAIの一種。今後メタバースやアバター市場など、さまざまな分野にこのようなジェネレーティブAIが応用されていく可能性がある。

 創造的なアウトプットを生み出せるというジェネレーティブAIの特徴は、次世代AIの可能性という視点でも注目されている。AIは膨大なデータを学習することで精度が上がるが、現実世界はすべての物事がデータ化されている訳ではない。また、人類が経験したことがない事象のデータはそもそも存在しない。このような領域の課題に対しては、似たような現象における過去データや経験則などを総動員して、予測できる可能性の中から最良の選択肢を"考える"ことが有効だ。ジェネレーティブAIは、より少ない学習データから創造的なアウトプットを"考える"ように生成できるため、次世代AI技術の発展につながる可能性がある。

AI生成コンテンツの増加は、マーケティングにも影響を及ぼす

 Gartnerの予測では、2025年までに社会全体で生成されるデータのうちジェネレーティブAIが生成したデータは10%にまで上昇するそうだ。現時点でもSNSには、AIが生成したテキストや画像があふれつつある。また対話型AIによるチャット型検索の普及などによるユーザー体験の変化も予想される。AI生成コンテンツが大量にデジタル空間に流通する時代に、企業はどのような情報を発信すべきなのか。マーケティング担当者にとっては、ChatGPTなどの短期的な話題だけでなく、ジェネレーティブAIなどの長期トレンドを把握しながら、自社の戦略をアップデートすることが今後さらに重要になっていくだろう。

<参考文献・引用文献>

小塚仁篤(こづか・よしひろ)

ADKマーケティング・ソリューションズ/SCHEMA
クリエイティブ・ディレクター/クリエイティブ・テクノロジスト


mk_koduka_2022

デジタルやテクノロジー分野での経験を武器に、未来志向のクリエイティブ開発やSFプロトタイピングを得意とする。
最近の仕事に、障害者の社会参画をテーマにした「分身ロボットカフェDAWN」、ブラックホール理論が導く”役に立たない未来のプロトタイプ"を空想した「Black Hole Recorder」など。Cannes Lions、D&AD、SPIKES ASIA、ADFEST、ACC、メディア芸術祭、グッドデザイン賞ほか受賞歴多数。クリエイター・オブ・ザ・イヤー2020メダリスト。