生成AIのメリットだけに注目する局面は終わった 進化の速さに制度が追いついてこない現実

拡大
縮小
キーボードを打つ手
生成AIの進化はとどまるところを知らないが、一方で問題も抱えている(写真:Supatman/PIXTA)
2023年におけるAIの話題は、もっぱらChatGPTをはじめとする「生成AI」が中心であった。2024年に入ってからは、非常にリアルな動画を生成する「Sora」の登場や、GPT-4を超えるとも言われる「Claude 3」の登場で、その進化はとどまるところを知らない。
本記事では、生成AIがどのようにビジネスを進化させるかを描いた『AIナビゲーター2024年版』の筆者の1人で、NRIデジタルエキスパートデータサイエンティストの阿部将大氏が、活用範囲を広げる生成AIが一方で抱えている問題点について解説する。

テキストに限らない生成AIの広がり

『AIナビゲーター2024年版』書影
『AIナビゲーター2024年版:生成AIの進化がもたらす次世代ビジネス』(書影をクリックすると、アマゾンのサイトにジャンプします。紙版はこちら、電子版はこちら。楽天サイトの紙版はこちら、電子版はこちら

OpenAIがリリースしたChatGPTは、まるで人と会話しているかのような流暢なテキストを生成できることから、非技術者にも非常に注目を浴びることになった。ChatGPTの登場からすでに1年以上経っているが、LLM(大規模言語モデル)に代表される生成AIモデルの開発や活用に関する話題はとどまるところを知らない状況である。

最近のトピックとして、盛り上がりを見せているのは「マルチモーダルLLM」であろう。従来のLLM入出力はテキストに限られていたが、さまざまな形式のモダリティ(情報)を扱うことができる大規模モデルの開発が進んでいる。具体的には画像、動画、音声などの多様なモダリティが含まれる。各モダリティ単体に特化したモデルは以前から研究されており、それらのモデルのエンコーダー(符号器)と呼ばれる特徴抽出器を組み合わせてさまざまなモダリティを扱うことができるのである。

入力情報にテキスト以外を用いることができるようになると、生成AIの活用範囲は大きく広がることになる。

次ページ従来の技術の組み合わせによる精度の向上
関連記事
トピックボードAD
キャリア・教育の人気記事
トレンドライブラリーAD
連載一覧
連載一覧はこちら
人気の動画
【田内学×後藤達也】新興国化する日本、プロの「新NISA」観
【田内学×後藤達也】新興国化する日本、プロの「新NISA」観
【田内学×後藤達也】激論!日本を底上げする「金融教育」とは
【田内学×後藤達也】激論!日本を底上げする「金融教育」とは
TSUTAYAも大量閉店、CCCに起きている地殻変動
TSUTAYAも大量閉店、CCCに起きている地殻変動
【田内学×後藤達也】株高の今「怪しい経済情報」ここに注意
【田内学×後藤達也】株高の今「怪しい経済情報」ここに注意
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
会員記事アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
トレンドウォッチAD
東洋経済education×ICT