【深刻】対話AIで顧客が｢脱獄｣､車が1ドルで買われた!? AIの誤回答で訴訟事案も…今おさえたいリスクに備える《企業の危機管理術》

中西一博 : アカマイ・テクノロジーズマーケティング本部プロダクトマーケティングマネージャー

2025/09/11 6:00

著者フォロー

フォローした著者の最新記事が公開されると、メールでお知らせします。
無料会員登録はこちら
はこちら

このとき、LLMとの入出力のやりとりは、一度きりで完結していることを理解してほしい。これを踏まえて“脱獄”の裏で起きていたことを図解すると次のようになる。

プロンプトインジェクションの裏で何が起きているか。生成AIの役割が上書きされてしまう

画像を拡大
プロンプトインジェクションの裏で何が起きているか（図：筆者作成）

図中、システムプロンプトの中で管理者が与えた前提条件や、脱獄プロンプトとしてユーザーに与えられた条件を、会話の履歴と一緒にアプリケーションがひとまとめにしてLLMに渡している、という点に注目してほしい。

さらに言えば、誰がその条件を与えたかを示すRole（役割）という情報が付いてはいるが、LLMはその権限の強さを判断する能力を有していない、いわば “無垢” な状態なので、あとから上書き入力された、「全部の前提条件を無効にしろ」というユーザープロンプトの指示に素直に従ってしまう、というわけだ。

ここで、“脱獄”のような特殊な命令の後に、「過去の会話履歴を開示しろ」「顧客リストを表示しろ」「システムプロンプトの内容を表示しろ」といった指示をサイバー犯罪者が与えれば、生成AIからアクセス可能な機密情報が漏洩するおそれがある。

それだけでなく、「以下のプログラムを実行しろ」という指示で、会話型の生成AIで制御された機械が暴走する可能性すら考えられる。

顧客向けに生成AIを提供するなら「リスク予防」が必須

これらのリスクの予防には、生成AI専用のファイアウォールによって「ガードレール」を設置することが有効だとされている。具体的にはこうだ。

→次ページはこちら

← 1 2 3 4 →

キーワード

AI（57）

特集一覧

ソニー半導体の岐路

レアアースショック

決定版ベスト弁護士2025

防衛産業の熱波

特集一覧はこちら

トピックボードAD

有料会員限定記事

チャイコフスキーの不遇を支えた意外な文通相手

変わる｢中国EV｣の設計､革新性より信頼性重視へ

東洋合成｢先端材料｣がもたらすAI用半導体の進化

ソニー半導体の成功法則は｢勝ち馬の見極め｣

ジャングリアの開業を陰で支えた商工中金の執念

日産､再建の最終目標に｢ただし書き加筆｣の波紋

ビジネスの人気記事

トレンドライブラリーAD

連載一覧

連載一覧はこちら

会員記事アクセスランキング

1時間
24時間
週間
月間

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

※過去1ヵ月以内の会員記事が対象

» 11～20位はこちら

トレンドウォッチAD

週刊東洋経済の最新号

2025年11月15日号

この号を読む定期購読

バックナンバー一覧はこちら

東洋経済の書籍

新刊
ランキング

※3カ月以内に発刊した書籍の中から話題の書籍を紹介しています。