
推論性能を向上させながら、コストを削減(写真:エヌビディア)
ここ数年、好況に沸いてきた半導体業界が曲がり角にさしかかっている。本特集ではトランプ関税の影響や変調を来すAI投資の動きを追った。
「私の結婚式で1つのテーブルに家族7人が着くんだけど、どんな配置が望ましいか教えてくれる?」
3月に開かれたエヌビディアの技術コンファレンスで行われたデモは、観衆の注目をひときわ集めた。結婚式の座席配置に関する質問に対し、伝統的なLLM(大規模言語モデル)は439トークン(AIが処理するデータの基本単位)で済んだが、望ましい答えではなかった。しかし、理由を導く推論モデルだと8559トークンを費やし時間がかかったものの、理想の座席プランを提示した。
複雑な運用をさばくAIの「OS」
トピックボードAD
有料会員限定記事
無料会員登録はこちら
ログインはこちら