
推論性能を向上させながら、コストを削減(写真:エヌビディア)
ここ数年、好況に沸いてきた半導体業界が曲がり角にさしかかっている。本特集ではトランプ関税の影響や変調を来すAI投資の動きを追った。
「私の結婚式で1つのテーブルに家族7人が着くんだけど、どんな配置が望ましいか教えてくれる?」
3月に開かれたエヌビディアの技術コンファレンスで行われたデモは、観衆の注目をひときわ集めた。結婚式の座席配置に関する質問に対し、伝統的なLLM(大規模言語モデル)は439トークン(AIが処理するデータの基本単位)で済んだが、望ましい答えではなかった。しかし、理由を導く推論モデルだと8559トークンを費やし時間がかかったものの、理想の座席プランを提示した。
複雑な運用をさばくAIの「OS」
記事全文を読むには有料会員登録が必要です。
(残り 1105文字 です)
ログイン(会員の方はこちら)
有料会員登録
【9/30(火)まで】 年額プラン2,000円OFFクーポン 配布中!
詳細はこちらから
トピックボードAD
有料会員限定記事
無料会員登録はこちら
ログインはこちら