有料会員限定

中国への半導体制裁がますます強化される必然 DeepSeekはアメリカに大きな「教訓」を与えた

✎ 1 ✎ 2
著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

有料会員限定記事の印刷ページの表示は、有料会員登録が必要です。

はこちら

はこちら

縮小
中国のAIパワーを目の当たりにして、アメリカの企業や政府はどのような策を講じるのか(写真:ブルームバーグ)

特集「DeepSeekの衝撃」の他の記事を読む

ハイテク株が一斉に暴落したDeepSeekショック。それから2週間ほど経過した日本ではDeepSeekを巡るニュースが一段落した感があるが、アメリカでは議論が深まる一方のようだ。ステルス戦闘機さながらの中国のAIパワーを目の当たりにして、アメリカの企業や政府は今後、どのような策を講じるのか。アップルで長年、独自半導体設計に携わり、現在はAI半導体のスタートアップ・テンストレントでトップ設計者を務める台湾人エンジニア、ウェイハン・リエン(Wei-han Lien)氏に聞いた。

制裁が中国のAIを鍛えた

――DeepSeekの出現でエヌビディアの株が暴落しました。エヌビディアが作る高性能のGPUがなくても、優れたAIを開発できるという可能性をDeepSeekが示したからです。なぜDeepSeekはこのようなブレークスルーを達成できたのでしょうか。

アメリカの制裁がある中、中国にとっては最高性能のGPUを使ってAIを開発することは非現実的です。この制約を受けて、中国はAIモデルのイノベーションを試みてきました。その成功例がDeepSeekです。DeepSeekは「AIには最高性能の半導体が必ず必要というわけではない」という事実を、誰の目にも明らかにしたのです。

Wei-han Lien/AI半導体スタートアップ・テンストレントのチーフアーキテクト兼シニアフェロー。ミシガン大学AMDでインテルを猛追したCPU・K6の開発チームに参加。その後、アメリカのPAセミではアメリカ国防総省国防高等研究計画局(DARPA)の大陸間弾道ミサイルシステムに使われるCPUの開発を主導。PAセミを買収したアップルでは、iOS用の独自半導体であるAチップを開発した(写真:本人提供)

DeepSeekやChatGPTのようなLLM(大規模言語モデル)のAIはパラメーター(正確な結果を出すためのプログラム内の変数)数が膨大なものになっています。パラメーター数が増えると計算量が大きくなり、より大規模な計算資源を必要とするため、アメリカの主なAI企業はより高性能のGPUを大量に使うようになっています。

ところが中国のDeepSeekはGPUを入手する上で制約があるため、全く違う道を選びました。AIモデルを複数の「エキスパート(専門家)」に分割するMoE(Mixture-of-Experts)という方法です。DeepSeekの場合は全体を256のエキスパートに分割しており、何かが入力されると、そのうち56のエキスパートが計算処理に当たるのです。

これによってデータ計算量は全体が1つであった場合のおよそ12分の1にまで圧縮でき、さほど高性能ではないGPUでも遜色のない性能を出せるようになったのです。

MoEは決してDeepSeekの発明でも何でもなく、多くのAI開発者が理解していました。しかしこれまでアメリカではMoEのめざましいブレークスルーが起こらなかった。その理由は、アメリカのハイテク企業には豊富な計算資源があったからです。

例えばイーロン・マスクのxAIは、ハードウェアを調達する予算にほとんど制約がありません。そういったアメリカ企業にとっては計算量を最適化することよりも、計算資源への負荷が大きくてもより強力で速いモデルを作ることの方が優先課題になってきたのです。

これに対して中国はアメリカの制裁によって追い込まれ、十分な計算資源を構築できなかった。だからAIモデルのイノベーションによって、計算量そのものを最適化するしかなかったのです。

次ページアメリカへの「ウェイクアップコール」
関連記事
トピックボードAD