文 | 王新喜
文 | 王新喜
イーロン・マスク率いる人工知能スタートアップxAIが、最新版のGrok 3大規模モデルを発表!マスクはこれを「地球上で最も賢い人工知能」と豪語!
Grok 3は、なんと20万個ものNVIDIAチップを駆使して開発!その演算能力は前世代の10倍!
xAIのライブ配信では、マスクと3人のエンジニアがデモンストレーションを実施。Grok 3は、数学、科学、プログラミングのベンチマークテストで、Google Gemini、DeepSeekのV3モデル、AnthropicのClaude、OpenAIのGPT-4oを打ち破るという驚きの結果に!
マスクによると、Grok 3は大量の合成データで訓練され、論理的な一貫性を追求。誤ったデータがあれば、それを反省し削除するとのこと。
テストの結果、Grok3はAIME’24数学能力テスト、GPQA科学知識評価、LCB Oct – Febプログラミング能力テストなど、多くのテストでDeepSeekを上回る成績を収めています。「思考の連鎖」推論メカニズムを持ち、人間のように複雑なタスクを段階的に分解できます。パラメータ数は1兆レベル!
Grok3は確かに多くのタスクで優れたパフォーマンスを発揮し、特に複雑なロジックと推論タスクの処理能力は目を見張るものがあります。しかし、Grok3は大量のGPUを使ってランキングのスコアを上げ、数学、プログラミングのスコアは高いものの、それほど大きな差はありません。一方、DeepSeekの強みは、中国語の理解とマルチモーダルなインタラクションにあり、そのパフォーマンスは安定しており、実際のアプリケーションシナリオで多くの検証を得ています。
最も重要な問題は、Grok3のコストが非常に高いことです。計算量は前世代のGrok 2の10倍で、トレーニングコストは30億ドルとも言われています。関係エンジニアによると、xAI傘下のスーパーコンピュータセンターの計算能力はすでに倍増しています。
昨年4月、マスクはxAIが最高のAIを構築するためには、自社でデータセンターを建設するしかないと考えました。Grok 3をできるだけ早くリリースしたかったため、4ヶ月以内にデータセンターを建設することを決定。最終的に、チームは122日かけて最初の10万個のGPUを起動させましたが、理想的なAIを構築するには、クラスタの規模を倍増させる必要がありました。発表会では、チームはわずか92日でスーパーコンピュータクラスタの計算能力を倍増させた、つまりGPUの数が20万個に達したことを明らかにしました。
20万個のGPUはいくら?NVIDIA H100を例にとると、シングルカードの価格は約25,000〜30,000ドル。20万個 × 30,000ドル = 60億ドル(ハードウェア調達コストのみ)。これはGPUハードウェアのコストに過ぎず、実際の展開コストはさらに高く、対応するサーバー、ネットワーク機器、電力、冷却設備などを考慮する必要があり、総コストは数百億ドル規模になる可能性があります。半分にカットしても50億ドル!
Deepseekのトレーニングコストはわずか600万ドルで、GPT-4の7800万ドルをはるかに下回ります。今後、deepseekの資金、人材、リソースが増えれば、総合的な能力はGrok3に劣らないでしょう。
Grok 3、DeepSeekマジ強すぎ案件を証明
これは何を意味するのでしょうか?2つのことを示しています。1つは、マスクがOpenAIよりも多くの計算能力に大金を費やしたにもかかわらず、OpenAIとほぼ同じ製品を作り出したこと。2つ目は、
DeepSeekが本当に強いということです。マスクは大量のドルを燃やして計算能力を積み上げましたが、その効果はハードウェアに依存しており、データから判断すると、DeepSeekとの間に大きな差はありません。DeepSeekは低コスト路線でほぼ互角に戦えるため、DeepSeekが非常に強いことをさらに示しています。
なぜなら、これは2つの異なる路線だからです。1つは、力強くレンガを叩きつけ、力ずくで奇跡を起こし、お金をかけて計算能力を積み上げることであり、もう1つは、革新的なエンジニアリング設計と効率的なトレーニング方法によって、リソースを最適化し、究極のコストパフォーマンスを追求することであり、2つの全く異なる路線です。
そして
計算能力を積み上げるゲームは、AIを米国人が主導する計算能力のリソース配分ゲームにすることです。
米国はGPUチップの輸出を管理することで、世界のAI生産力レベルを正確に調整できます。そして、世界のAI計算能力の獲得を3つのレベルのサークルに分け、それを制御し分配することで、他の国々を絶望に陥れます。
さらに、トランプは5000億ドルを投資して「スターゲート」を建設し、AIのリーダーシップを米国本土にしっかりと固定し、日本、韓国、中東、ヨーロッパなどの関連資金を引き付け、中国を除く他の有力国を米国のAI戦車にしっかりと縛り付けることを目指しています。
一方、DeepSeekはこの支配を打ち破り、他のすべての国にAIの自主開発の希望を与えました。なぜなら、OpenAIモデルと同等の性能を実現するために、相手の5%の計算能力しか必要とせず、低コストモデルで米国のテクノロジー巨人を直接打ち負かしたからです。これにより、すべての国が自分たちにもできると感じるようになりました。なぜなら、これはすべての国が米国の高計算能力GPUチップのリソースに依存する必要がなくなり、コストを大幅に削減できることを意味するからです。
これは、現在資金調達に奔走しているトランプが特に重視している能力です。DeepSeekの登場は、NVIDIA、AMDなどの企業がすぐに参入しただけでなく、トランプも珍しく賞賛しました。彼らの意図は一つです。コストを削減し、社会全体のコストを削減し、国全体を救うことができるからです。
さらに、AI大規模モデルの開発が現在に至るまで、モデルの能力を絶対的に区別することは困難になっています。大規模な指標が収束し続ける中、オープンソースこそが大きな武器です。著名な投資家である朱嘯虎はかつて、オープンソースモデルの基盤はクローズドソースモデルの斬殺ラインであり、今後クローズドソースモデルはオープンソースの2〜3倍の性能を実現しなければ生き残る機会はないと判断しました。さもなければ、10倍のコストをかけても性能が20%しか向上しない場合、シリコンバレーの投資家でさえそのような結果を受け入れないでしょう。
実際に使用してみるとどうなるかは、オープンソースで十分にテストした場合にのみ比較できます。オープンソースでなければ、お金を払って使用する人はおらず、特に優れた点もない場合、ビジネスモデルを確立することは困難です。
さらに、Chatgptとdeepseekの大きな成功の前例があるため、grok1とgrok2はほとんど注目されていません。grok3が単にお金をかけて計算能力を積み上げることで大成功を収め、逆転劇を演じる可能性は高くありません。
オープンソースでなければ、マスクの巨額の投資は収益化できず、自身のロボットとFSDに自己使用される可能性があります。
しかし、テスラFSDのユーザーサブスクリプションは高くありませんが、Grok-3はFSDの競争力を高めることができます。
Grok 3は10万個のNVIDIA H100チップでトレーニングされており、毎秒1.5兆を超えるパラメータを処理でき、車載カメラ、レーダーなどのセンサーデータをリアルタイムで解析できます。競合製品よりも豪雨時の道路の積水深さを認識する精度が37%高く、自動運転システムが周辺環境をより正確に感知するのに役立ちます。
さらに、Grok 3は「思考の連鎖」技術を導入し、人間の段階的な推論プロセスをシミュレートできます。ナビゲーション時にリアルタイムの交通データ、充電ステーションの可用性、ユーザーのスケジュールを総合的に分析してルートを推奨します。自動運転のシナリオでは、複雑な道路状況や交通信号に直面した場合、より合理的で安全な意思決定を行うことができます。
テスラがこれをFSDに使用する場合、電気自動車メーカーのインテリジェントドライビング競争はさらに激化することを意味します。これに対し、中国の自動車メーカーは十分な認識と準備が必要です。
Grok3と比較して、deepseekの利点は、革新的なエンジニアリング設計とアルゴリズムの最適化によって実現された超低コスト、次に、オープンソースモデルのエコシステムと技術最適化能力により、将来、米国を含む多くの研究者が東大のAIモデルで開発を行うようになることです!東大は世界のAI開発の中心地になる可能性があります。さらに、国を挙げてのサポートと、中国の数百の業界が急速に参入し、その継続的な進化を促進し、さまざまな業界との連携と実践を通じて生産性を向上させます。将来の発展の可能性は、Grok3が匹敵できるものではないかもしれません。今後の展開に注目しましょう。