【自動運転の未来】商湯科技のR-UniAD技術がヤバい!DeepSeekと激似?上海モーターショーで衝撃発表か!?

周信/文

2025年2月22日、「2025グローバル開発者先駆者会議(GDC)」の商湯大規模モデル生産性フォーラムで、商湯絶影CEO、商湯科技共同創業者、チーフサイエンティストの王暁剛氏が、業界初の「世界モデルと協調的に相互作用するエンドツーエンドのインテリジェント運転ルートR-UniAD」を発表しました。

人工知能技術の進歩を推進する上で、アルゴリズム、計算能力、データは3つの主要な要素です。自動運転分野では、2024年3月から、テスラの「エンドツーエンド」ソリューションが自動車メーカーに認められる主流のインテリジェント運転ソリューションになりました。強力な学習能力と汎化能力、マルチモーダル融合能力、革新的なアプリケーションと機能拡張を備えた大規模モデルは、エンドツーエンドのシステム競争において非常に重要な役割を果たします。

しかし、これまでのエンドツーエンドのインテリジェント運転ソリューションには、依然として多くの問題があります。まず、エンドツーエンドのインテリジェント運転は、本質的に大量の人間の運転データを通じて最適な「模倣」運転効果を実現します。テスラが700万台のインテリジェント運転モデルを保有しているのに対し、中国の各自動車メーカーが市場に投入した高度なインテリジェント運転モデルは少なく、各ドライバーの運転習慣も異なるため、高品質のシーンと運転データに関して弱点があります。

次に、高品質のデータを生成するには、大規模な計算能力インフラストラクチャが必要です。数千万Clipsもの高品質データの回帰には、データストレージ、計算能力リソースなどの面で高い規模のハードルがあります。現在、テスラのGiga Texasデータセンターの計算能力は100 EFLOPSを超えていますが、中国の自動車メーカーとの差は非常に大きいです。

さらに、技術的には、模倣学習のパラダイムでは、インテリジェント運転技術は人間に近づくことはできますが、人間を超えることは困難です。インテリジェント運転技術が人間のインテリジェント運転レベルを超えるためには、上記の3つの側面すべてで人間を超える必要がありますが、中国にはそれを実現できる自動車メーカーやインテリジェント運転会社はありません。

年初のDeepSeekの爆発的な人気は、インテリジェント運転業界に啓示を与えました。大規模モデルのトレーニングが模倣学習から強化学習に移行するというアイデアが広く認識されるようになりました。DeepSeek-R1がもたらした啓示は、少量の高品質データのコールドスタートを通じて、モデルが多段階の強化学習トレーニングを実行し、データ規模のハードルを下げることです。さらに重要なことは、強化学習により、大規模モデルは長い思考チェーン能力を持ち、推論効果が大幅に向上し、人間の思考能力を超える可能性さえあります。同時に、純粋な強化学習トレーニングにより、エンドツーエンドのインテリジェント運転モデルは多様なシーンと運転スタイルを探索できるようになり、最終的に自動運転技術は人間を超えることができます。

公式情報によると、商湯絶影のR-UniADエンドツーエンド技術ルートは、DeepSeekの技術アイデアと同じです。商湯絶影は2023年3月にUniADエンドツーエンド自動運転ソリューションを発表し、2024年11月に「悟り」世界モデルを発表しました。

R-UniADは、高品質のデータコールドスタートを使用して、模倣学習でエンドツーエンドの基本モデルをトレーニングし、次に強化学習法を使用してトレーニングします。小規模サンプル多段階学習技術により、エンドツーエンドの自動運転のデータ要件が1桁減少します。

フォーラムの会場で、商湯絶影は「悟り」世界モデルとメイン車両の閉ループ相互作用の方法を展示しました。シーンライブラリファイルからBEV視点下の初期メイン車両と他の車両の位置をインポートすると、世界モデルはメイン車両視点下の11V(11個のカメラ)センサーシミュレーションデータを自動的に生成し、エンドツーエンドモデルはこのデータを受信した後、メイン車両の次の時刻の位置を生成してフィードバックし、世界モデルは更新されたメイン車両の位置と予測された他の車両の位置に基づいて新しい11Vセンサーシミュレーションデータをレンダリングします。

注目すべきは、高品質のデータを生成するにはより高い計算能力が必要なため、他の競合他社と比較して、商湯絶影の利点は、大規模な計算能力インフラストラクチャとクラウド自動運転大規模モデルの両方を持っていることです。

商湯科技に依存して、商湯絶影が引き出すことができる計算能力は20 EFLOPSに達し、現在の「蔚小理(NIO、理想、

小鹏)」の3つの新興勢力が発表した計算能力データの合計は10 EFLOPS未満です。商湯絶影「悟り」世界モデルの1つのGPUで生成されるシミュレーションデータは、500台の量産車のデータ収集効果に相当し、商湯絶影は5.4万個を超えるGPUを所有しています。

2025年4月に開催される上海モーターショーで、商湯絶影はR-UniADエンドツーエンド自動運転ソリューションを正式に発表し、量産のエンドツーエンドインテリジェント運転ソリューションは今年の年末に納入される予定です。