用強(qiáng)化學(xué)習(xí),叩開(kāi)開(kāi)智駕的門(mén)!

具備自主預(yù)判性,才是真正的智能輔助駕駛。
一萬(wàn)年太久,只爭(zhēng)朝夕。高階智能駕駛輔助正駛在發(fā)展的快車(chē)道上,技術(shù)迭代幾乎在以一年一大版本的節(jié)奏演化著。頭部玩家們2023年開(kāi)推“無(wú)高精地圖”路線(xiàn),24年主講“端到端”故事,25年則流行起了“世界模型”。
而當(dāng)版本迭代到“世界模型”后,駕駛輔助終于開(kāi)始展現(xiàn)出真正的智能,因?yàn)橄到y(tǒng)被賦予了自主預(yù)判的能力,它開(kāi)始變得像一個(gè)擁有自主意識(shí)的人類(lèi)了。

智能駕駛系統(tǒng)利用高清攝像頭、激光雷達(dá)、毫米波雷達(dá)等感知硬件探測(cè)出周?chē)沫h(huán)境,在理解了外面的世界后,汽車(chē)才能在做出通行策略,并執(zhí)行正確操作。
但外界環(huán)境對(duì)于智能駕駛系統(tǒng)來(lái)講,還是過(guò)于復(fù)雜了。不同特征的道路規(guī)劃、不受控的行人、不規(guī)則的車(chē)輛、不可控的天氣狀況等,都是不確定因素,造成的結(jié)果就是,未知“極端個(gè)例”永遠(yuǎn)海量般地存在著。身陷在一個(gè)個(gè)新的Coner case中,智能駕駛自然就成了“人工智障”。

端到端智能輔助駕駛縮短了程序鏈路,尤其一段式的端到端,把感知、決策、執(zhí)行環(huán)節(jié)整合進(jìn)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)之中,一定程度上提高了系統(tǒng)的應(yīng)對(duì)效率,因此被認(rèn)為更具泛化、適應(yīng)能力。
但如果智能駕駛的底層邏輯仍停留在“規(guī)則主導(dǎo)”上,依靠數(shù)據(jù)投喂,覆蓋新的個(gè)例場(chǎng)景,并制定應(yīng)對(duì)的規(guī)則,就永遠(yuǎn)是在進(jìn)行一種“填鴨式”的被動(dòng)學(xué)習(xí)。
這個(gè)過(guò)程中,不僅海量的數(shù)據(jù)冗余帶來(lái)標(biāo)注負(fù)擔(dān)和算力浪費(fèi),還永遠(yuǎn)無(wú)法完全覆蓋所有“極端個(gè)例場(chǎng)景”。駕駛關(guān)乎人身安全,一般情況下,不允許妥協(xié),而陷入“龜兔悖論”中,也就意味著永遠(yuǎn)達(dá)不成真正的智能駕駛。

真正的駕駛,并不應(yīng)該是看到信息后機(jī)械似地做出被動(dòng)應(yīng)對(duì),而是結(jié)合過(guò)往經(jīng)驗(yàn),理解所處的環(huán)境,在大腦中形成提前的預(yù)判,或做出靈活的應(yīng)變。
這恰是面對(duì)未知的極端場(chǎng)景,系統(tǒng)與人類(lèi)的本質(zhì)區(qū)別所在,而預(yù)見(jiàn)性的自主判斷和靈活的決斷,正是世界模型期許到達(dá)的未來(lái)。
例如在蔚來(lái)最近發(fā)布的NWM世界模型中,系統(tǒng)每0.1秒可生成超200種的可能軌跡,并且會(huì)在下一幀信息輸入后,篩選最佳路徑,這個(gè)過(guò)程其實(shí)就是在模擬人類(lèi)駕駛員“反復(fù)評(píng)估—微調(diào)—決策”行為。

世界模型這種生成式人工智能如此特別,在于其可以“反事實(shí)推理”。系統(tǒng)不僅被動(dòng)地接受我們賦予的限制條件和對(duì)應(yīng)決策,還能夠思考如何類(lèi)似、但還未實(shí)際經(jīng)歷的情況下,做出合理的決策。
系統(tǒng)就像一個(gè)開(kāi)始萌發(fā)自主意識(shí)的孩童,不光觀察、學(xué)習(xí)著周遭世界,還在執(zhí)行、模仿之余,擁有“舉一反三”的思考能力,去主動(dòng)探索這個(gè)世界。

特斯拉FSD入華后,雖然出現(xiàn)了很多適配性方面的問(wèn)題,如看不懂交通標(biāo)識(shí)、占用非機(jī)動(dòng)車(chē)道等,但體驗(yàn)過(guò)FSD的業(yè)界大佬,都不約而同地認(rèn)可特斯拉是當(dāng)下最成熟的智能駕駛,駕駛得很絲滑。
特斯拉給人的感覺(jué)是,它像個(gè)不太熟悉中國(guó)交規(guī)、路況的老外,經(jīng)常出錯(cuò),啼笑皆非。但它又確實(shí)是懂怎么開(kāi)車(chē)的,是當(dāng)下最接近人類(lèi)駕駛員的智駕系統(tǒng)。

特斯拉很少紕漏其智能駕駛方面的技術(shù)細(xì)節(jié),但可以確定的是,特斯拉很早便開(kāi)始利用高效的大模型,來(lái)加速數(shù)據(jù)驅(qū)動(dòng)下的系統(tǒng)進(jìn)化,這其實(shí)也是行業(yè)頭部玩家們都在角力的賽道。
2025年CVPR輔助駕駛國(guó)際挑戰(zhàn)賽“端到端輔助駕駛”賽道,NVIDIA輔助駕駛應(yīng)用研究團(tuán)隊(duì)通過(guò)泛化軌跡評(píng)(GTRS)方法連續(xù)奪魁。
這次挑戰(zhàn)賽的主題恰是“實(shí)現(xiàn)通用的具身系統(tǒng)”,也即基于數(shù)據(jù)驅(qū)動(dòng)的非反應(yīng)式輔助駕駛仿真框架,NVIDIA泛化軌跡評(píng)(GTRS)方法的核心正是生成各種軌跡,并逐步篩選出最佳路徑。

基于感知到的環(huán)境,GTRS可擴(kuò)散性地創(chuàng)建出涵蓋各種情況的粗略軌跡集和適用于安全關(guān)鍵情況的細(xì)粒度軌跡集,然后利用依賴(lài)感知數(shù)據(jù)訓(xùn)練出的Transformer解碼器,捕捉相似軌跡之間細(xì)微但關(guān)鍵的差異,逐漸篩選出最具可能性的候選軌跡。

其實(shí)早在CES 2025上,NVIDIA發(fā)布的Cosmos?便是一個(gè)為具身智能打造的集成平臺(tái),整合了前沿生成式世界基礎(chǔ)模型的各個(gè)環(huán)節(jié),用于加速數(shù)據(jù)處理和管理,目的就是為世界模型訓(xùn)練提供支持,加速智能汽車(chē)、機(jī)器人的物理AI開(kāi)發(fā)。
當(dāng)強(qiáng)化學(xué)習(xí)的效率被提高,智能駕駛終于開(kāi)始展現(xiàn)出“所有AI項(xiàng)目之母”的潛力,雖然曾經(jīng)這么認(rèn)為的蘋(píng)果CEO蒂姆·庫(kù)克早已經(jīng)放棄了造車(chē)。

世界模型遠(yuǎn)不是自動(dòng)駕駛的終點(diǎn),需要解決的問(wèn)題有很多,例如模型訓(xùn)練時(shí)長(zhǎng)、構(gòu)架精度優(yōu)化等,不同玩家間的路線(xiàn)和策略也很不同,以“蔚小理”為例:
蔚來(lái)NWM的核心是模型重建,結(jié)合視頻自監(jiān)督方式生成軌跡;小鵬的XVLA側(cè)重高頻閉環(huán)訓(xùn)練來(lái)加快車(chē)端部署和提升用戶(hù)體驗(yàn);理想MindVLA則強(qiáng)調(diào)了語(yǔ)言模型與擴(kuò)散建模的融合,很獨(dú)特的側(cè)重點(diǎn)。

但隨著世界模型等推動(dòng)強(qiáng)化學(xué)習(xí)的效率提升,底層的技術(shù)在加速迭代,最終也會(huì)反應(yīng)在表層的產(chǎn)品體驗(yàn)上。
曾經(jīng),參加廠家有關(guān)智能駕駛的試駕體驗(yàn),多少是有些抗拒的。在我眼中,用著依賴(lài)高精地圖的智駕版本,行駛在廠家規(guī)劃好的單調(diào)路線(xiàn)上,和乘坐“有軌電車(chē)”的區(qū)別也不算明顯,味如嚼蠟。
現(xiàn)在,汽車(chē)面對(duì)未知環(huán)境時(shí)生成無(wú)數(shù)模擬線(xiàn)路,并根據(jù)實(shí)時(shí)信息選擇或是調(diào)整最優(yōu)路線(xiàn)的方式完全不同,有些像奇異博士,可以看到無(wú)數(shù)條未來(lái)的時(shí)間線(xiàn),并選擇最優(yōu)解的那一個(gè),酷的。

沒(méi)錯(cuò),汽車(chē)通過(guò)強(qiáng)化學(xué)習(xí),擁有自主預(yù)判性,開(kāi)得更像人類(lèi),而不是按照既定規(guī)則去機(jī)械死板地行駛,很重要。
不久前,連續(xù)體驗(yàn)了三款不同品牌、價(jià)位、感知策略的車(chē)型,實(shí)際感受大相徑庭。其中兩款價(jià)位相近、同為純視覺(jué)感知、主打“科技平權(quán)”的產(chǎn)品:
搭載德州儀器TDA4 VH智駕芯片(官方未明確公開(kāi)信息,可能旗艦版搭載3顆TDA4 VH,等效96TOPS算力)的桂B(yǎng)車(chē)型,在用戶(hù)體驗(yàn)的完成度上,主要是最體現(xiàn)智駕功力的領(lǐng)航輔助駕駛功能,尚不及接手自滴滴、換裝2顆NVIDIA Orion-X智駕芯片、等效508TOPS算力的新勢(shì)力粵A車(chē)型(尤其該車(chē)與路上其他車(chē)輛進(jìn)行路權(quán)博弈時(shí),竟有點(diǎn)人類(lèi)駕駛的味道了)。

花小錢(qián)、辦大事,采用高性?xún)r(jià)比智駕硬件,推動(dòng)“科技平權(quán)”,并在泊車(chē)等方面帶來(lái)切實(shí)好用的功能,不失為一種成功的產(chǎn)品策略。
但如果想把“科技平權(quán)”貫徹到底,基于前沿硬件的高昂研發(fā)投入是必要的。智能駕駛走向普及,性能向上的突破與價(jià)格向下的普惠,相輔相成,缺一不可。
實(shí)際上,桂B(yǎng)廠商也已經(jīng)在規(guī)劃了,在技術(shù)進(jìn)化日上宣布,將會(huì)在未來(lái)采用NVIDIA Thor芯片,并加快大模型的上車(chē)與提高數(shù)據(jù)驅(qū)動(dòng)的效率。

而首搭700TOPS算力的NVIDIA Thor芯片、多模態(tài)大語(yǔ)言模型、激光雷達(dá)和高清攝像頭,則可以快速賦予一臺(tái)售價(jià)30萬(wàn)元以上的自主大型SUV該有的智能化水準(zhǔn)。
但拿到Thor芯片流片用來(lái)匹配、開(kāi)發(fā)的時(shí)間還是太短了,僅僅一個(gè)多月,所以就用戶(hù)體驗(yàn)而言,還需OTA升級(jí)幾個(gè)版本后,這臺(tái)杭州灣品牌的旗艦SUV才能達(dá)到令人滿(mǎn)意的成熟度。

對(duì)于智能駕駛輔助,硬件基礎(chǔ)依然是必要的,但不能確保帶來(lái)優(yōu)秀的用戶(hù)體驗(yàn),這就像一些復(fù)雜、優(yōu)質(zhì)的食材要經(jīng)過(guò)大廚的精心烹飪,才會(huì)是美味佳肴。而這,是個(gè)爭(zhēng)先、投入、探索、迭代的過(guò)程。
特斯拉自研的HW3.0系統(tǒng)在2019年便擁有了144TOPS算力與高清攝像頭。蔚來(lái)2022年在ET7上落地了1016TOPS的智駕算力與激光雷達(dá)。小鵬也是最早在緊湊級(jí)家用車(chē)上部署激光雷達(dá),雖然現(xiàn)在開(kāi)始轉(zhuǎn)為“純視覺(jué)+高算力”為主的路線(xiàn)。

大模型的更新與智駕芯片算力的軍備競(jìng)賽還在被推向新高,小鵬正在研發(fā) 720 億參數(shù)的基座模型,大約是當(dāng)下主流VLA模型的35倍,并構(gòu)建了一個(gè)相當(dāng)于萬(wàn)卡集群的10EFLOPS算力的超算中心。
小鵬G7搭載3顆圖靈AI芯片,算力達(dá)到2200+TOPS。蔚來(lái)自研的5納米神璣NX 9031芯片的流片在2024年實(shí)現(xiàn)了流片。特斯拉HW5.0芯片算力也可能達(dá)到2500TOPS。

高度自定義硬件底層的高算力自研智駕芯片,與超算中心和強(qiáng)化學(xué)習(xí)模型,組出了駛向完全自動(dòng)駕駛的車(chē)具。
基于“高算力+高感知”積累下的有價(jià)值的數(shù)據(jù)喂養(yǎng),經(jīng)過(guò)端到端、世界模型等先進(jìn)模型的強(qiáng)化學(xué)習(xí),讓智駕頭部玩家們可以展現(xiàn)出領(lǐng)先的體驗(yàn)與可期待性。
后來(lái)者切換或者構(gòu)建出自身智駕體系時(shí),可能會(huì)還要面對(duì),一邊經(jīng)歷著初期有效數(shù)據(jù)和訓(xùn)練量偏少而造成的體驗(yàn)波動(dòng),一邊看著“早鳥(niǎo)們”極速向前迭代。

很有趣,這種先發(fā)優(yōu)勢(shì),有點(diǎn)類(lèi)似于歐洲車(chē)企們?cè)诘妆P(pán)調(diào)校方面的積淀與造詣。就像法系可以把扭力梁調(diào)好、保時(shí)捷能把麥弗遜玩出花活,特斯拉和一些自主品牌也在智能化方面展現(xiàn)先出獨(dú)到優(yōu)勢(shì),輔之與供應(yīng)鏈的良好合作,這會(huì)是智能電動(dòng)時(shí)代定義領(lǐng)先的新能力。
本文作者為踢車(chē)幫 孫小樹(shù)
聲明:本文由太平洋號(hào)作者撰寫(xiě),觀點(diǎn)僅代表個(gè)人,不代表太平洋汽車(chē)。文中部分圖片來(lái)源網(wǎng)絡(luò),感謝原作者。
3.44萬(wàn)
06-22
分享相關(guān)推薦

79
11-07
55
11-06
70
11-06
134
11-05
1880
11-04
108
11-03
82
10-24
1450
10-16
1490
10-16
2166
10-14