訂閱
糾錯(cuò)
加入自媒體

智駕終局還是營(yíng)銷(xiāo)亂局?

技術(shù)演進(jìn)的腳步已經(jīng)超越了消費(fèi)者的認(rèn)知速度,國(guó)內(nèi)智駕的一汪池水已然是波濤洶涌。

從今年年初開(kāi)始,習(xí)慣于造詞的汽車(chē)行業(yè)炒熱了一個(gè)新詞——“端到端”,并且以前所未有的頻率反復(fù)在消費(fèi)者的耳朵里磨繭。造詞是企業(yè)的事,但解釋都交給了銷(xiāo)售。

從各大品牌的培訓(xùn)話術(shù)中,幾乎所有的銷(xiāo)售都把“端到端”智駕用AI一言以蔽之。“我們最新的智駕系統(tǒng)用了AI技術(shù),是目前最強(qiáng)的。”

馬斯克曾介紹端到端End-to-End Deep Learning(端到端深度學(xué)習(xí))的能力,稱之為“圖像端輸入,控制端輸出”。以此為基礎(chǔ),特斯拉在美國(guó)推出了自動(dòng)駕駛系統(tǒng) FSD v12.3 的版本,廣受好評(píng)。

這個(gè)好評(píng)不僅僅來(lái)自于美國(guó)用戶,更來(lái)自于在國(guó)內(nèi)汽車(chē)新勢(shì)力的大佬們。

小鵬汽車(chē)何小鵬表示,去美國(guó)測(cè)試了特斯拉FSD,很絲滑。

小米公司副董事長(zhǎng)林斌表示,去美國(guó)測(cè)試了特斯拉FSD,很絲滑。

華為終端BG董事長(zhǎng)余承東說(shuō),派團(tuán)隊(duì)去美國(guó)測(cè)試了特斯拉FSD,發(fā)現(xiàn)華為智駕遙遙領(lǐng)先。

無(wú)論嘴上態(tài)度如何,在特斯拉之后,所有車(chē)企都開(kāi)始大手筆投入,將未來(lái)自動(dòng)駕駛的方向瞄準(zhǔn)“端到端”。

辰韜資本聯(lián)合三方發(fā)布的《端到端自動(dòng)駕駛行業(yè)研究報(bào)告》,30余位自動(dòng)駕駛行業(yè)一線受訪專家中,90%表示自己所供職的公司已投入研發(fā)端到端技術(shù),大部分技術(shù)公司都認(rèn)為難以承受錯(cuò)過(guò)這一次技術(shù)革命的后果。

這也算是在一定范圍內(nèi)形成了一個(gè)共識(shí),原本混亂的智駕專有名詞包括NOA、NGP、NCA、NOP……等等逐漸變得統(tǒng)一起來(lái)。

從哪一端到哪一端?

事實(shí)上,端到端并不是一個(gè)全新的概念。在人工智能領(lǐng)域,它是一種普遍使用的方法。比如在各種AI翻譯、語(yǔ)音轉(zhuǎn)文字應(yīng)用中,基本都使用端到端:原始數(shù)據(jù)被送進(jìn)一張神經(jīng)網(wǎng)絡(luò)中,經(jīng)過(guò)一系列運(yùn)算后,直接給出最終結(jié)果。

落地到智駕領(lǐng)域里,也是如此,汽車(chē)上的雷達(dá)以及各類傳感器在感知到路面信息和,通過(guò)決策并直接做出反映,體現(xiàn)到汽車(chē)智駕的動(dòng)作上,包括方向盤(pán)轉(zhuǎn)角、油門(mén)踏板開(kāi)度等。‌

這與之前的幾乎所有的智能輔助駕駛系統(tǒng)依賴于事先定義好的規(guī)則判斷形成巨大對(duì)比。

在端到端出現(xiàn)之前,智駕系統(tǒng)需要先通過(guò)傳感器識(shí)別車(chē)道、行人、車(chē)輛、標(biāo)志等關(guān)鍵資訊,再由工程師編寫(xiě)數(shù)十萬(wàn)行C++ 程式碼,應(yīng)對(duì)紅燈停、綠燈行等各種場(chǎng)景,任何一個(gè)行為都有相對(duì)應(yīng)的規(guī)則、條件判斷的方程式,但這種做法終究難以涵蓋復(fù)雜多變的真實(shí)路況。

而端到端則是通過(guò)AI的不斷學(xué)習(xí)運(yùn)算直接做出反應(yīng),中間的邏輯幾乎全部省略。

因?yàn)樯婕暗紸I涉及到大模型以及深度學(xué)習(xí)等相關(guān)專業(yè)領(lǐng)域,端到端天然自帶一些復(fù)雜地前沿科技屬性,就像很多人知道ChatGPT但依舊不懂大模型是怎么回事一樣。類比一下,ChatGPT,它就是一個(gè)典型的端到端模型,輸入文字語(yǔ)句,直接就能得到回答。

到目前為止,沒(méi)有哪一家企業(yè)試圖用最通俗的語(yǔ)言向消費(fèi)者傳遞過(guò)關(guān)于端到端最基本的認(rèn)識(shí),甚至直接用門(mén)到門(mén)、出發(fā)一端至終點(diǎn)一端這樣的概念將其具像化——讓車(chē)輛自動(dòng)把你從A端帶到B端。

前文中關(guān)于端到端的釋義也是終極版本,與現(xiàn)在市面上絕大多數(shù)的宣傳的端到端智駕都還有較大差距。

極越CEO夏一平表示,“端到端這件事情很難一蹴而就,首先我不認(rèn)為現(xiàn)在市場(chǎng)上有任何一家是百分百的端到端,這個(gè)世界上現(xiàn)在沒(méi)有人是完全的端到端。我覺(jué)得無(wú)論是端到端也好,無(wú)圖也好,都是營(yíng)銷(xiāo)的噱頭,對(duì)老百姓來(lái)說(shuō),我覺(jué)得還是體驗(yàn)好最重要。”

從自動(dòng)駕駛架構(gòu)演進(jìn)的角度,端到端也可以分為幾個(gè)階段或者說(shuō)幾種技術(shù)路線。在最初級(jí)的“感知端到端”中,整個(gè)自動(dòng)駕駛架構(gòu)被拆分成了感知和預(yù)測(cè)決策規(guī)劃兩個(gè)主要模塊,其中,感知模塊已經(jīng)通過(guò)基于多傳輸器融合的BEV (Bird Eye View,鳥(niǎo)瞰圖視角融合 ) 技術(shù)實(shí)現(xiàn)了模塊級(jí)別的 “ 端到端 ”。通過(guò)引入 transformer 神經(jīng)網(wǎng)絡(luò)模型,對(duì)于識(shí)別結(jié)果精度及穩(wěn)定性相對(duì)之前都有比較大的提升。但在最終的規(guī)劃決策模塊中仍然以規(guī)則基礎(chǔ)為主。

第二階段才是端到端決策,把預(yù)測(cè)到?jīng)Q策到規(guī)劃的功能模塊已經(jīng)被集成到同一個(gè)神經(jīng)網(wǎng)絡(luò)當(dāng)中。

單一模型端到端才算是終極版本。在這個(gè)背景下,就不再有感知、決策規(guī)劃等功能的明確劃分。從原始信號(hào)輸入到最終規(guī)劃軌跡的輸出直接采用同一個(gè)深度學(xué)習(xí)模型。是真正意義上的端到端。

國(guó)內(nèi)最近一些企業(yè)則聲稱自己是端到端感知,或者端到端決策,只是各種細(xì)枝末節(jié)的“端到端”,這只能算作是純數(shù)據(jù)驅(qū)動(dòng)的感知和純數(shù)據(jù)驅(qū)動(dòng)的決策規(guī)劃階段。

換句話說(shuō),做得好點(diǎn)的還只是前兩個(gè)模塊的融合,根本做不到輸出控制(執(zhí)行)的結(jié)果。

小馬智行CTO樓天城就表示,“端到端并不是一個(gè)特別大的模型,比如理想汽車(chē)的端到端方案其實(shí)在一個(gè)orin-x上就能跑通,其中還牽扯到大量的規(guī)則。”

相比于模塊化方案,單一模型的端到端方案雖然在訓(xùn)練以及調(diào)試上更為復(fù)雜,但在理論上,其最終效果具有更高的天花板。

被“神化”的端到端

在鋪天蓋地的“端到端”轟炸中,一場(chǎng)關(guān)于廣義與狹義的技術(shù)分野就此鋪開(kāi)。

端到端相關(guān)企業(yè)本分為兩派,一邊是以探索研究前沿科技的技術(shù)人員以及學(xué)者為主的“技術(shù)原教旨主義派”,他們認(rèn)為,市場(chǎng)上很多公司所宣傳的端到端并不是真正意義上的端到端。

同濟(jì)大學(xué)汽車(chē)學(xué)院教授朱西產(chǎn)就曾直言,“車(chē)企宣傳端到端更多是為了流量,實(shí)際上國(guó)內(nèi)車(chē)企具備做“端到端”的技術(shù)實(shí)力的沒(méi)幾個(gè),但是嘴上不能輸,打仗呢,一躺下就再也起不來(lái)了。”

一邊是以急于落地項(xiàng)目的車(chē)企供應(yīng)商為主的“實(shí)用主義派”。他們則表示,只要基本原理符合,并且產(chǎn)品性能提升,端到端的準(zhǔn)確內(nèi)涵并不重要。

圖森未來(lái)CTO王乃巖在今年上半年就就發(fā)文呼吁,業(yè)界要避免陷入狹義端到端的誤區(qū),因?yàn)檫@對(duì)智駕量產(chǎn)不利。

畢竟,只要定語(yǔ)加得多,哪款車(chē)都可以是最暢銷(xiāo)車(chē)型;同樣的只要定義范圍足夠小,任何企業(yè)都能掌握某個(gè)板塊的端到端。

2017年6月,馬斯克從OpenAI挖走了一個(gè)斯洛伐克籍的研究員。這個(gè)人叫Andrej Karpathy,后來(lái)成為特斯拉的AI總監(jiān)。

再后來(lái),Andrej Karpathy在特斯拉直接帶領(lǐng)團(tuán)隊(duì)重寫(xiě)了自動(dòng)駕駛算法,并開(kāi)發(fā)出BEV純視覺(jué)感知技術(shù),也就是目前炙手可熱的端到端,讓特斯拉自動(dòng)駕駛進(jìn)入新階段。由此也影響了國(guó)內(nèi)一大批企業(yè)的技術(shù)路徑。

看到未來(lái)的特斯拉不惜重寫(xiě)了自動(dòng)駕駛算法,并對(duì)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施進(jìn)行了重構(gòu)。但這并不代表此時(shí)此刻的端到端或者說(shuō)特斯拉的端到端,就是智駕領(lǐng)域的最優(yōu)解。

問(wèn)界汽車(chē)智駕學(xué)院張奇在一場(chǎng)公開(kāi)課上就向BC表示,“端到端也并非萬(wàn)能,其自身的‘黑盒’特性決定了無(wú)法簡(jiǎn)單通過(guò)明確的、可解釋的規(guī)則約束系統(tǒng)的安全邊界,存在安全性挑戰(zhàn)。”

為了具象化,張奇舉了幾個(gè)簡(jiǎn)單的例子,以國(guó)內(nèi)目前效果比較好的豆包大模式為例,在某些特定問(wèn)題上,大模型也會(huì)答非所問(wèn)胡說(shuō)八道。

“AI的底層算法是計(jì)算事物關(guān)聯(lián)性的統(tǒng)計(jì)學(xué)邏輯,推導(dǎo)的因果鏈可能有違常識(shí),甚至提供一個(gè)錯(cuò)誤的并且不可預(yù)知的答案。這在業(yè)內(nèi)被稱為幻覺(jué)(hallucination)傾向。”

聊天可以胡說(shuō)八道,但在智駕領(lǐng)域,任何一次錯(cuò)誤的輸出,導(dǎo)致的結(jié)果都可能是致命的。

另一方面,端到端無(wú)法復(fù)現(xiàn)復(fù)雜的、偶發(fā)的極端事件,考驗(yàn)可解釋性和泛用性能力,把上限提高的同時(shí)拉低了下限,即所謂的“蹺蹺板效應(yīng)”。所以在端到端之外,幾乎所有車(chē)企都會(huì)采取規(guī)則兜底的方式。

以問(wèn)界為例,會(huì)有本能安全網(wǎng)絡(luò)守住紅線,小鵬也同樣有用到XNPG的一些系列規(guī)則基礎(chǔ)兜底。

不管是端到端無(wú)法窮盡所有的極端場(chǎng)景,還是在短期內(nèi)學(xué)會(huì)選擇和辨別,并穩(wěn)定地輸出最優(yōu)解,就目前來(lái)看還不太現(xiàn)實(shí),至少是有風(fēng)險(xiǎn)存在。

對(duì)此,知行科技創(chuàng)始人兼CEO宋陽(yáng)表示:“端到端方案具有‘上限高,但下限低’的特點(diǎn)。通俗來(lái)說(shuō)就是,做得好可以達(dá)到很好的效果,做得不好比傳統(tǒng)方案更差。”

山雨欲來(lái)風(fēng)滿樓

從最早的有賴于高精地圖的智駕到后來(lái)的無(wú)圖智駕,再到現(xiàn)如今的多種形式的端到端,技術(shù)演進(jìn)的腳步已經(jīng)超越了消費(fèi)者的認(rèn)知速度,更是將國(guó)內(nèi)智駕的一汪池水?dāng)嚨貌龥坝俊?/p>

首當(dāng)其沖的就是配套智駕業(yè)務(wù)的圖商,在邁向無(wú)圖智駕乃至端到端的過(guò)程中,地圖供應(yīng)商是最先被拋棄的一方,曾經(jīng)被認(rèn)為是高階智駕不可或缺的高精地圖正在被邊緣。

伴隨車(chē)企端到端發(fā)展的“去圖化”的行動(dòng),四維圖新CEO程鵬在公開(kāi)場(chǎng)合炮轟,“部分車(chē)企之所以強(qiáng)調(diào)‘無(wú)圖’技術(shù)路線,主要是因?yàn)闊o(wú)地圖資質(zhì)、無(wú)知識(shí)產(chǎn)權(quán)、無(wú)安全敬畏。”

有些車(chē)企高管層明確表示,如果鮮度無(wú)法保證,強(qiáng)行在城市使用高精地圖,只會(huì)徒增成本不增效果,且無(wú)法保證準(zhǔn)確性。但在程鵬看來(lái),近些年,大家都在喊無(wú)圖,事實(shí)上每一家車(chē)企,每一家自動(dòng)駕駛解決方案商,也依然都在用著高精度地圖。

盡管嘴上不愿意妥協(xié),但身體上依舊很誠(chéng)實(shí)。圖商們也在快速反應(yīng)調(diào)整中,比方過(guò)去,高精地圖全部裝在車(chē)機(jī)端,但現(xiàn)在變成配備在訓(xùn)練端:汽車(chē)智駕的開(kāi)發(fā)模式形成了云端+車(chē)端的開(kāi)發(fā)閉環(huán),模型在云端進(jìn)行訓(xùn)練和驗(yàn)證,隨后部署到車(chē)端,完成應(yīng)用和數(shù)據(jù)收集回傳。

四維圖新、高德、百度都相繼推出了自己的輕量化地圖產(chǎn)品,相比高精地圖的厘米級(jí)精度,輕地圖一般是米級(jí)精度,但可實(shí)現(xiàn)更高的更新鮮度。

相比起圖商的轉(zhuǎn)型,智駕從業(yè)人員或許才是技術(shù)進(jìn)步中最苦的一群人,如果說(shuō)時(shí)代的一;沂莻(gè)人的一座山,那端到端對(duì)于他們而言更像是時(shí)代的一座山。

某AI芯片公司的自動(dòng)駕駛總監(jiān)就曾對(duì)媒體表示,整體端到端的更改,等于重新做。曾經(jīng)一大批炙手可熱的智駕工程師面臨著不重新學(xué)習(xí)就走人的殘酷現(xiàn)實(shí)。

此前,在各品牌城市 NOA 的開(kāi)城過(guò)程中,會(huì)遇到大量的極端場(chǎng)景,需要一定程度數(shù)量的規(guī)控程序員和測(cè)試工程師處理。在切換至端到端架構(gòu)后,“ 高質(zhì)量數(shù)據(jù) ” 和 “ 頂尖 AI 人才 ” 可能成為更加重要的資源要素。

曾經(jīng)動(dòng)輒一千多人的研發(fā)團(tuán)隊(duì)如今只需要兩三百人足以。2023年,蔚來(lái)的智駕人數(shù)超過(guò)1000規(guī)模,在今年的NIO IN上面對(duì)媒體的提問(wèn),李斌也正面回應(yīng)到,智駕不需要其他領(lǐng)域還是大量需要的,公司內(nèi)部會(huì)進(jìn)行分流。

理想1300人的智駕團(tuán)隊(duì)在今年四月份也啟動(dòng)了一波大范圍的裁員,甚至一度裁到大動(dòng)脈后緊急返聘。

小鵬P7+產(chǎn)品團(tuán)隊(duì)也向BC表示,智駕這邊從去年年底開(kāi)始也走了不少人,不學(xué)習(xí)就要淘汰。甚至特斯拉之前 planning control(規(guī)劃控制)的負(fù)責(zé)人也在今年早些時(shí)候離職。

端到端團(tuán)隊(duì)需要的人數(shù)變少,但人才門(mén)檻要求變得更高了。大模型本身要求團(tuán)隊(duì)有很強(qiáng)的深度學(xué)習(xí)背景,搭建方案階段,更需要很強(qiáng)的infra(基礎(chǔ)架構(gòu))人才,對(duì)感知、規(guī)劃控制每個(gè)模塊都有深刻認(rèn)知,了解不同芯片算力平臺(tái)的支持力度、不同AI推理框架等。

畢竟,這之前從事寫(xiě)規(guī)則的規(guī)控程序員們大多沒(méi)有深度學(xué)習(xí)的AI背景,在奔涌的時(shí)代浪潮下不被裹挾向前就只能拍向岸邊。

盡管在全行業(yè)來(lái)看,傳統(tǒng)做規(guī)則算法的工程師,目前還沒(méi)有遭遇到大規(guī)模的裁員事件,但可以遇見(jiàn)的是,十字路口就在眼前。

注:圖片部分來(lái)源網(wǎng)絡(luò),如有侵權(quán),聯(lián)系刪除

       原文標(biāo)題 : 智駕終局還是營(yíng)銷(xiāo)亂局?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)