侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

智能汽車(chē) AI 101,以及“端到端”和“復(fù)合方法”之間有什么區(qū)別?

電氣化之后智能化,汽車(chē)的智能化怎么也脫不開(kāi)人工智能AI,無(wú) AI 不智能這是大家所有人的共識(shí)了。但,到底AI是什么?它在汽車(chē)行業(yè)應(yīng)用的發(fā)展是怎么樣的?大家競(jìng)相宣傳和討論的端到端到底什么?它和之前其他AI算法有什么區(qū)別?此類(lèi)問(wèn)題卻常讓大家競(jìng)相莫名圍觀(guān)吃瓜。

所以,本文將結(jié)合AI在汽車(chē)行業(yè)的應(yīng)用和發(fā)展,總結(jié)下人工智能機(jī)器學(xué)習(xí)

深度學(xué)習(xí)

端到端等 AI 人工智能 101概念內(nèi)容,幫助大家了解AI,以及它在智能汽車(chē)中的應(yīng)用和發(fā)展,也方便理解前熱門(mén)的各類(lèi)概念和事件。

人工智能(Artificial Intelligence, AI)人工智能是一門(mén)在計(jì)算機(jī)中模擬智能行為的科學(xué)。它使計(jì)算機(jī)能夠展現(xiàn)出類(lèi)似人類(lèi)的行為特征,包括知識(shí)、推理、常識(shí)、學(xué)習(xí)和決策能力。

他們的核心就是多層的神經(jīng)網(wǎng)絡(luò)(Neural Networks),神經(jīng)網(wǎng)絡(luò)是一種計(jì)算機(jī)架構(gòu),它模擬了人腦的結(jié)構(gòu),AI/機(jī)器學(xué)習(xí)程序可以在此基礎(chǔ)上構(gòu)建。

神經(jīng)網(wǎng)絡(luò)由相互連接的節(jié)點(diǎn)組成,這些節(jié)點(diǎn)可以解決更復(fù)雜的問(wèn)題并進(jìn)行學(xué)習(xí),類(lèi)似于人腦中的神經(jīng)元,每個(gè)節(jié)點(diǎn)用權(quán)重,偏差等參數(shù)去計(jì)算傳導(dǎo)到下一步,產(chǎn)生結(jié)果。所以,參數(shù)等成了當(dāng)前模型的一個(gè)重要參考指標(biāo),理論上參數(shù)越多代表模型學(xué)習(xí)更完善,產(chǎn)生結(jié)果更真實(shí),在今年英偉達(dá)的 GTC 上,Jensen 透露了一條關(guān)于當(dāng)今最大模型的看似有趣的消息,稱(chēng)“當(dāng)今最大的模型是 1.8T 參數(shù)“。機(jī)器學(xué)習(xí)(Machine Learning)機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支,它使計(jì)算機(jī)能夠在沒(méi)有明確編程的情況下從數(shù)據(jù)中學(xué)習(xí)。例如,計(jì)算機(jī)可以通過(guò)數(shù)據(jù)學(xué)習(xí)識(shí)別狗或貓等對(duì)象。所以智能駕駛最開(kāi)始的Mobileye就是采用視覺(jué)機(jī)器學(xué)習(xí),讓車(chē)輛識(shí)別前方車(chē)輛,行人自行車(chē)等VRU,前方道路線(xiàn),交通標(biāo)志等,這樣實(shí)現(xiàn)了AEB,LCC車(chē)道保持等功能。

傳統(tǒng)的機(jī)器學(xué)習(xí)方法需要大量的人力來(lái)訓(xùn)練軟件。例如,在自動(dòng)駕駛施工道路的障礙物識(shí)別中,需要做以下操作:手動(dòng)標(biāo)記數(shù)十萬(wàn)張施工道路以及相關(guān)標(biāo)志的圖像。讓機(jī)器學(xué)習(xí)算法處理這些圖像。用一組未知或者叫泛化的圖像上測(cè)試這些算法。找出某些結(jié)果不準(zhǔn)確的原因。通過(guò)標(biāo)注新圖像來(lái)改進(jìn)數(shù)據(jù)集,以提高結(jié)果準(zhǔn)確性。這個(gè)過(guò)程稱(chēng)為有監(jiān)督學(xué)習(xí)。在有監(jiān)督學(xué)習(xí)中,只有廣泛且充分多樣化的數(shù)據(jù)是準(zhǔn)確率的前提。例如,該算法可能可以準(zhǔn)確識(shí)別放置非常正面的施工道路牌,但不能準(zhǔn)確識(shí)別斜向放置的施工道路牌,因?yàn)橛?xùn)練數(shù)據(jù)集包含更多正面施工道路圖像。在這種情況下,那么就需要標(biāo)記更多的斜向放置的施工道路牌圖像并再次訓(xùn)練機(jī)器學(xué)習(xí)模型。國(guó)內(nèi)汽車(chē)智能駕駛大概在2019年左右,都在通過(guò)大量的人工數(shù)據(jù)采集和標(biāo)注的方式,瘋狂通過(guò)這種方式訓(xùn)練學(xué)習(xí)模型,最后在2019年特斯拉推出其算法之后,所有訓(xùn)練數(shù)據(jù)和算法推倒重來(lái)。

深度學(xué)習(xí)(Deep Learning):深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,深度學(xué)習(xí)擁有更多的分層的層級(jí)結(jié)構(gòu)。例如,在識(shí)別施工道路牌的例子中,不同的層可能對(duì)應(yīng)于給定施工道路牌的關(guān)鍵特征。所以,深度學(xué)習(xí)能夠高效處理非結(jié)構(gòu)化數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)之間隱藏的關(guān)系和模式,它能夠做到無(wú)監(jiān)督學(xué)習(xí)Unsupervised learning,強(qiáng)化學(xué)習(xí)Reinforcement learning (RL)。例如施工道路牌,它能夠識(shí)別逆光,殘缺甚至倒地的施工道路牌。強(qiáng)化學(xué)習(xí)(RL),可以訓(xùn)練軟件做出決策,以實(shí)現(xiàn)最佳結(jié)果。它模仿了人類(lèi)為實(shí)現(xiàn)目標(biāo)所采取的反復(fù)試驗(yàn)的學(xué)習(xí)過(guò)程。有助于實(shí)現(xiàn)目標(biāo)的軟件操作會(huì)得到加強(qiáng),而偏離目標(biāo)的操作將被忽略。ChatGPT剛推出那會(huì)兒,Open AI就對(duì)使用RL做了簡(jiǎn)單介紹,RL 算法在處理數(shù)據(jù)時(shí)使用獎(jiǎng)懲模式。這些算法從每個(gè)操作的反饋中學(xué)習(xí),并自行發(fā)現(xiàn)實(shí)現(xiàn)最終結(jié)果的最佳處理路徑。此類(lèi)算法還能夠?qū)崿F(xiàn)延遲滿(mǎn)足。最好的整體策略可能需要短期的犧牲,因此其發(fā)現(xiàn)的最佳方法可能包括一些懲罰,或在過(guò)程中有一些迂回。RL 是一種強(qiáng)大的方法,可以幫助人工智能(AI)系統(tǒng)在看不見(jiàn)的環(huán)境中實(shí)現(xiàn)最佳結(jié)果。當(dāng)人工智能算法可以無(wú)監(jiān)督和自我強(qiáng)化學(xué)習(xí),對(duì)于人工智能最重要的事情就剩下:

大量高質(zhì)量的數(shù)據(jù),在大量高質(zhì)量數(shù)據(jù)上訓(xùn)練深度學(xué)習(xí)算法時(shí),可以獲得更好的效果。輸入數(shù)據(jù)集中的異常值或錯(cuò)誤會(huì)顯著影響深度學(xué)習(xí)過(guò)程。例如,在我們的動(dòng)物圖像示例中,如果數(shù)據(jù)集中意外引入了非動(dòng)物圖像,深度學(xué)習(xí)模型可能會(huì)將飛機(jī)歸類(lèi)為海龜。為避免此類(lèi)錯(cuò)誤,必須先清理和處理大量數(shù)據(jù),然后再訓(xùn)練深度學(xué)習(xí)模型。輸入數(shù)據(jù)預(yù)處理需要大量的數(shù)據(jù)存儲(chǔ)容量。

強(qiáng)大的算力芯片中心,深度學(xué)習(xí)算法是計(jì)算密集型的,需要具有足夠計(jì)算能力的基礎(chǔ)設(shè)施才能正常運(yùn)行。否則,它們需要很長(zhǎng)的時(shí)間來(lái)處理結(jié)果。

能源,數(shù)據(jù)存儲(chǔ)處理以及計(jì)算消耗的能源成為繼物理做功之后又一重要消耗,這也是為什么最近Open AI Sam奧特曼多次不同場(chǎng)合表示對(duì)核電感興趣。

在此類(lèi)人工智能算法的背景下,理想條件下,只需要喂養(yǎng)高質(zhì)量數(shù)據(jù),在強(qiáng)大算力,和豐富能源供給的條件下 AI 可以給人類(lèi)帶來(lái)無(wú)窮的應(yīng)用。端到端方法( End-to-End Approach)在2023年,特斯拉開(kāi)始宣布端到端的智能駕駛算法,他所謂的端到端方法是一個(gè)單一模型,它直接從視覺(jué)輸入到輸出駕駛策略,如轉(zhuǎn)向和制動(dòng)。這種方法減少了人工編碼的需求,并可能有助于解決迄今為止限制自動(dòng)駕駛進(jìn)展的邊緣情況。

熟悉智能駕駛應(yīng)該大概都了解,智能駕駛幾要素,感知,定位,規(guī)劃,控制等流程。目前智能駕駛算法組合大概有三種方式:

感知采用AI神經(jīng)網(wǎng)絡(luò)+規(guī)則控制

各個(gè)區(qū)塊都采用神經(jīng)網(wǎng)絡(luò)

端到端融合神經(jīng)網(wǎng)絡(luò)

特斯拉算是從第一個(gè)走到了第三步。

其實(shí)目前大都在第一步和第二步此類(lèi)的復(fù)合解決方案,它可以使用AI處理不同的子系統(tǒng)或輸入。然后,這個(gè)解決方案可以與組合不同的代碼一起使用,或者覆蓋其他規(guī)則/因素(例如,確保遵守某些交通法規(guī))。盡管有爭(zhēng)議,這種復(fù)合方法是否會(huì)限制AI在難以理解的長(zhǎng)尾邊緣情況場(chǎng)景中所能達(dá)到的程度,但它:很有效率(例如,ChatGPT不需要使用AI訓(xùn)練來(lái)解決基本數(shù)學(xué)問(wèn)題,它可以直接查詢(xún)計(jì)算器模塊),可能更容易理解/驗(yàn)證(這在駕駛中尤其重要,因?yàn)锳I的錯(cuò)誤可能是致命的)。仍然使用高級(jí)AI技術(shù),如Transformer,Occupancy等等。這些概念為理解AI在自動(dòng)駕駛汽車(chē)中的應(yīng)用提供了基礎(chǔ),并解釋了不同AI方法如何影響技術(shù)的開(kāi)發(fā)和實(shí)施,目前很難說(shuō)誰(shuí)好誰(shuí)不好。其他汽車(chē)人工智能應(yīng)用其實(shí),語(yǔ)音算是在智能汽車(chē)上應(yīng)用最廣和最快的,畢竟人工智能發(fā)展最快的就是語(yǔ)音和文本模型,例如ChatGPT 此類(lèi)LLM大語(yǔ)言模型激發(fā)了智能駕駛端到端,基本 AI 原理雷同,目前沒(méi)有說(shuō)主機(jī)廠(chǎng)自研語(yǔ)音算法的,主要是這個(gè)產(chǎn)業(yè)已經(jīng)發(fā)展完備,集中頭部供應(yīng)商提供解決方案。當(dāng)然,智能駕駛也應(yīng)該快速走向這個(gè)過(guò)程,頭部供應(yīng)商提供解決方案,畢竟最終路徑和技術(shù)趨同統(tǒng)一,大家都沒(méi)有必要重復(fù)造輪子了。

*未經(jīng)準(zhǔn)許嚴(yán)禁轉(zhuǎn)載和摘錄-參考資料:

Can new AI technology help accelerate AV deployment?- 高盛

       原文標(biāo)題 : 智能汽車(chē) AI 101,以及“端到端”和“復(fù)合方法”之間有什么區(qū)別?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)