訂閱
糾錯
加入自媒體

SLAM +機(jī)器學(xué)習(xí)迎來了“感知時代”

2020-07-30 15:55
振工鏈
關(guān)注

機(jī)器和深度學(xué)習(xí)的最新進(jìn)展已改進(jìn)了SLAM技術(shù),從而導(dǎo)致地圖的豐富性增加,語義場景理解提高了定位,地圖質(zhì)量和堅固性。

最近的危機(jī)使人們越來越關(guān)注將自動機(jī)器人用于實際利益。我們已經(jīng)看到機(jī)器人,運送食物和藥品,甚至對患者進(jìn)行評估。這些都是驚人的用例,它們清楚地說明了從現(xiàn)在起機(jī)器人將在我們的生活中發(fā)揮更大作用的方式。

然而,盡管具有所有優(yōu)點,但是機(jī)器人自動繪制周圍環(huán)境并成功定位自身的能力仍然十分有限。機(jī)器人在計劃一致的環(huán)境中擅長做特定事情的能力越來越強(qiáng)。但是動態(tài),未經(jīng)訓(xùn)練的情況仍然是一個挑戰(zhàn)。

我興奮的是下一代SLAM(同步定位和地圖繪制),它將使機(jī)器人設(shè)計人員能夠創(chuàng)造出在各種情況下具有更強(qiáng)的自主操作能力的機(jī)器人。它正在開發(fā)中,并吸引了整個行業(yè)的投資和興趣。

我們稱其為“感知時代”,它將機(jī)器和深度學(xué)習(xí)的最新進(jìn)展結(jié)合起來以增強(qiáng)SLAM。通過語義場景理解來增加地圖的豐富度,可以改善定位,地圖質(zhì)量和堅固性。

簡化地圖

目前,大多數(shù)SLAM解決方案都從傳感器獲取原始數(shù)據(jù),并使用概率算法來計算機(jī)器人的位置和地圖。LIDAR是最常用的,但成本越來越低的相機(jī)為增強(qiáng)的地圖提供了豐富的數(shù)據(jù)流。無論使用哪種傳感器,數(shù)據(jù)都會創(chuàng)建由數(shù)百萬個3維參考點組成的地圖。這些使機(jī)器人可以計算其位置。

問題在于這些3D點云沒有意義-它們只是機(jī)器人計算其位置的空間參考。不斷處理所有這些數(shù)百萬個點也是機(jī)器人處理器和內(nèi)存的沉重負(fù)擔(dān)。通過將機(jī)器學(xué)習(xí)插入到處理“流水線”中,我們既可以提高這些地圖的實用性,又可以簡化它們。

全景分割

技術(shù)使用機(jī)器學(xué)習(xí)將來自攝像機(jī)供稿的像素集合分類為可識別的“對象”。例如,代表墻壁的數(shù)百萬個像素可以歸類為單個對象。此外,我們可以使用機(jī)器學(xué)習(xí)來預(yù)測3D世界中這些像素的幾何形狀和形狀。因此,代表一堵墻的數(shù)百萬個3D點可以全部匯總到一個平面中。

數(shù)以百萬計的代表椅子的3D點都可以匯總到帶有少量參數(shù)的形狀模型中。將場景分解為2D和3D的不同對象可以降低處理器和內(nèi)存的開銷。

令我興奮的是下一代SLAM,它將使機(jī)器人設(shè)計人員能夠創(chuàng)造出在各種情況下能夠自主運行的機(jī)器人。它正在開發(fā)中,并吸引了整個行業(yè)的投資和興趣。

增加理解

以及簡化地圖,此方法為進(jìn)一步了解機(jī)器人的傳感器捕獲的場景提供了基礎(chǔ)。通過機(jī)器學(xué)習(xí),我們能夠?qū)鼍爸械膯蝹對象進(jìn)行分類,然后編寫代碼來確定應(yīng)如何處理它們。

這種新興功能的首要目標(biāo)是能夠從地圖上移除包括人在內(nèi)的移動物體。為了有效導(dǎo)航,機(jī)器人需要引用場景的靜態(tài)元素。不會移動的東西,因此可以用作可靠的定位點。機(jī)器學(xué)習(xí)可用于教導(dǎo)自主機(jī)器人場景中哪些元素用于定位,哪些元素不作為地圖的一部分或?qū)⑵浞诸悶橐苊獾恼系K。將場景中的對象的全景分割與基礎(chǔ)地圖和位置數(shù)據(jù)相結(jié)合,將很快大大提高機(jī)器人SLAM的準(zhǔn)確性和功能。

感知對象

下一個激動人心的步驟將是基于此分類,以增加對單個對象的理解水平。機(jī)器學(xué)習(xí)作為SLAM系統(tǒng)的一部分,將使機(jī)器人能夠?qū)W習(xí)將房間的墻壁和地板與家具和房間內(nèi)的其他物體區(qū)分開。將這些元素存儲為單獨的對象意味著添加或刪除椅子無需完全重繪地圖。

這些優(yōu)勢的結(jié)合是自主機(jī)器人功能取得巨大進(jìn)步的關(guān)鍵。機(jī)器人在未經(jīng)訓(xùn)練的情況下不能很好地推廣。變化,尤其是快速移動會破壞地圖并增加大量計算量。機(jī)器學(xué)習(xí)創(chuàng)建了一層抽象,可以提高地圖的穩(wěn)定性。它在處理數(shù)據(jù)方面的更高效率產(chǎn)生了開銷,以增加更多的傳感器和更多的數(shù)據(jù),從而增加了粒度和可包含在地圖中的信息,更多信息盡。

機(jī)器學(xué)習(xí)可用于教導(dǎo)自主機(jī)器人場景中哪些元素用于定位,哪些元素不作為地圖的一部分或?qū)⑵浞诸悶橐苊獾恼系K。

自然互動

將位置,地圖和感知鏈接在一起,使機(jī)器人可以更多地了解其周圍環(huán)境并以更有用的方式進(jìn)行操作。例如,可以感知大廳和廚房之間差異的機(jī)器人可以執(zhí)行更復(fù)雜的指令集。能夠識別和分類椅子,書桌,櫥柜等物體將進(jìn)一步改善這一點。指示機(jī)器人去特定的房間去獲取特定的東西將變得更加簡單。

當(dāng)機(jī)器人開始以更自然的方式與人進(jìn)行更多互動時,機(jī)器人技術(shù)的真正革命將來臨?梢詮亩喾N情況中學(xué)習(xí)并將這些知識組合到模型中的機(jī)器人,這些機(jī)器人可以使它們根據(jù)存儲在內(nèi)存中的地圖和對象執(zhí)行未經(jīng)訓(xùn)練的新任務(wù)。創(chuàng)建這些模型和抽象需要將SLAM的所有三層完全集成。由于在這些領(lǐng)域處于領(lǐng)先地位的人們的努力,我相信感知時代即將來臨,更多信息盡在振工鏈。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號