訂閱
糾錯(cuò)
加入自媒體

成立8個(gè)月估值24億,這家機(jī)器人公司拿什么吸引了投資人?

前言:目前,兩條路徑正在同步推進(jìn)。一些人形機(jī)器人公司專(zhuān)注于構(gòu)建硬件,并側(cè)重于訓(xùn)練機(jī)器人全身運(yùn)動(dòng)的控制能力,而另一些廠商則采取垂直一體化的策略。

同時(shí),還有其他公司致力于構(gòu)建世界模型或通用模型。Physical Intelligence代表了第三種路徑。

作者 | 方文三圖片來(lái)源 |  網(wǎng) 絡(luò) 

圖片

PI成立8個(gè)月估值24億美元

據(jù)《紐約時(shí)報(bào)》報(bào)道,美國(guó)機(jī)器人初創(chuàng)企業(yè)Physical Intelligence近日成功完成了四億美元的融資。

此次融資的主要投資者包括亞馬遜創(chuàng)始人杰夫·貝佐斯、風(fēng)險(xiǎn)投資公司Thrive Capital以及Lux Capital,而OpenAI、Redpoint Ventures和Bond亦參與了投資,使得公司在投資前的估值達(dá)到了二十億美元。

Physical Intelligence是一家致力于將通用人工智能技術(shù)應(yīng)用于物理世界的新興企業(yè),目前正致力于開(kāi)發(fā)能夠驅(qū)動(dòng)當(dāng)前機(jī)器人技術(shù)及未來(lái)物理設(shè)備的基礎(chǔ)模型和學(xué)習(xí)算法。

該公司于今年三月在美國(guó)特拉華州正式注冊(cè)成立,總部設(shè)在舊金山。

成立僅一個(gè)月后,Physical Intelligence便從Khosla Ventures、Lux Capital、紅杉資本、Thrive Capital和OpenAI等知名投資機(jī)構(gòu)成功籌集了七千萬(wàn)美元的資金,當(dāng)時(shí)公司的估值約為四億美元。

Physical Intelligence官網(wǎng)介紹稱(chēng),該公司致力于將通用人工智能技術(shù)引入現(xiàn)實(shí)世界。

π0模型的訓(xùn)練過(guò)程分為兩個(gè)階段:預(yù)訓(xùn)練和微調(diào)。

在預(yù)訓(xùn)練階段,模型通過(guò)學(xué)習(xí)大量數(shù)據(jù)來(lái)掌握廣泛的知識(shí)和技能,以便適應(yīng)各種不同的應(yīng)用場(chǎng)景。

隨后,在微調(diào)階段,模型針對(duì)特定任務(wù)進(jìn)行優(yōu)化,以提升在這些任務(wù)上的性能表現(xiàn)。

此外,π0模型采用了流匹配技術(shù),使其能夠處理連續(xù)的動(dòng)作序列,而不僅僅是單一的、離散的步驟。

結(jié)合其混合專(zhuān)家架構(gòu),這一技術(shù)的應(yīng)用顯著提高了模型在預(yù)測(cè)動(dòng)作時(shí)的準(zhǔn)確性。

谷歌斯坦福伯克利大佬領(lǐng)銜的團(tuán)隊(duì)

公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Karol Hausman,曾擔(dān)任Google DeepMind的資深研究科學(xué)家,并兼任斯坦福大學(xué)的兼職教授。

Chelsea Finn,斯坦福大學(xué)計(jì)算機(jī)科學(xué)與電氣工程系的教授,同時(shí)也是Google Brain團(tuán)隊(duì)的前成員,其研究興趣集中在如何通過(guò)學(xué)習(xí)使機(jī)器人和其他智能體變得更加智能。

Sergey Levine,加州大學(xué)伯克利分校電氣工程與計(jì)算機(jī)科學(xué)系的助理教授,專(zhuān)注于研究自主智能體通過(guò)學(xué)習(xí)獲得復(fù)雜行為的通用算法,尤其在機(jī)器學(xué)習(xí)決策和控制領(lǐng)域有所建樹(shù)。

Brian Ichter,曾是Google Brain的研究科學(xué)家,并在斯坦福大學(xué)獲得博士學(xué)位,其研究方向是通過(guò)學(xué)習(xí)提升移動(dòng)機(jī)器人在現(xiàn)實(shí)環(huán)境中執(zhí)行任務(wù)的能力。

π0模型具有以下三大優(yōu)勢(shì)

①π0模型展現(xiàn)了優(yōu)秀的跨平臺(tái)及跨任務(wù)遷移學(xué)習(xí)能力。

該模型通過(guò)融合視覺(jué)、語(yǔ)言和動(dòng)作數(shù)據(jù),實(shí)現(xiàn)了從物體分類(lèi)到動(dòng)態(tài)操控的多樣化技能。

其訓(xùn)練數(shù)據(jù)集涵蓋了來(lái)自八種不同機(jī)器人的交互數(shù)據(jù),以及開(kāi)放的圖像和文本數(shù)據(jù)集,這使得π0能夠在不同的機(jī)器人和任務(wù)平臺(tái)上進(jìn)行遷移和適應(yīng)。

這種跨平臺(tái)的兼容性賦予了π0處理多種不同機(jī)器人配置的能力,包括單臂機(jī)器人、雙臂機(jī)器人和移動(dòng)機(jī)械臂,從而顯著提升了模型的通用性和適應(yīng)性。

②π0模型在任務(wù)處理和指令執(zhí)行方面表現(xiàn)出色。它能夠通過(guò)[零樣本]方式執(zhí)行任務(wù),即在沒(méi)有特定任務(wù)樣本數(shù)據(jù)的情況下完成指令,這在動(dòng)態(tài)環(huán)境中尤為適用。

同時(shí),π0還支持[微調(diào)]功能,可根據(jù)具體應(yīng)用場(chǎng)景進(jìn)行數(shù)據(jù)增強(qiáng)訓(xùn)練,以提升復(fù)雜任務(wù)的執(zhí)行效果。

這種靈活性和適應(yīng)性使得π0能夠應(yīng)對(duì)各種復(fù)雜任務(wù),如疊衣服、收拾桌子、組裝盒子等,并在這些任務(wù)中表現(xiàn)出色。

③π0模型采用了獨(dú)特的技術(shù)架構(gòu)和方法。它基于視覺(jué)-語(yǔ)言模型(VLM)構(gòu)建,通過(guò)整合視覺(jué)、語(yǔ)言和動(dòng)作數(shù)據(jù),實(shí)現(xiàn)了復(fù)雜任務(wù)的操作。

在動(dòng)作輸出模塊,π0運(yùn)用了一種基于擴(kuò)散模型變體的[流匹配]方法,該方法通過(guò)對(duì)連續(xù)運(yùn)動(dòng)指令的建模,實(shí)現(xiàn)了高頻動(dòng)作控制。

這種高頻控制確保了機(jī)器人在動(dòng)態(tài)任務(wù)中具備靈活的運(yùn)動(dòng)調(diào)整能力,從而提高了操作的流暢性和準(zhǔn)確性。

與OpenAI志同道合使其獲得巨額融資

Physical Intelligence與OpenAI一樣,致力于從模型和數(shù)據(jù)層面打破傳統(tǒng)技術(shù)的局限。

①ChatGPT的精確語(yǔ)義理解能力是其核心優(yōu)勢(shì)之一,對(duì)于π0模型而言,這種能力同樣至關(guān)重要。

π0模型必須具備理解物理世界交互指令和上下文的能力,這涵蓋了視覺(jué)、語(yǔ)言和觸覺(jué)等多種感官輸入。

②ChatGPT的優(yōu)秀之處在于其能夠?qū)⒑暧^問(wèn)題拆解為微觀問(wèn)題,并巧妙地整合答案。

對(duì)于π0模型而言,這意味著它需要將復(fù)雜的物理任務(wù)拆解為一系列可操作的步驟,并根據(jù)環(huán)境的實(shí)時(shí)反饋靈活調(diào)整其行動(dòng),以確保實(shí)現(xiàn)既定目標(biāo)。

③ChatGPT的通用性體現(xiàn)在其能夠?qū)⑷祟?lèi)知識(shí)遷移到語(yǔ)言交流中。

相比之下,Physical Intelligence的通用性則體現(xiàn)在其能夠?qū)幕ヂ?lián)網(wǎng)規(guī)模數(shù)據(jù)中學(xué)習(xí)到的深層語(yǔ)義知識(shí),成功應(yīng)用于物理世界的實(shí)際操作中。

總體而言,ChatGPT之所以成為一個(gè)重要里程碑,是因?yàn)槠湓诶斫饧吧勺匀徽Z(yǔ)言方面展現(xiàn)出優(yōu)秀的能力;

而Physical Intelligence之所以吸引投資者的關(guān)注,關(guān)鍵在于其對(duì)物理世界的深刻理解和操控技巧。

結(jié)尾:

在現(xiàn)實(shí)世界中,讓人工智能執(zhí)行諸如洗衣、疊衣、包裝等簡(jiǎn)單任務(wù),對(duì)于當(dāng)前的人工智能技術(shù)而言,并非易事。

實(shí)際上,人工智能要真正理解物理世界的系統(tǒng)性工程,仍面臨諸多挑戰(zhàn)。

然而,要實(shí)現(xiàn)所謂的AGI,人工智能必須走出黑盒,進(jìn)入現(xiàn)實(shí)世界。

在這一過(guò)程中,機(jī)器人,尤其是人形機(jī)器人,被視為人工智能在人類(lèi)設(shè)計(jì)的社會(huì)環(huán)境中最佳的載體,這使得人工智能能夠具備通才通用性,從而使人形機(jī)器人能夠真正服務(wù)于人類(lèi)。

部分資料參考:雷鋒網(wǎng):《貝索斯領(lǐng)投、OpenAI連續(xù)跟投,這家機(jī)器人公司再融4億美金》,AIGC最前線:《Chelsea Finn帶隊(duì)的Physical Intelligence成果來(lái)了》,機(jī)器人前瞻:《28億!又一機(jī)器人公司完成巨額融資,OpenAI和貝佐斯都投了》,Robot獵場(chǎng)備忘錄:《估值約150億!具身大模型初創(chuàng)公司最新成果:機(jī)器人通用基礎(chǔ)模型[π0]》,人形機(jī)器人場(chǎng)景應(yīng)用聯(lián)盟:《4億美元巨額融資!具身智能機(jī)器人創(chuàng)企估值飆升至170億》

       原文標(biāo)題 : AI芯天下丨分析丨成立8個(gè)月估值24億,這家機(jī)器人公司拿什么吸引了投資人?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)