截胡GPT-4o,谷歌開(kāi)發(fā)者大會(huì)一夜發(fā)布十幾款A(yù)I新品
一年一度的Google I/O開(kāi)發(fā)者大會(huì)如期而至,在本場(chǎng)發(fā)布會(huì)中,谷歌一口氣交出數(shù)個(gè)AI新品,輪番轟炸我們的視覺(jué)神經(jīng)。
首先是真正意義上的全新產(chǎn)品——Google AI Overviews,這是一項(xiàng)基于大模型技術(shù)開(kāi)發(fā)的全新搜索引擎,旨在以聊天的方式為用戶提供精準(zhǔn)、高效的搜索結(jié)果。沒(méi)錯(cuò),傳聞中OpenAI正集全力要打造的就是這玩意兒。
(圖源:Google)
同樣與搜索有關(guān)的還有「Ask Photos」,相比起AI Overviews,它更專注于圖像理解與圖像信息捕捉,這意味著現(xiàn)在你可以通過(guò)文字描述的方式,找到藏在相冊(cè)里的那些被遺忘已久的照片。
還記得前天晚上OpenAI發(fā)布的GPT-4o在視覺(jué)與聽(tīng)覺(jué)上的巨大提升嗎?谷歌也整了一個(gè)相似的AI工具——Project Astra。定位上,Project Astra和GPT-4o都是多模態(tài)AI項(xiàng)目,用戶可以利用手機(jī)攝像頭和麥克風(fēng)與現(xiàn)實(shí)世界進(jìn)行交互,例如幫助失明人士識(shí)別路上的風(fēng)景等。
(圖源:Google)
以上提到的,只是本場(chǎng)I/O開(kāi)發(fā)者大會(huì)上谷歌公布眾多AI新技術(shù)的冰山一角,還有更多新玩意值得我們深入探討。難怪,在這場(chǎng)發(fā)布會(huì)后,不少媒體都表示認(rèn)為谷歌像是要用海量新品「圍剿」OpenAI,重樹(shù)谷歌在AI市場(chǎng)的地位。
對(duì)轟GPT,谷歌怒發(fā)數(shù)款A(yù)I新品
很顯然,Google I/O 2024最大主角就是「AI」,從硬件到軟件,從服務(wù)到功能,幾乎沒(méi)有任何一部分離得了AI這個(gè)關(guān)鍵詞。據(jù)不完全統(tǒng)計(jì),這場(chǎng)發(fā)布會(huì)上,谷歌至少提了121次「AI」。
既然聊到AI大模型,那還是先看看Gemini又有了哪些新變化。
Gemini Pro從前代的100萬(wàn)Tokens升級(jí)到了200萬(wàn)Tokens,與月之暗面的Kimi Chat長(zhǎng)度相近,但這個(gè)模式并非面向所有用戶開(kāi)放,需要單獨(dú)申請(qǐng)。Gemini 1.5推出了Flash版本,支持100萬(wàn)Tokens,主打一個(gè)便宜量大,1M Tokens輸入僅0.35美元、1M Tokens輸出也僅需0.53美元。
(圖源:Google)
另外,谷歌還宣布Gemini Nano進(jìn)入手機(jī)端,目前它能實(shí)現(xiàn)的功能是幫助用戶接打電話、識(shí)別電話詐騙和騷擾電話。實(shí)話說(shuō),Gemini Nano的手機(jī)端實(shí)用性還是略顯寒酸,甚至連文字處理都不支持,還不如小愛(ài)同學(xué)來(lái)得簡(jiǎn)單粗暴。
假如你對(duì)Gemini Nano的功能表現(xiàn)不太滿意,也能試試谷歌即將推出的Gemini手機(jī)客戶端,它與前天發(fā)布的GPT-4o一樣,都是AI多模態(tài)應(yīng)用,能聽(tīng)、會(huì)讀,還能提供情緒價(jià)值。只是從演示視頻來(lái)看,Gemini還不是太「擬人化」。
Gemma2也在這場(chǎng)發(fā)布會(huì)上正式登場(chǎng),作為谷歌下一代開(kāi)源模型,它升級(jí)到了27B規(guī)模,和Meta的Llama 3相近,但體積更小些。值得注意的是,Gemma2能夠在NVIDIA的GPU或Vertex AI的單個(gè)TPU主機(jī)上高效運(yùn)行。Gemma還迎來(lái)了一位新成員:PaliGemma,這是一個(gè)開(kāi)源的圖像輸入模型。
除了Gemini和Gemma的升級(jí)之外,基于大模型技術(shù),谷歌還推出了三款全新的AI大模型應(yīng)用:Imagen 3、Music AI Sandbox、Veo。
(圖源:Google)
Imagen 3是谷歌最新的畫(huà)圖模型,你可以理解為谷歌版本的stable diffusion,即文生圖模型。按照谷歌的說(shuō)法,Imagen 3相比起前代,在生成速度、生成質(zhì)量和理解能力上均有較大的提升。
Music AI Sandbox是一款音樂(lè)創(chuàng)作大模型,和之前火遍全網(wǎng)的suno差不多,而它的優(yōu)勢(shì)在于創(chuàng)作完成后能夠一鍵上傳至Youtube,這何嘗不是一種生態(tài)優(yōu)勢(shì)呢?至于Veo,這是谷歌首款文生視頻模型,對(duì)標(biāo)GPT的Sora,但它時(shí)長(zhǎng)支持到最高1分鐘、分辨率也支持到1080P,還支持更多濾鏡和電影風(fēng)格,無(wú)論是哪一方面,看起來(lái)都比Sora靠譜得多。
不難看出,谷歌目前在AI領(lǐng)域的戰(zhàn)略還是相對(duì)穩(wěn)健,例如模型性能升級(jí),僅從100萬(wàn)Tokens提升到200萬(wàn)Tokens,和早前大眾的預(yù)期有些差距;而新的AI大模型應(yīng)用部分,無(wú)論是新升級(jí)的文生圖模型,還是全新的音樂(lè)創(chuàng)作模型、文生視頻模型,都是「守擂」型產(chǎn)品,少了些創(chuàng)意和想象力。但谷歌天然的優(yōu)勢(shì)在于生態(tài),這才是其與OpenAI叫板的底氣。
AI加入谷歌全家桶
作為當(dāng)前的互聯(lián)網(wǎng)巨頭之一,谷歌的軟件生態(tài)、服務(wù)生態(tài)自然是相當(dāng)全面的,比如谷歌擁有當(dāng)前最大用戶數(shù)量的瀏覽器Chrome,也擁有最完善的Google辦公套件,以及目前最大的移動(dòng)操作系統(tǒng)生態(tài),F(xiàn)如今,谷歌也正式將AI引入到「谷歌全家桶」中,徹底梭哈AI。
首先,谷歌發(fā)布了全新側(cè)欄應(yīng)用Side Panel,這是一項(xiàng)綜合了谷歌旗下服務(wù)的「?jìng)?cè)邊欄」,當(dāng)你在Gmail中收到重要信息時(shí),可以直接在Side Panel中呼出谷歌云盤存儲(chǔ)信息,又或是啟動(dòng)Google Map進(jìn)行導(dǎo)航,還可以使用谷歌日歷記錄日程等。在谷歌的計(jì)劃中,Gmail很快會(huì)擁有自動(dòng)處理重要信息的能力。
Gmail還加入了智能對(duì)話的特性,簡(jiǎn)單來(lái)說(shuō),現(xiàn)在你能夠以對(duì)話的方式在郵箱中找到所需要的信息及相關(guān)郵件,還能讓Gemini幫你總結(jié)這些郵件說(shuō)了什么,甚至還可以讓它幫你智能回復(fù)對(duì)方,并保持郵件所需的正式用語(yǔ)和語(yǔ)氣。
(圖源:Google)
其次,前面提到了Gemini將推出手機(jī)客戶端,除了能夠和用戶進(jìn)行普通的對(duì)話、文章總結(jié)、文字生成等,Gemini還擁有Gemini Live功能,即通過(guò)攝像頭和你直接對(duì)話。
最后,也是最重磅的——AI Overviews。作為搜索引擎巨頭,谷歌要如何將大模型融入到搜索上,這一直是我們所好奇的,就在這場(chǎng)發(fā)布會(huì)上,谷歌終于推出了首款A(yù)I搜索大模型AI Overviews。
與Perplexity或Arc Search相比,AI Overviews的優(yōu)勢(shì)在于綜合搜索能力有了長(zhǎng)足的進(jìn)步,且得益于Gemini的推理能力提升,其獲得的搜索結(jié)果也會(huì)更符合用戶的需求。AI Overviews還支持Plan Ahead,即「為你計(jì)劃」,盡管AI搜索只能幫用戶做搜索結(jié)果的總結(jié),但基于推理能力和決策能力的升級(jí),Plan Ahead能夠?yàn)橛脩羯筛鞣N計(jì)劃,例如飲食計(jì)劃、健身計(jì)劃、旅行計(jì)劃等。
(圖源:Google)
AI Overviews不僅支持文字搜索,還能通過(guò)語(yǔ)音和圖片進(jìn)行搜索,例如當(dāng)你遇到不認(rèn)識(shí)的植物,那么僅需拍攝、上傳,就能讓谷歌幫你找出這種植物的相關(guān)資料。而這項(xiàng)功能也會(huì)與Pixel上的「劃圈即搜」功能相結(jié)合,在未來(lái)幾個(gè)月內(nèi)上線。
可以說(shuō),AI已經(jīng)成為谷歌幾乎所有業(yè)務(wù)的核心,除了我們熟悉的大模型應(yīng)用之外,還在辦公、娛樂(lè)領(lǐng)域提供基于Gemini大模型的AI功能,并互相之間有所串聯(lián),提升綜合工作的效率。
One More Thing:神秘AI眼鏡曝光
在演示Project Astra的過(guò)程中,除了像OpenAI一樣使用iPhone進(jìn)行功能展示,還使用了一款智能眼鏡。但與我們之前見(jiàn)到的Google Project Galass不同,這可能是一款全新的智能眼鏡產(chǎn)品。
(圖源:Google)
初代Google Project Galass誕生于2012年,在那個(gè)智能手機(jī)還不算普及的年代里,谷歌就將智能穿戴設(shè)備打造成平民化的消費(fèi)級(jí)產(chǎn)品。但事實(shí)上,Google Project Galass受限于產(chǎn)品形態(tài)和產(chǎn)品性能,以及相對(duì)高昂的售價(jià),一直都不受市場(chǎng)的歡迎,而谷歌也在前幾年宣告這個(gè)項(xiàng)目被取消。
Project Astra可能是最適合Google Project Galass的AI形態(tài),一方面,它的交互簡(jiǎn)單,無(wú)需太多傳感器進(jìn)行輔助識(shí)別;另一方面,它利用大模型的學(xué)習(xí)、理解、推理能力,能夠簡(jiǎn)單地幫助用戶判斷現(xiàn)實(shí)世界的物體、景色以及突發(fā)事件。
當(dāng)然,谷歌并沒(méi)有真正發(fā)布這款產(chǎn)品,但結(jié)合Apple Vision Pro重新帶動(dòng)虛擬現(xiàn)實(shí)(空間計(jì)算)市場(chǎng)的熱議來(lái)看,谷歌極有可能搶先于蘋果,將AI大模型帶入到穿戴設(shè)備,以快速搶占AR/VR市場(chǎng)。
眼花繚亂的I/O,谷歌真慌了神?
整場(chǎng)發(fā)布會(huì)下來(lái),谷歌發(fā)布了非常多的AI新品,涉及到大模型技術(shù)的迭代、新AI應(yīng)用的落地以及開(kāi)源模型再一次進(jìn)化。但長(zhǎng)達(dá)數(shù)小時(shí)的發(fā)布會(huì)加體驗(yàn)環(huán)節(jié),谷歌缺少了一款真正意義上的「爆品」來(lái)引起市場(chǎng)的高度關(guān)注。
比如,谷歌發(fā)布了一款對(duì)標(biāo)OpenAI Sora的Veo,無(wú)論是輸入內(nèi)容的支持、生成視頻時(shí)長(zhǎng)還是生成視頻的清晰度,都可以說(shuō)是「吊打」Sora的存在,但Sora已經(jīng)搶先于谷歌,引發(fā)了市場(chǎng)對(duì)文生視頻應(yīng)用的討論,這就導(dǎo)致盡管Veo很牛,可討論度明顯不足。
(圖源:Google)
又或者說(shuō),谷歌似乎不太懂如何抓住大家的眼球,這從其頻頻翻車的演示也能看出些端倪。還記得Bard首次出現(xiàn)時(shí)回答問(wèn)題錯(cuò)誤的情況嗎?是的,在這一次AI Overviews的演示上,又一次給用戶錯(cuò)誤的建議,引起不小的爭(zhēng)議。
而谷歌在會(huì)上強(qiáng)調(diào)了Gemini的「優(yōu)惠價(jià)格」,試圖想要以低價(jià)與頭部企業(yè)們競(jìng)爭(zhēng)。但現(xiàn)實(shí)狀況是,百度文心一言、阿里通義千問(wèn)早就開(kāi)放了長(zhǎng)文本閱讀、月之暗面的Kimi也加入了200萬(wàn)Tokens的免費(fèi)大戰(zhàn),就連有些晚來(lái)的豆包,也在今日舉行的發(fā)布會(huì)上公開(kāi)了超低價(jià)的策略。
創(chuàng)意欠缺、低價(jià)拼不過(guò),這就是谷歌在I/O開(kāi)發(fā)者大會(huì)上給大家的印象。不過(guò),谷歌最重要的殺手锏仍然是它的AI搜索,而這項(xiàng)功能是否會(huì)讓谷歌實(shí)現(xiàn)逆風(fēng)翻盤,或許還要等到AI Overviews正式上線后才能解答。
原文標(biāo)題 : 截胡GPT-4o,谷歌開(kāi)發(fā)者大會(huì)一夜發(fā)布十幾款A(yù)I新品
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-12.26立即報(bào)名>>> 【在線會(huì)議】村田用于AR/VR設(shè)計(jì)開(kāi)發(fā)解決方案
-
1月8日火熱報(bào)名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會(huì)
-
即日-1.14火熱報(bào)名中>> OFweek2025中國(guó)智造CIO在線峰會(huì)
-
即日-1.24立即參與>>> 【限時(shí)免費(fèi)】安森美:Treo 平臺(tái)帶來(lái)出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
-
2
- 1 人形機(jī)器人核心零部件,誰(shuí)是盈利最強(qiáng)企業(yè)?
- 2 AI Agent現(xiàn)狀如何?聊聊近期國(guó)內(nèi)的智能體市場(chǎng)動(dòng)向
- 3 5nm重大突破,研祥智能助力半導(dǎo)體企業(yè)高效發(fā)展!
- 4 人形機(jī)器人引爆“PEEK材料”!概念股梳理(名單)
- 5 馬云沒(méi)回牌桌,但重注全壓在了
- 6 7 豆包AI登頂國(guó)內(nèi)第一!概念股梳理(名單)
- 8 押注AI王者歸來(lái),歌爾股份“智能體”在下一盤“大棋”
- 9 AI超級(jí)應(yīng)用什么時(shí)候才能出現(xiàn)?
- 10 英偉達(dá)迎來(lái)當(dāng)頭一棒
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容