天堂网在线最新版www,一级黄色在线观看

GPT-4o重磅發(fā)布，但AI已經(jīng)進入泡沫前期

2024-05-21 11:21

GPT-4o很強，但沒到顛覆世界的程度

前段時間OpenAI發(fā)布了GPT-4o（“o”代表“omni”）。簡單來說它可以實現(xiàn)文本、音頻和圖像的任意組合作為輸入，并生成文本、音頻和圖像輸出的任意組合。且有諸多驚艷應用。

GPT-4o 的主要升級點在于打通任何文本、音頻和圖像的輸入，相互之間可以直接生成，無需中間轉(zhuǎn)換；此外 GPT-4o 語音延遲大幅降低，能在 232 毫秒內(nèi)回應音頻輸入，平均為 320 毫秒，這與對話中人類的響應時間相似。

GPT-4o 不僅能通過視覺 AI 能力理解攝像頭中發(fā)生的事情，同時還能夠?qū)⒗斫獾膬?nèi)容通過語音與舊版本 ChatGPT 交互，進行更加豐富有趣的互動。同時還支持中途打斷和對話插入，且具備上下文記憶能力。

而且 GPT-4o 對廣大用戶來說它有個遠超 GPT-4 的優(yōu)點：免費。體驗 GPT-4 級別的智能、從模型和網(wǎng)絡獲取響應、分析數(shù)據(jù)并創(chuàng)建圖表、聊一聊你拍的照片、上傳文件以獲取摘要、寫作或分析幫助、使用 GPTs 和 GPT Store、通過 Memory 構建更加有幫助的體驗，這些功能全部可以免費獲得。要知道 GPT-4 Plus 版本就因為收費貴、付款麻煩，使用門檻高讓絕大部分人望而卻步，能讓更多的人用上便是 GPT-4o 的最大亮點。

但是現(xiàn)在能用上GPT-4o只有GPT-4 Plus版本，其他版本需要后續(xù)開放而且免費的GPT-4o次數(shù)有限，過了次數(shù)會直接轉(zhuǎn)為GPT-3.5。

有業(yè)內(nèi)人士認為，特別是在預告中 OpenAI 公司的 CEO Altman 甚至用上了 " 魔法 " 二字，相比之下 GPT-4 的神通廣大、Sora 那種神筆馬良的既視感，GPT-4o 顯然稱不上魔法。而且從多模態(tài)能力方面考察，GPT-4o 的能力并沒有比上代有明顯提升。哪怕是和 GPT 的老對手 Anthropic 的 Claude 3 相比也沒有拉開差距，可以說從模型能力來看 GPT-4o 和 GPT-4 沒有本質(zhì)區(qū)別。

所以GPT-4o的發(fā)布更多像是一種搶跑，展現(xiàn)一種領先的姿態(tài)，也是維持熱度刺激購買需求的一種方式。

有意思的是，就在GPT-4o發(fā)布24小時之后，谷歌也緊跟著發(fā)布產(chǎn)品頗有對陣叫板的意味。谷歌CEO桑達爾·皮查伊發(fā)布數(shù)十款Google和AI 結(jié)合產(chǎn)品，堪稱“全家桶”級別，全面圍剿Open AI。其中包括支持200萬token長文本的Gemini 1.5 Pro和 Gemini 1.5 Flash，對標Sora的Veo，開源模型Gemma 2，支持生成式搜索的AI Overviews、第六代TPU等。

谷歌CEO桑達爾·皮查伊

整場開發(fā)者大會最大的看點為，谷歌推出的AI語音助手——Astra，它能夠通過攝像頭識別物體、代碼和各種東西�，F(xiàn)場演示視頻中，用戶要求Astra在看到發(fā)出聲音的東西時告訴她，助手回答說，它可以看到一個發(fā)出聲音的揚聲器。對于一閃而過的蘋果，Astra居然也能夠準確回答出在眼鏡旁邊。除Astra外，谷歌還推出基于Gemini的多款通用AI Agent子系列產(chǎn)品。如音頻的NotebookLM、音樂的Music AI Sandbox、視頻的Veo、圖像的Imagen 3，直接對標OpenAI發(fā)布的GPT-4o、Dall-E和Sora。

但問題也跟OpenAI類似，目前還不足以讓開發(fā)者構建更加原生和殺手級應用，從推理能力到多模態(tài)能力都是如此。兩家更像是你追我趕的算術級競爭，誰也沒有拉開太多，自然就很難貢獻震驚世界的應用。

也難怪馬斯克在看過發(fā)布會后表示，GPT-4o的演示讓他感到“不適、尷尬”。Andrej Karpathy大佬也用十分平靜的語氣給出技術總結(jié)，得到了馬斯克的附議：他們發(fā)布的是一個在同一神經(jīng)網(wǎng)絡中結(jié)合文本-音頻-視頻三種模態(tài)并同時處理的模型，僅此而已。

大模型也要“精打細算”

去年生成式AI與大語言模型這一撥科技熱潮在去年席卷了全球科技圈。無論是科技巨頭還是新興獨角獸，都在爭先恐后研發(fā)規(guī)模更大、性能更強的模型，進而引發(fā)了圍繞AI芯片的軍備競賽，并讓身為AI軍火商的英偉達比前一年多賺了340億美元。

但今年的情況已經(jīng)顯然沒有那么樂觀，務實謹慎的風格傳遍了科技圈�？萍济襟wThe Information報道稱，「包括微軟、亞馬遜和Google在內(nèi)的云廠商和其他銷售該技術（指生成式AI）的公司，正在降低自己的預期」。一些人已經(jīng)在擔憂生成式AI吹出來的泡泡會不會已經(jīng)太大了，它是未來，但可能不是現(xiàn)在，就像互聯(lián)網(wǎng)如今已經(jīng)是一門萬億美元級別的生意，但并不妨礙千禧年時吹出的互聯(lián)網(wǎng)泡泡的爆炸結(jié)局。

關于OpenAI公司去年的營收，目前有兩種說法，The Information稱其2023年最后一個月的年化收入是16億美元，而《金融時報》給出的數(shù)字是20億美元。這個收入水平在AI行業(yè)絕對是第一梯隊，但是跟微軟每年提供給OpenAI公司不低于10億美元的費用相比，仍然不算多，更何況Sam Altman雄心勃勃計劃7萬億美元自建芯片工廠打造軟硬一體呢？或許上市能解決OpenAI的投資難題，但是作為非營利性組織的OpenAI轉(zhuǎn)為正常的私人盈利公司尚存在諸多問題，短期來看并不現(xiàn)實。

一大批剛剛在2023年晉升為獨角獸的美國生成式AI公司，已經(jīng)落入理想難以兌現(xiàn)的窘境。曾經(jīng)在AI獨角獸上排名前3的初創(chuàng)公司Inflection兩位聯(lián)合創(chuàng)始人跳槽微軟，因為挖走了Inflection大部分員工，包括其創(chuàng)始人，微軟同意向Inflection支付約6.5億美元，以獲得其模型授權，并補償Inflection的投資人。

排名僅次于Inflection的另一家AI獨角獸Cohere也被傳出融資困境。這家公司自去年12月就開始尋求以60億美元估值融資5億美元，迄今沒有確定交易，而它上一輪融資還停留在去年6月。按照大模型的燒錢速度，這些無法自我造血的獨角獸原本每半年甚至每個季度都要有新的融資才能為繼。

更為尷尬的是這些公司并沒有明顯推出強于GPT-4的大模型，雖然宣傳上都是“各種領先”但實際體驗下來差距不小。而且這些公司基本不具備盈利能力，成為資本棄兒，缺少后續(xù)輸血也就不難理解了。

金沙江主管合伙人朱嘯虎認為，大模型是很差的商業(yè)模式。問題是技術沒有差異點，而且每一代技術比如3.5可能就要幾千萬美金，4.0可能要幾億美金，5.0可能要幾十億美金，每一代模型你都要重新去砸錢，而且你變現(xiàn)周期可能就兩三年，這比發(fā)電廠還要差。

比如發(fā)電廠，在投了基建以后，基本上不需要再投入很多錢，但大模型是要每兩三年就要砸更多的錢去升級，而且變現(xiàn)的周期可能就兩三年。說實話這個商業(yè)模式是非常差的商業(yè)模式。

所以不管國內(nèi)外AI投資都已經(jīng)進入了要認真考慮成本收益的階段，如果AI已經(jīng)進入終局那么行業(yè)第二第三將變得價值極低，現(xiàn)階段OpenAI領導者的地位仍然牢不可破，對于初創(chuàng)公司來說可能隨時在“死亡邊緣”。

去年的“宮斗”仍沒有結(jié)束

去年 11 月，Ilya 與另外三名董事會成員一道，迫使該公司高調(diào)的首席執(zhí)行官 Sam Altman 辭職，但后來他表示后悔。據(jù)報道，雙方爭論的焦點是對 OpenAI 方向的分歧：Ilya 對 Altman 以犧牲安全工作為代價而急于推出人工智能產(chǎn)品感到沮喪。Altman 在被趕下臺的五天后就回到了 OpenAI，重申了自己的控制權，并繼續(xù)推動越來越強大的技術，這讓他的一些批評者感到擔憂。Ilya 仍然是 OpenAI 的員工，但他再也沒有回去工作。

Sam Altman（左）Ilya Sutskever（右）

今年5月17日，在公司聯(lián)合創(chuàng)始人兼首席科學家伊利亞·蘇茨克沃（Ilya Sutskever）周二宣布離職后幾個小時，其超級對齊團隊負責人之一詹·萊克（Jan Leike）也在社交平臺X上發(fā)帖宣布辭職。

OpenAI超級對齊負責人Jan Leike，自曝離職的真正原因，以及更多內(nèi)幕。一來算力不夠用，承諾給超級對齊團隊的20%缺斤少兩，導致團隊逆流而行，但也越來越困難。二來安全不重視，對AGI的安全治理問題，優(yōu)先級不如推出“閃亮的產(chǎn)品”。

Jan Leike

這里先解釋一下“對齊”是什么意思，由于GPT大模型的生成是黑盒機制產(chǎn)生內(nèi)容是隨機可控性弱的，難免產(chǎn)生不符合人類價值觀的東西。所以他們在構建一個能與人類水平相媲美的自動對齊研究器，盡可能將相關工作交由自動系統(tǒng)完成，同時確保人工智能系統(tǒng)的行為與人類價值觀和目標保持一致。

離開的也不只是對齊團隊的人，OpenAI前工程負責人，曾領導過ChatGPT, GPT-4, DALL·E和APIs上線的Evan Morikawa也宣布離開，將與前波士頓動力高級機器人學家Andy Barry和Deep Mind研究科學家Pete Florence 和 Andy Zeng共同開展一個全新項目，并認為“這是在全球范圍內(nèi)實現(xiàn) AGI 所必需的”。

有網(wǎng)友表示這聽起來像是OpenAI想繼續(xù)燒錢商業(yè)化，而不是確保前進步驟的安全。他們想成為大亨，而不是英雄。

對Jan Leike的長文開炮，奧特曼當然是不會就此作罷的了。很快他便發(fā)文“反擊”：“我非常感謝 Jan Leike 對 OpenAI 對齊研究和安全文化的貢獻，也非常難過看到他離開。他說得對，我們還有很多事情要做，我們承諾會做到。我會在接下來的幾天里發(fā)一篇更長的文章。”不出意外的話，未來幾天還會像去年一樣，小作文反轉(zhuǎn)不斷。至于真相是什么，或許只有躬身其中的少數(shù)人知道，是非曲直其實對網(wǎng)友來說并不太重要。

重要的是此次“離職潮”表明了去年以來的內(nèi)部矛盾并沒有消弭，反而是隱藏轉(zhuǎn)移爆發(fā)。歸根結(jié)底的來說，Ilya Sutskever跟Sam Altman之爭主要是技術原教旨主義者和市場激進派之間的矛盾。Jan Leike表示：“我相信，我們應該將更多的帶寬花在為下一代模型做準備上，關注安全、監(jiān)控、對抗性穩(wěn)健性、超級對齊、保密性、社會影響等相關話題。這些問題很難解決，我擔心我們還沒有走上正軌。”

但Sam Altman一直以來在強調(diào)AI會如何顛覆世界創(chuàng)造出令人驚訝的產(chǎn)品，在瘋狂地積累芯片甚至要自建芯片廠，來加速技術的發(fā)展。筆者認為兩者之爭是幾乎所有AI從業(yè)者都要考慮的事情，技術當然可以促進社會生產(chǎn)力發(fā)展，但也會帶來一系列安全問題和風險。

Sam Altman未必真的是唯利是圖一心只想賺錢，他所說的重視AI安全不一定是謊言。但作為管理者要考慮公司的長久運營，能兼顧是最好不能兼顧那就需要有優(yōu)先級。目前AI對齊所需算力并不小而且對齊之后的AI性能下降明顯，這可能是Sam Altman無法給對齊團隊滿意安排的重要原因之一。當然真實情況可能更復雜，但邁向下一個時代的科技生產(chǎn)力，如果沒有足夠的商業(yè)利益一切都會是空談。

如果OpenAI完全放棄對齊或者不重視，那對未來的GPT-5來說將是巨大的風險，商業(yè)化被迫戛然而止也有可能�？傊�，我們希望出現(xiàn)一個更好更開放的OpenAI，而不是把問題都丟給社會。

中國大模型也無需自卑

近一個月國產(chǎn)大模型讓市場產(chǎn)生了正在追平美國的印象，很多亮點也來自初創(chuàng)企業(yè)。月之暗面將上下文長度擴展至200萬token；Minimax出海陪聊應用Talkie日活接近 Character.AI；發(fā)布了Vidu的生數(shù)科技，提出U-ViT架構比Sora還早；開源模型DeepSeek在保證性能的前提下，讓成本降至1塊錢百萬token輸入。

有些文章說國內(nèi)AI都在卷價格只有國外在卷功能，其實并不客觀。推理需求已經(jīng)真實存在了。去年底發(fā)布以來，阿里巴巴近1.7萬中小外貿(mào)商家訂購了AI生意助手，發(fā)布了上百萬商品，搜索量提升近四成。字節(jié)跳動將豆包大模型接入了抖音、飛書等業(yè)務，日均處理1200億token文本，但沒有公布參數(shù)等細節(jié)，可能是因為與Tiktok用了類似的推薦算法。百度文心大模型日處理文本2500億token，日均調(diào)用量為去年底的4倍。騰訊已經(jīng)把混元大模型用在了會議、讀書與游戲客服上；AI支持的廣告服務的點擊率與交易量也在上升。

開源大模型通義千問已經(jīng)火到國外去了，有太多外國人在討論和使用（通義千問）Qwen大模型。

通義發(fā)布1100億參數(shù)開源模型Qwen1.5-110B，該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型；在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B沖上榜首，再度證明通義開源系列業(yè)界最強的競爭力。

或許有人會質(zhì)疑跑分成績，但是面向C端主打全功能免費的通義，卻是真香了。同時通義千問 APP 還升級為「通義 APP」，集成文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等全棧能力，想成為用戶的「全能 AI 助手」。

寫在最后

無論是OpenAI還是國內(nèi)的AI企業(yè)，都離不開金融資本和產(chǎn)業(yè)資本的運作，過于排斥商業(yè)化并不是好事，但也應該有底線取得安全與效益的平衡，只有這樣才能實現(xiàn)科技創(chuàng)造美好未來。歷史上的重大技術進步往往伴隨著金融泡沫，這是新技術推廣的自然組成部分。AI有泡沫并不可怕，可怕的是技術的基石不牢，難以解決現(xiàn)實中的種種問題，最終難以落地變成“全都是泡沫”。

參考資料：

OpenAI重磅發(fā)布GPT-4o 來源：Founder Park

GPT-4o搶先測來源：DoNews

GPT-4o很好但最大亮點只有免費來源：ZAKER

大模型的泡沫來了嗎？來源：NewNewThing

中美巨頭的AI差距來源：未盡研究

OpenAI保護人類的團隊分崩離析來源：硅星人Pro

OpenAI的元老科學家都跑光了來源：AI前線

Ilya離開OpenAI內(nèi)幕曝光來源：量子位

通義千問2.5正式發(fā)布來源：阿里云

原文標題 : GPT-4o重磅發(fā)布，但AI已經(jīng)進入泡沫前期