ChatGPT之外,美國(guó)大模型搞到什么程度了?
通過行業(yè)應(yīng)用先行來帶動(dòng)整體的突破。
文 | 華商韜略 王夢(mèng)欣
年初以來,OpenAI以ChatGPT在全球掀起AI大模型熱潮。但美國(guó)的AI大模型,遠(yuǎn)不止于OpenAI的ChatGPT。
【井噴式發(fā)展】
綜合各種數(shù)據(jù),雖然中國(guó)發(fā)展勢(shì)頭迅猛,但美國(guó)依然是全球發(fā)布大模型最多的國(guó)家,到2023年5月,其10億級(jí)參數(shù)規(guī)模以上的基礎(chǔ)大模型就已突破100 個(gè)。
《經(jīng)濟(jì)學(xué)人》報(bào)道,美國(guó)2022年大模型投資總額達(dá)474億美元,是第二名中國(guó)(134億美元)的約3.5倍,且仍保持激增態(tài)勢(shì)。高盛則進(jìn)一步預(yù)測(cè),美國(guó)2025年大模型相關(guān)投資可達(dá)千億美元,約全球的1/2。
高盛的調(diào)查顯示,羅素3000指數(shù)公司中有16%的公司在2023年的財(cái)報(bào)會(huì)議中提到了大模型,其經(jīng)濟(jì)學(xué)家估計(jì),大模型將在十年內(nèi)提高1%的整體勞動(dòng)生產(chǎn)率,并為標(biāo)普500指數(shù)帶來約14%的增長(zhǎng)。
除了ChatGPT,美國(guó)如今具有代表性的通用大模型公司還包括:Anthropic、Cohere以及Google等。
其中,由OpenAI前高管Dario和Daniela Amodei等人于2021年自立門戶創(chuàng)辦的Anthropic,目前估值已達(dá)300億美元,是僅次于OpenAI(約860億美元估值)的通用大模型企業(yè)。
Anthropic擁有多位參與過GPT-2與GPT-3研發(fā)的前OpenAI核心員工,其大模型產(chǎn)品Claude2也被認(rèn)為是僅次于ChatGPT-4的經(jīng)典力作,甚至有分析師認(rèn)為,Claude2的性能優(yōu)于ChatGPT-4。
比如,Claude2可以處理多達(dá)約75000個(gè)單詞的數(shù)據(jù)集,而ChatGPT大約是3000個(gè),這意味著它可以處理和輸出更復(fù)雜的內(nèi)容,也被應(yīng)用到更有挑戰(zhàn)性的領(lǐng)域,比如生成數(shù)千字的長(zhǎng)文內(nèi)容。
更讓Claude2積攢人氣的是,它直接免費(fèi)向公眾開放,而不是像GPT-4一樣需要付費(fèi)使用。
優(yōu)秀的創(chuàng)始團(tuán)隊(duì)和強(qiáng)大的產(chǎn)品性能,讓Anthropic備受資本追捧,谷歌、韓國(guó)最大移動(dòng)運(yùn)營(yíng)商之一SK Telecom(SKT)、亞馬遜都已成為其投資者,其中僅亞馬遜的投資就高達(dá)40億美元。
在Anthropic之外,還有一家令人稱道的公司便是Cohere。
今年6月,2019年創(chuàng)立的Cohere獲得NVIDIA、Oracle、Salesforce Ventures等投資的2.7億美元,成為估值20億美元的獨(dú)角獸,也是估值僅次于OpenAI和Anthropic的基礎(chǔ)大模型公司。
Cohere同樣以強(qiáng)大創(chuàng)始團(tuán)隊(duì)備受業(yè)內(nèi)矚目,其創(chuàng)始人之一Aidan Gomez是大語言模型領(lǐng)域開創(chuàng)性論文《Attention is All You Need》的最年輕作者,正是這篇文章首次提出了著名的Transformer架構(gòu),成為通用大模型發(fā)展的基礎(chǔ)模型,ChatGPT就是在這一架構(gòu)的基礎(chǔ)上誕生。
▲Cohere推出的第一個(gè)生成式AI應(yīng)用Coral
Cohere與OpenAI提供的產(chǎn)品類似,但它看到了“數(shù)據(jù)隱私”這個(gè)市場(chǎng)機(jī)會(huì),將自己與OpenAI的定位區(qū)分開來,選擇了ToB賽道,堅(jiān)定地走商用大模型的路線。其產(chǎn)品基礎(chǔ)能力包括三大類:文本檢索,文本生成和文本分類,并且可針對(duì)客戶需求,強(qiáng)調(diào)安全性,隱私以及定制化服務(wù)。
Cohere的另一大賣點(diǎn)是,不受任何云端平臺(tái)限制,進(jìn)而保障資料的私密安全性。它提供靈活性存儲(chǔ)和資料隱私保護(hù)路徑,可使用戶實(shí)現(xiàn)本地部署,以滿足客戶資料存儲(chǔ)不同位置的需求。
Cohere能迅速轉(zhuǎn)向,找到自己的差異化定位,離不開Aidan及其聯(lián)合創(chuàng)始人獨(dú)特的人才觀和創(chuàng)業(yè)哲學(xué)。
Aidan曾表示,Cohere尋找不同背景但對(duì)AI非常感興趣并富有雄心的人:他不一定有大公司的漂亮履歷,但是一定要對(duì)自己專注的領(lǐng)域有非常高的興趣和熱情,而且不光會(huì)寫論文,還要有實(shí)際動(dòng)手的能力。
差異化的產(chǎn)品戰(zhàn)略,與眾不同的團(tuán)隊(duì)背景,讓Cohere成為通用大模型領(lǐng)域的一股清流。
日前,Cohere發(fā)布了全球首個(gè)公開可用的多語言理解模型,該模型基于來自母語人士的真實(shí)數(shù)據(jù)進(jìn)行訓(xùn)練,能夠閱讀和理解全球超過100種最常用的語言。
再來看巨頭Google 。
12月6日,Google DeepMind重磅推出了多模態(tài)AI模型Gemini,可以同時(shí)橫跨文字、圖片、影音、程式碼等多模態(tài)進(jìn)行學(xué)習(xí)與理解。
以客服機(jī)器人的應(yīng)用為例,使用Gemini作為模型不僅能夠從對(duì)話的字面意思上理解客戶,更能同時(shí)從表情、聲調(diào)接收到客戶話語中的意圖,能處理包括音訊、程式碼、圖像、視訊等內(nèi)容。
據(jù)實(shí)測(cè)結(jié)果,Gemini是第一個(gè)在大模型多任務(wù)語言理解上超越人類專家的模型,且在32項(xiàng)AI測(cè)試中,有30項(xiàng)測(cè)驗(yàn)結(jié)果超過GPT-4。
憑借強(qiáng)大的性能,Gemini迅速出圈,并且為其母公司Alphabet創(chuàng)造巨大聲量。12月7日,Google 母公司Alphabet股價(jià)漲幅5.31%,收于136.93美元,總市值達(dá)到1.72萬億美元。Google 則計(jì)劃逐步將這一模型融合進(jìn)其搜索、廣告等其他服務(wù)中。
但談到美國(guó)大模型,更值得重視的還是其在產(chǎn)業(yè)中的應(yīng)用進(jìn)展以及未來想象。
【加速產(chǎn)業(yè)落地】
斯坦福大學(xué)發(fā)布的《2023年人工智能索引報(bào)告》中顯示,2022年,美國(guó)的35個(gè)大模型中,只有3個(gè)大模型來自于實(shí)驗(yàn)室,32個(gè)都誕生于產(chǎn)業(yè)中。今年,也仍然保持著這一趨勢(shì)。
2023年3月30日,當(dāng)外界還沉浸在通用大模型涌現(xiàn)的狂歡中,彭博社憑一己之力將眾人的注意力集中到行業(yè)新賽道。當(dāng)天,它對(duì)外宣稱,自己已構(gòu)建出迄今為止最大的金融領(lǐng)域數(shù)據(jù)集,訓(xùn)練了專門用于金融領(lǐng)域大語言模型的LLM,并開發(fā)了擁有500億參數(shù)的語言模型——BloombergGPT。
頂著全球首個(gè)金融大模型的光環(huán),BloombergGPT依托彭博社大量的金融數(shù)據(jù)源,構(gòu)建了一個(gè)3630億個(gè)標(biāo)簽的數(shù)據(jù)集。高金智庫(kù)分析,它可極大提高金融機(jī)構(gòu)的工作效率及穩(wěn)定性,協(xié)助降本增效。
在降本層面,BloombergGPT可以在投研、研發(fā)編程、風(fēng)險(xiǎn)控制及流程管理等方面減少人員投入;增效層面,它既可以通過給定的主題和語境,自動(dòng)生成高質(zhì)量的金融報(bào)告、財(cái)務(wù)分析報(bào)告及招股書,同時(shí)輔助會(huì)計(jì)和審計(jì)方面的工作,還可提煉梳理財(cái)經(jīng)新聞或者財(cái)務(wù)信息,釋放專業(yè)人力到更需要人工專業(yè)的領(lǐng)域。
天風(fēng)證券則在報(bào)告中指出,由于BloombergGPT比ChatGPT擁有更專業(yè)的訓(xùn)練語料,它將在金融場(chǎng)景中表現(xiàn)出強(qiáng)于通用大模型的能力,進(jìn)而也標(biāo)志著金融領(lǐng)域的GPT革命已經(jīng)開始。
BloombergGPT只是一個(gè)典型案例,目前,美國(guó)金融大模型已呈現(xiàn)出明顯的三個(gè)“流派”:一是獨(dú)立全棧自研,強(qiáng)調(diào)自主可控;二是在他人的基礎(chǔ)上結(jié)合自身數(shù)據(jù)與場(chǎng)景微調(diào),形成契合自身的金融大模型;三是從云端調(diào)用,按需接入各類大模型API做私有化部署,科技基礎(chǔ)薄弱的中小型金融公司多采用這類方式。
據(jù)有關(guān)統(tǒng)計(jì)數(shù)據(jù),美國(guó)金融AI約占整體AI領(lǐng)域融資的6.7%。
醫(yī)療行業(yè),是美國(guó)大模型落地應(yīng)用的另一片熱土,谷歌、微軟等科技巨頭, Sensely、Enlitic等醫(yī)療科技公司,AbSci、Exscientia等生物醫(yī)藥初創(chuàng)企業(yè),以及賽紐仕等CXO(醫(yī)藥外包)企業(yè),都已參與其中。
化合物合成、靶點(diǎn)發(fā)現(xiàn)等新藥研發(fā)業(yè)務(wù),電子病歷、輔助問診等醫(yī)院診療業(yè)務(wù),則是美國(guó)醫(yī)療大模型應(yīng)用的常用場(chǎng)景,CT(電腦斷層掃描)、MRI(磁共振成像)等醫(yī)療器械在大模型賦能下進(jìn)一步增強(qiáng)。
眾多醫(yī)療大模型中,谷歌的Med-PaLM2是被關(guān)注的重點(diǎn)。它是第一個(gè)在美國(guó)醫(yī)師執(zhí)照考試(USMLE)的MEDQA數(shù)據(jù)集上達(dá)到“專家”考生水平的大模型,其準(zhǔn)確率達(dá)85分以上;也是第一個(gè)在包括印度AIIMS和NEET醫(yī)學(xué)考試問題的MEDMCQA數(shù)據(jù)集上達(dá)到及格分?jǐn)?shù)的人工智能系統(tǒng),得分為72.3分。
Med-PaLM2也正對(duì)行業(yè)帶來變革性影響。
通過Med-PaLM2,可以分析大規(guī)模的生物醫(yī)藥數(shù)據(jù),發(fā)現(xiàn)與疾病相關(guān)的基因、蛋白質(zhì)和代謝途徑,識(shí)別潛在的靶點(diǎn),幫助篩選具有潛在活性的藥物分子,從而縮小候選藥物的范圍,并優(yōu)先選擇具有較高活性的化合物進(jìn)行后續(xù)實(shí)驗(yàn)驗(yàn)證。備受時(shí)間煎熬的新藥研發(fā),則將因此縮短研發(fā)周期,降低研發(fā)成本。
Med-PaLM2的成功,還刺激谷歌在醫(yī)療大模型領(lǐng)域投入更多。
如:與醫(yī)療軟件公司Epic合作,開發(fā)了一種基于ChatGPT的,可向患者自動(dòng)發(fā)送專業(yè)醫(yī)療信息的工具;谷歌的合作方、護(hù)理供應(yīng)商Carbon Health也基于GPT-4推出了一種AI工具Carby,它可以根據(jù)醫(yī)生病人之間的對(duì)話,自動(dòng)生成診斷記錄,大大提高醫(yī)生的效率和診斷體驗(yàn)。目前Carby已經(jīng)被130+家診所、超過600名醫(yī)療人員使用,舊金山的一家診所表示,使用了Carby后,其就診病人數(shù)量增加了30%。
在谷歌之外,AI芯片巨頭英偉達(dá)也在醫(yī)療大模型領(lǐng)域布局多年。
2021年,英偉達(dá)宣布與Schrodinger(美醫(yī)療資訊技術(shù)公司)建立戰(zhàn)略合作關(guān)系,通過提升其計(jì)算平臺(tái)的速度和精確度,實(shí)現(xiàn)快速、準(zhǔn)確的評(píng)估,加速開發(fā)新的治療方法。
2022年9月,英偉達(dá)發(fā)布了用于訓(xùn)練和部署超算規(guī)模的大型生物分子語言模型——BioNeMo,幫助科學(xué)家更好地了解疾病并尋找治療優(yōu)解,BioNeMo還提供云API服務(wù)支持預(yù)訓(xùn)練AI模型。今年7月,英偉達(dá)又向生物技術(shù)公司Recursion投資5000萬美元,支持開發(fā)和訓(xùn)練在生物和化學(xué)領(lǐng)域的AI基礎(chǔ)模型。
教育領(lǐng)域也是美國(guó)大模型應(yīng)用落地的重要場(chǎng)景之一,其核心應(yīng)用主要集中于語言學(xué)習(xí)、在線課程與輔助學(xué)習(xí)三個(gè)層面。其標(biāo)志性案例是美國(guó)在線教育組織Khan Academy于4月發(fā)布的基于GPT-4模型,具有輔導(dǎo)教學(xué)、教案生成、寫作訓(xùn)練、編程練習(xí)等功能的AI助教Khanmigo。
目前,Khan Academy已經(jīng)實(shí)現(xiàn)商業(yè)化運(yùn)作,付費(fèi)標(biāo)準(zhǔn)為9美元/月或者99美元/年。其中,輔導(dǎo)教學(xué)可以為學(xué)生進(jìn)行一對(duì)一輔導(dǎo)。Khanmigo會(huì)主動(dòng)解釋答題思路,并引導(dǎo)學(xué)生進(jìn)行答題的思維訓(xùn)練,直至學(xué)生自己計(jì)算出正確答案;此外,Khanmigo還可以作為寫作指導(dǎo)老師,根據(jù)人物特征、故事背景等具體細(xì)節(jié),提示和建議學(xué)生以不同的切入點(diǎn)進(jìn)行寫作、辯論等,釋放學(xué)生的創(chuàng)造力。
強(qiáng)大的意圖理解和自然語言交流能力,以及文本和圖像生成能力,讓Khanmigo可以真正理解學(xué)生,有針對(duì)性地給學(xué)生提供個(gè)性化的學(xué)習(xí)建議,并且大幅提升教材的供給,包括寓教于樂的課件、豐富的課外資料等,這讓教育的“千人千面”有了實(shí)現(xiàn)的可能,也正對(duì)行業(yè)產(chǎn)生重要影響。
綜合來看,美國(guó)大模型還在加速與產(chǎn)業(yè)的融合發(fā)展,新的產(chǎn)業(yè)革命也正因此發(fā)生。
【中國(guó)優(yōu)勢(shì)與機(jī)遇】
從全球范圍來看,中美兩國(guó)引領(lǐng)著大模型的發(fā)展。
根據(jù)《中國(guó)人工智能大模型地圖研究報(bào)告》,目前全球累計(jì)發(fā)布大模型202個(gè),其中中美兩國(guó)大模型數(shù)量占全球大模型總數(shù)量的近80%。全球大模型之爭(zhēng)實(shí)際上是中美兩國(guó)的競(jìng)賽。
中國(guó)大模型的參與者同樣眾多,頭部科技企業(yè)(阿里、百度、騰訊、華為等)、新創(chuàng)公司(智譜AI、百川智能等)、傳統(tǒng)AI企業(yè)(科大訊飛、商湯科技等)以及高校研究院(清華、復(fù)旦、中科院等)均已深度布局,并正逐漸形成互聯(lián)網(wǎng)巨頭通用模型領(lǐng)跑、AI廠商、創(chuàng)業(yè)公司及科研院所百花齊放的格局。
雖然目前美國(guó)在大模型領(lǐng)域呈現(xiàn)出領(lǐng)跑態(tài)勢(shì),而且對(duì)中國(guó)采取了諸如禁止美國(guó)企業(yè)向中國(guó)提供云計(jì)算以及大模型訓(xùn)練服務(wù)等打壓措施,中國(guó)大模型依然有著巨大發(fā)展機(jī)遇,并具備超越美國(guó)的基礎(chǔ)。
首先是,中國(guó)從政府到業(yè)界都在力推大模型的發(fā)展與趕超。據(jù)《金融時(shí)報(bào)》報(bào)道,中國(guó)已在全球前十的大模型研發(fā)機(jī)構(gòu)中占據(jù)四席,分別是百度、BAAI智源研究院、清華大學(xué)以及阿里巴巴研究院。百度的“文心一言”、阿里巴巴的“通義千問”等都是我國(guó)自研的大模型,其性能足以與美國(guó)的大模型一較高下。
Leonis Capital報(bào)告分析表示,相較于美國(guó)企業(yè)更加重視底層研發(fā)能力,中國(guó)百度、阿里等領(lǐng)先巨頭之外的絕大多數(shù)企業(yè),更偏框架、行業(yè)應(yīng)用層面的研發(fā),而這種差異將為中國(guó)帶來巨大機(jī)會(huì),讓中國(guó)在生成式AI應(yīng)用和大模型行業(yè)解決方案應(yīng)用領(lǐng)域超越美國(guó),最終以應(yīng)用領(lǐng)先倒逼或支持基礎(chǔ)端的趕超。
因?yàn),中?guó)雖然在底層研發(fā)技術(shù)上相較于美國(guó)略顯遜色,但卻具有超大的市場(chǎng)規(guī)模以及豐富的應(yīng)用場(chǎng)景,可以為大模型的落地應(yīng)用提供廣闊的空間和條件,進(jìn)而通過行業(yè)應(yīng)用先行來帶動(dòng)整體的突破。
大模型一個(gè)很重要的特征是,應(yīng)用和技術(shù)的雙輪驅(qū)動(dòng)。也就是說,消費(fèi)者在使用大模型的時(shí)候,并不僅僅是貢獻(xiàn)利潤(rùn),還可以通過數(shù)據(jù)回環(huán),使大模型獲得更多的反饋,從而提升神經(jīng)網(wǎng)絡(luò)的能力。豐富的場(chǎng)景可以讓大模型更加突出實(shí)用性,并匹配需求取得更好的效果,也帶動(dòng)更快的技術(shù)發(fā)展。
基于這一特征,中國(guó)若能依托巨大的市場(chǎng)規(guī)模以及豐富的場(chǎng)景,把握住應(yīng)用這個(gè)關(guān)鍵,尊重市場(chǎng)規(guī)律,持續(xù)從市場(chǎng)應(yīng)用中獲得利潤(rùn),再反饋給資金和人才的積累,最終在底層技術(shù)上突破將是水到渠成的事。
作為國(guó)內(nèi)AI大模型領(lǐng)軍者的李彥宏近日也在極客公園創(chuàng)新大會(huì)2024上表示,“大模型時(shí)代的來臨,真正的價(jià)值在于原生應(yīng)用。”
李彥宏認(rèn)為,大模型本身并不是大多數(shù)人的創(chuàng)新和創(chuàng)業(yè)機(jī)會(huì),原生應(yīng)用才是。無論對(duì)于大廠,還是中小企業(yè),創(chuàng)業(yè)者,原生應(yīng)用都是很大的機(jī)會(huì)。
李彥宏說,看到媒體、社會(huì)、公眾主要的興奮點(diǎn)還在基礎(chǔ)模型上,沒有轉(zhuǎn)到AI原生應(yīng)用上,“我多多少少有點(diǎn)著急。”最近幾次公開發(fā)言,也括公司內(nèi)部講話,他也都是在不停的強(qiáng)調(diào)。“我們一定要去卷AI的原生應(yīng)用,要把這個(gè)東西做出來了,你的模型才有價(jià)值!
事實(shí)上,中國(guó)已經(jīng)在互聯(lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,通過豐富的場(chǎng)景以及應(yīng)用創(chuàng)新取得領(lǐng)先的發(fā)展,并最終帶動(dòng)整個(gè)科技產(chǎn)業(yè)的進(jìn)步,在大模型領(lǐng)域,這一趨勢(shì)也正在繼續(xù)。但對(duì)比中美在互聯(lián)網(wǎng)領(lǐng)域的發(fā)展,有一點(diǎn)倒是值得中國(guó)大模型企業(yè)現(xiàn)在就高度重視:更早地在海外布局,朝向全球化發(fā)展。
如今的中國(guó)企業(yè),也更有基礎(chǔ)出海,在全球市場(chǎng)找到更加廣闊的發(fā)展空間。
——END——
歡迎關(guān)注【華商韜略】,識(shí)風(fēng)云人物,讀韜略傳奇。
版權(quán)所有,禁止私自轉(zhuǎn)載
部分圖片來源于網(wǎng)絡(luò)
如涉及侵權(quán),請(qǐng)聯(lián)系刪除
原文標(biāo)題 : ChatGPT之外,美國(guó)大模型搞到什么程度了?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-12.26立即報(bào)名>>> 【在線會(huì)議】村田用于AR/VR設(shè)計(jì)開發(fā)解決方案
-
1月8日火熱報(bào)名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會(huì)
-
即日-1.14火熱報(bào)名中>> OFweek2025中國(guó)智造CIO在線峰會(huì)
-
即日-1.24立即參與>>> 【限時(shí)免費(fèi)】安森美:Treo 平臺(tái)帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
-
2
- 1 人形機(jī)器人核心零部件,誰是盈利最強(qiáng)企業(yè)?
- 2 AI Agent現(xiàn)狀如何?聊聊近期國(guó)內(nèi)的智能體市場(chǎng)動(dòng)向
- 3 5nm重大突破,研祥智能助力半導(dǎo)體企業(yè)高效發(fā)展!
- 4 人形機(jī)器人引爆“PEEK材料”!概念股梳理(名單)
- 5 馬云沒回牌桌,但重注全壓在了
- 6 7 豆包AI登頂國(guó)內(nèi)第一!概念股梳理(名單)
- 8 押注AI王者歸來,歌爾股份“智能體”在下一盤“大棋”
- 9 AI超級(jí)應(yīng)用什么時(shí)候才能出現(xiàn)?
- 10 英偉達(dá)迎來當(dāng)頭一棒
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容