大模型的浪頭卷到了金融業(yè)
導(dǎo)語:金融業(yè)數(shù)智化步入“深水區(qū)”。
出品丨數(shù)科社
作者丨林木
就在由ChatGPT引爆的國內(nèi)“千模大戰(zhàn)”激戰(zhàn)正酣之際,與AIGC有著諸多契合場景的金融領(lǐng)域踏上了一條探尋行業(yè)大模型的變革之路。
今年3月,彭博社針對金融業(yè)推出大型語言模型BloombergGPT,立即引起國內(nèi)市場對金融垂直領(lǐng)域大模型應(yīng)用的廣泛關(guān)注。繼各互聯(lián)網(wǎng)巨頭躬身入局后,金融科技賽道的頭部玩家們也開始馬不停蹄的探路大語言模型。
5月,星環(huán)科技推出第一款面向金融量化領(lǐng)域的生成式大語言模型“無涯Infinity”,度小滿開源國內(nèi)首個千億參數(shù)金融大模型“軒轅”;6月,恒生電子發(fā)布金融行業(yè)大模型LightGPT,將于9月底開放試用接口;最近,馬上消費的自研金融大模型箭在弦上即將發(fā)布……
在近百款大模型產(chǎn)品的激烈交鋒下,通用大模型的求解能力日益趨近同質(zhì)化,也讓大模型在特定行業(yè)的落地奔跑成為新賽點。
那么,“金融大模型”這條路究竟如何走通?又將給金融行業(yè)帶來哪些驚喜和挑戰(zhàn)?
01丨探路“金融大模型”
月初剛剛在上海落幕的WAIC上,“大模型”無疑成為今年廠商、與會者屢屢提及的熱詞。大會期間,來自各家廠商的30多個基礎(chǔ)大模型、垂直大模型集中亮相,讓眼下這場“千模大戰(zhàn)”的硝煙味又重了一分。
在讓人眼花繚亂的通用大模型之中,垂直于行業(yè)的大模型可謂是今年大會的亮點之一。馬上消費CTO蔣寧在現(xiàn)場接受媒體采訪時表示,大語言模型技術(shù)出世后,對金融行業(yè)的人工智能技術(shù)應(yīng)用無異于“強心劑”。
在他看來,金融行業(yè)有著數(shù)據(jù)密集型、技術(shù)密集型的天然屬性,一直在探索數(shù)據(jù)資產(chǎn)化,挖掘數(shù)據(jù)價值,同時又面臨著如銀行線下網(wǎng)點的價值傳遞效率問題、用戶體驗問題,需要機構(gòu)持續(xù)創(chuàng)新。
基于這些行業(yè)特點,也注定了大語言模型技術(shù)將會為其帶來新的賦能。3月底,BloombergGPT的發(fā)布標志著ChatGPT引爆的AI熱潮已一路蔓延到了金融圈。
據(jù)彭博社發(fā)布的報告指出,這一專門訓練用于金融領(lǐng)域的大語言模型(LLM),訓練中在金融任務(wù)上的表現(xiàn)遠超過現(xiàn)有模型,且在通用場景上的表現(xiàn)與現(xiàn)有模型也能一較高下。
這將意味著,LLM正在邁向結(jié)合具體行業(yè)和特定場景進行垂直落地的新階段,不僅是其實現(xiàn)商業(yè)化躍遷的關(guān)鍵,更是整個產(chǎn)業(yè)大爆發(fā)的重要一步,這也引來國內(nèi)金融科技廠商迅速跟進。
“對比于通用大模型的能力而言,金融行業(yè)非常需要垂直行業(yè)大模型。”在不久前召開的2023全球數(shù)字經(jīng)濟大會上,度小滿CTO許冬亮也給出了自己的看法。
他認為,囿于金融行業(yè)在數(shù)據(jù)安全隱私、風控、精度以及實時性等方面要求較高,使得通用大模型在金融能力上缺乏必要的訓練數(shù)據(jù),從而對金融常識、生成的可控性和準確性都達不到這個行業(yè)的最低要求,因此需要針對金融機構(gòu)定制的行業(yè)大模型去發(fā)揮效力。
作為搶先一步試水的頭部玩家之一,度小滿在5月下旬推出了國內(nèi)首個垂直金融行業(yè)的開源大模型“軒轅”。該模型基于1760億參數(shù)的Bloom(決定輸入數(shù)據(jù)如何轉(zhuǎn)換為輸出內(nèi)容的變量)大模型基礎(chǔ)訓練而來,相較于通用大模型,在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等金融場景任務(wù)上的表現(xiàn)可圈可點。
下水的顯然不止度小滿一家。6月28日,恒生電子金融行業(yè)大模型LightGPT也首次對外亮相。恒生電子董事長劉曙峰表示,大模型是信息技術(shù)的最新突破,刷新了人們對機器智能的認知,同時也在刷新行業(yè)應(yīng)用傳統(tǒng)AI模型的模式。
在“千模大戰(zhàn)”背景下,隨著各路金融科技企業(yè)在大模型的不斷試水,金融業(yè)數(shù)智化的發(fā)展也悄然走向了一個從量變到質(zhì)變的新階段。
02丨生成式AI浪潮能力涌現(xiàn)
大模型時代,算力、算法、數(shù)據(jù)構(gòu)成了新范式的“三駕馬車”,其中,數(shù)據(jù)更可視為決定大模型質(zhì)量和商業(yè)化落地的核心要素。作為一個業(yè)務(wù)流程規(guī)范、數(shù)據(jù)和知識沉淀完備的行業(yè),金融業(yè)天然具有應(yīng)用大模型的基礎(chǔ)優(yōu)勢。
回顧過去十年金融業(yè)的發(fā)展浪潮,是一場涉及到整個金融產(chǎn)業(yè)的信息化和數(shù)字化革命,為人工智能的滲透融入奠定了基礎(chǔ)。近年來,在智能營銷、智能風控、智能投研、智能客服等領(lǐng)域,基于機器學習驅(qū)動的建模能力都是金融機構(gòu)數(shù)智化轉(zhuǎn)型翻涌的浪花。
當下以生成式AI為代表的第二波人工智能浪潮席卷至金融業(yè),大模型所積聚的“三駕馬車”也已從量變走向質(zhì)變。
在近日恒生聚源主辦的“大模型在金融行業(yè)的應(yīng)用與展望”研討會上,恒生電子高級副總裁、恒生聚源董事長王鋒表示:“傳統(tǒng)的AI模型,參數(shù)量少,通過大量的數(shù)據(jù)標注、大規(guī)模的模板配置來實現(xiàn)。換一個場景就要再重新來過一遍,泛化性不足,被詬病為有多少人工,才有多少智能。而大模型基于GPT——生成式預(yù)訓練tranformer技術(shù)路線,通過預(yù)訓練、微調(diào)、獎勵模型、強化學習四個主要步驟和千億級別參數(shù)規(guī)模,做到了令人驚艷的效果,也就是我們所說的能力涌現(xiàn)!
這種能力涌現(xiàn)如今正賦能在金融云產(chǎn)品的方方面面。
如在AI開發(fā)層面,大模型展現(xiàn)出強大的代碼自動化生成能力,顛覆了傳統(tǒng)的“手工作坊式”模型,極大提升了機器學習的開發(fā)效率和生產(chǎn)模式;在智能交互方面,大模型的語音識別率不僅精準,還能憑借著深度語義理解與生成能力,快速解答客戶復(fù)雜且專業(yè)性的問題;在分析決策方面,有著強大信息挖掘能力的大模型,能在風險決策、信用評估、反欺詐等場景,觸及小模型無法覆蓋到的區(qū)域。
申萬宏源證券研究所所長助理劉洋認為,在算力、算法、數(shù)據(jù)“三駕馬車”的推動下,工程化能力變得尤為重要,特別是在券商、基金這樣的垂類大模型應(yīng)用場景下,率先為客戶提供服務(wù)的廠商將搶占先機。
因此,金融大模型的落地應(yīng)用也成了市場當下所聚焦的關(guān)鍵一步。
03丨落地商業(yè)化尚需時日
盡管業(yè)內(nèi)普遍認為,大模型將是開啟金融領(lǐng)域“iPhone時刻”的按鈕,但擺在眼前的事實是,現(xiàn)下的“金融大模型”主要停留在工具層和應(yīng)用層,更類似于業(yè)務(wù)流程優(yōu)化助手,在核心金融業(yè)務(wù)場景的落地之路任重而道遠。
作為一個受到強監(jiān)管的行業(yè),金融業(yè)首先對于技術(shù)應(yīng)用的安全性、穩(wěn)定性、可控性等要求遠比其他行業(yè)更為嚴格。尤其是在考慮到數(shù)據(jù)的安全與合規(guī)問題,意味著前期的數(shù)據(jù)采集和“清洗”等工作,廠商可能需要花費更多的時間和精力。
在馬上消費CTO蔣寧看來,挑戰(zhàn)主要現(xiàn)有大模型難以在金融特定領(lǐng)域?qū)崿F(xiàn)落地的挑戰(zhàn)主要來自四個方面:
一是當前的大模型在面對動態(tài)且不可預(yù)期變化的金融各項業(yè)務(wù)時,還并不能做到每一份決策都穩(wěn)定、精確;二是金融行業(yè)往往希望為用戶提供個性化的服務(wù)體驗,但這需要個人隱私數(shù)據(jù)和大模型相融合,涉及到合規(guī)和安全問題;三是金融行業(yè)一直存在的“數(shù)據(jù)孤島”問題,大模型要求構(gòu)建增強學習的網(wǎng)絡(luò)化平臺,并持續(xù)貢獻數(shù)據(jù)和反饋,但目前背后市場的數(shù)據(jù)生態(tài)是割裂的,仍然需要持續(xù)性的探索;四是金融行業(yè)大模型應(yīng)用對底層設(shè)備、基礎(chǔ)架構(gòu)等軟硬件設(shè)施提出更高的要求。
對于上述挑戰(zhàn),他認為可從強化學習和持續(xù)學習技術(shù)、魯棒性決策、組合式AI系統(tǒng)技術(shù)等三個大模型領(lǐng)域的關(guān)鍵技術(shù)入手。
他進一步解釋道,強化和持續(xù)學習會讓系統(tǒng)越用越聰明,這就在于大模型幕后自適應(yīng)的生態(tài)能力建設(shè),魯棒性決策則是實現(xiàn)關(guān)鍵決策的持續(xù)穩(wěn)定和合規(guī)可信的核心環(huán)節(jié),組合式AI系統(tǒng)技術(shù)可以有效結(jié)合各種垂直領(lǐng)域的判別式模型的可用性和專業(yè)性,助其真正發(fā)揮大模型的泛化能力優(yōu)勢。
基于上述認知,馬上消費在探路金融大模型方面制定了“三橫三豎”戰(zhàn)略。據(jù)蔣寧透露,目前公司已開發(fā)了智能生成報表的工具產(chǎn)品,在智能客服場景上也有所涉獵,并即將發(fā)布自研的金融大模型。
最后關(guān)于行業(yè)最受掣肘的數(shù)據(jù)質(zhì)量和合規(guī)問題,奇富科技首席算法科學家費浩峻此前在接受《中國經(jīng)營報》采訪時表示,對于數(shù)據(jù)質(zhì)量問題,可以從數(shù)字化改造的源頭進行標準化建設(shè),并且設(shè)置有嚴格一致性的評估指標和方法。而在合規(guī)方面,商用級需要重點解決的問題是輕量級和易用性。
顯然,對于剛剛邁入數(shù)智化“深水區(qū)”的金融業(yè)而言,尚需要一個適應(yīng)到不斷完善的過程,這也需要身處水中的廠商們擁抱合作互通,共同迎接大模型時代的到來。
原文標題 : 大模型的浪頭卷到了金融業(yè)
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設(shè)計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容