巨頭狂卷代碼大模型
讓AI寫代碼正在越來越流行。今天螞蟻集團(tuán)智能研發(fā)平臺CodeFuse推出了“圖生代碼”技術(shù),這一技術(shù)集成在CodeFuse上,可將網(wǎng)頁、App等設(shè)計圖一鍵轉(zhuǎn)化成前端代碼。不只是螞蟻,阿里云、百度、360、OpenAI、微軟、GitHub、Google等科技巨頭均在持續(xù)加碼代碼大模型,探索AI“自編程”。
看似高度專業(yè)且極具創(chuàng)造性的編程儼然已成大模型落地的核心領(lǐng)域之一,這聽著就好像“機(jī)器人制造機(jī)器人”一樣酷。既然如此,“編程”本身將會被AI如何改變呢?
巨頭狂卷代碼大模型,
自然語言編程是終極目標(biāo)
互聯(lián)網(wǎng)時代,包括比爾蓋茨、喬布斯在內(nèi)的大佬都曾鼓勵人人都要學(xué)會編程,特別是兒童。然而前段時間,AI大佬、英偉達(dá)CEO黃仁勛卻在對孩子的寄語中稱,“生成式AI的發(fā)展大幅降低了學(xué)習(xí)編程的重要性。”而英偉達(dá)的工作,“就是創(chuàng)造計算技術(shù),讓所有人都不需要編程。”
不過黃仁勛并沒有否定編程本身的價值,只是他認(rèn)為AI可以讓每個人都能編程:“編程語言可以普及成為人類的語言,現(xiàn)在世界上每個人都是程序員。這就是人工智能的奇跡。”
有了計算機(jī)就有了編程的概念。編程語言一直在進(jìn)化,從最初的二進(jìn)制,到后來的機(jī)器代碼,到匯編語言,再到高級語言。這些年,高級語言也在不斷革新。而編程語言不斷進(jìn)階的目的,就是為了讓編程難度更低、效率更高。按照這樣的路線來看,人人都掌握的自然語言將是“編程語言”進(jìn)化的終極形態(tài)。
(常見編程語言)
不過,這就跟無人駕駛一樣:L5自動駕駛終究只是理想,當(dāng)下智能汽車上商用的卻都是L3級輔助駕駛。短期內(nèi),“完全自然語言編程”不可能成為現(xiàn)實。但隨著AI大模型的發(fā)展,AI在編程以及研發(fā)中正在發(fā)揮日益重要的作用,科技巨頭無不在戰(zhàn)略布局,實現(xiàn)更加自動化的研發(fā)模式。
2020年,OpenAI推出了擁有1.75萬億參數(shù)、取得重大突破的GPT-3。21年,OpenAI基于GPT-3模型開發(fā)了成功破圈的ChatGPT,與此同時也創(chuàng)建了Codex系統(tǒng),其可根據(jù)程序員的自然語言輸入進(jìn)行簡單的代碼編寫支持,這是AI編程的起點。
Codex的出現(xiàn),讓IT研發(fā)界大為震撼:AI可將程序員從重復(fù)、繁重、繁瑣以及機(jī)械的編程工作中解放出來,讓他們專注于創(chuàng)造產(chǎn)品本身。正因為此,在AI與研發(fā)軟件領(lǐng)域均有建樹的巨頭,如Google、微軟、阿里云、螞蟻、百度、360、華為均競相研發(fā)并推出代碼大模型。
微軟推出了OpenAI Dall-E驅(qū)動的圖片設(shè)計工具,在低代碼應(yīng)用開發(fā)軟件Power Apps中推出了支持GPT-3的工具,并根據(jù)OpenAI的Codex模型開發(fā)了一款代碼建議工具GitHub Copilot。
(OpenAI CodeX)
Google在推出PaLM Coder代碼大模型的同時,于23年與新晉AI編程獨角獸 Replit合作,將其人工智能語言模型和Replit的生成式代碼工具Ghostwriter結(jié)合。
Replit由Facebook前軟件工程師Amjad Masad創(chuàng)辦,在打造全球最大的在線IDE(集成開發(fā)環(huán)境)后,于2022年11月基于AI大模型技術(shù)推出Ghostwriter,對標(biāo) GitHub Copilot,擁有代碼自動生成和補(bǔ)全、進(jìn)行代碼語言轉(zhuǎn)換、支持代碼解釋和搜索等。
中國科技巨頭不遑多讓。2022年華為推出代碼大模型Pangu-Coder;23年百度智能云推出“Comate”代碼助手,第一階段的主要功能是“輔助代碼撰寫”,此后將在特定領(lǐng)域場景實現(xiàn)自然語言代碼生成,第三階段將實現(xiàn)全領(lǐng)域的自然語言開發(fā);同一年,螞蟻“百靈大模型家族”迎來了代碼大模型成員CodeFuse,其源自于螞蟻?身的開發(fā)場景及代碼庫沉淀,基于海量?質(zhì)量代碼數(shù)據(jù)和代碼領(lǐng)域特?詞表,和多任務(wù)微調(diào)技術(shù)MFT,在螞蟻?萬多內(nèi)部研發(fā)?員的?常編碼、測試、運維等場景中,經(jīng)過反復(fù)驗證與迭代。去年中,CodeFuse 及其必要的?具鏈,?向技術(shù)社區(qū)開源開放;10月,CodeFuse推出IDE插件功能,支持多種語言和編程工具。
(螞蟻CodeFuse)
24年,代碼大模型呈現(xiàn)出百花齊放的態(tài)勢。在螞蟻CodeFuse推出“圖生代碼”的同一時期,阿里云迎來了1號AI員工“通義靈碼”的上線,其“簡歷”顯示這是一個出生于0101世界、無性別的硅基生命,人格屬于INTJ,職位是AI智能編碼助手,項目經(jīng)歷是“截至2023年4月,下載量超過200萬,每天數(shù)百萬行代碼被程序員采用。”在4月中旬即將召開的百度Create2024大會上,李彥宏也將發(fā)布AI編程相關(guān)產(chǎn)品更新。
巨頭狂卷大模型,而代碼大模型更是成了兵家必爭之地。
跟一日千里的GPT一樣,21年到現(xiàn)在代碼大模型正在快速升級。在AI編程上,從最初的行級代碼補(bǔ)全,升級到倉庫級代碼生成,再進(jìn)化到自然語言描述下的代碼生成。在代碼生成外,演進(jìn)出代碼語言轉(zhuǎn)換、代碼解釋和搜索、軟件文檔撰寫、智能編程助理等功能,甚至出現(xiàn)了螞蟻提出的“AI賦能全生命周期研發(fā)”這樣的新的研發(fā)范式。
AI編程讓程序員專注于創(chuàng)造,
助力企業(yè)研發(fā)降本增效
編程AI化是計算進(jìn)化的必然。在通用計算體系下,摩爾定律早已失效。但讓人始料未及的是,“摩爾定律”卻在AI計算體系中得以延續(xù)。Open AI CEO、ChatGPT之父Sam Altman指出,每年LLM參數(shù)規(guī)模大小增長10X,人工智能運算量每隔18個月翻一番,這被稱為“AI摩爾定律”。在AI軟件內(nèi)涵突變之時,低效的傳統(tǒng)研發(fā)模式難以為繼,研發(fā)模式的奇點也已到來。
(AI摩爾定律)
AI如何改變研發(fā)本身成為業(yè)界關(guān)注的新焦點。紅杉資本則認(rèn)為,生成式AI將逐漸改變各個行業(yè),但軟件開發(fā)模式的轉(zhuǎn)型還沒完成。紅杉提出了“開發(fā)工具2.0”,指出這種“Beyond Copilot”的新形態(tài),尚未被定義。
AI大模型率先改變的都是創(chuàng)造性職業(yè),比如文字、圖片、視頻、音樂等內(nèi)容的創(chuàng)作均迎來了各自的現(xiàn)象級應(yīng)用:ChatGPT、Midjourney、Sora、Suno。如今,AI對創(chuàng)造的賦能來到了編程領(lǐng)域,AI編程將是AI大模型技術(shù)的下一個“殺手锏場景”。
對科技巨頭來說,布局AI編程,既是內(nèi)在研發(fā)提效的剛需,也是布局新興業(yè)務(wù)的必要——這跟云計算、to B數(shù)字科技“始于內(nèi)、發(fā)于外”的歷程一致。
首先,通用大模型要落地離不開“垂直大模型”這一橋梁,而編程則是大模型最有潛力的垂直應(yīng)用場景,大模型與軟件開發(fā)工具結(jié)合可顯著解決技術(shù)人員面臨的痛點。
最早大規(guī)模引入AI編程的GitHub平臺曾在一篇調(diào)研文章中探討了GitHub Copilot對程序員效率和幸福感的提升,發(fā)現(xiàn)使用工具的程序員完成任務(wù)速度快55%,96%的使用者認(rèn)為自己處理重復(fù)性的工作更快了,88%的使用者認(rèn)為自己可以更加專注于更喜歡的工作上。
百度、阿里云、螞蟻等布局代碼大模型的國內(nèi)巨頭,也是先嘗到了甜頭。比如在螞蟻內(nèi)部,CodeFuse ?持40多種編程語?,10多個主流IDE平臺,現(xiàn)在有超過五成的程序員使用CodeFuse,在這些程序員寫的代碼里,AI生成代碼占比超過了10%,整體采納率30%,在生成單元測試場景采納率可達(dá)到 60%。以最新發(fā)布的“圖生代碼”技術(shù)為例,前端工程師在還原一個中型網(wǎng)頁時,如果最終有200 行代碼,一人耗時約需1小時,使用CodeFuse一鍵生成后,只需檢查與調(diào)整,這大幅提高了前端工程師的效率。
(CodeFuse正在成為越來越多程序員的編程工具)
其次,編程人員群體龐大,研發(fā)提效是科技巨頭高質(zhì)量增長的關(guān)鍵一環(huán)。
以中國為例,來自Boss直聘的《2023年中國程序員人才發(fā)展報告》顯示,中國程序員總數(shù)約為600萬人左右。如果算上需求分析師、設(shè)計師、UI/UE/UX、產(chǎn)品經(jīng)理、IT運維等研發(fā)上下游工種,IT研發(fā)人才群體更加龐大。
大量的研發(fā)人才意味著龐大的研發(fā)支出,這從頭部互聯(lián)網(wǎng)企業(yè)的研發(fā)成本可以窺見,李彥宏日前表示,百度這么多年研發(fā)費用占到收入的比重一直是20%以上,以23年1345.98億元營收計算,研發(fā)投入在270億左右。阿里、騰訊、字節(jié)、華為等巨頭的研發(fā)投入規(guī)模更大,且相當(dāng)部分均在軟件研發(fā)上。
哪怕代碼大模型可提高1%的研發(fā)效率(當(dāng)然,從實踐來看提效遠(yuǎn)不止1%),對科技巨頭降本增效也有非凡意義——高質(zhì)量增長是科技行業(yè)的主旋律,降本增效是每家公司的重點。正因為此,所有科技企業(yè)都將推動所有軟件工程師使用AI編程工具。
最后,程序員以及研發(fā)人員具有更強(qiáng)的“AI基礎(chǔ)素養(yǎng)”,更樂意利用、更可能用好AI編程輔助工具。
對于非技術(shù)類人員來說,即便是使用ChatGPT這樣的大眾化工具,也需要學(xué)習(xí)“Prompt(提示詞)”等技能,可見真正使用AI大模型來創(chuàng)作對大多數(shù)人來說是有門檻的,且普通人無法適應(yīng)當(dāng)前大模型技術(shù)結(jié)果的不確定性、不可靠。
對技術(shù)人才來說,以上問題不存在,因為他們是最善于使用工具、也樂于探索新工具的人群。程序員是“終身學(xué)習(xí)職業(yè)”職業(yè),他們一直在學(xué)習(xí)更先進(jìn)的編程語言、尋覓更先進(jìn)的工具、應(yīng)用最先進(jìn)的方法來提高工作效率與質(zhì)量。在代碼大模型驅(qū)動下,AI編程工具如雨后春筍出現(xiàn),對應(yīng)的研發(fā)體系、協(xié)作流程、管理方法、設(shè)計模式都將劇變,就算企業(yè)不推動,研發(fā)人員也會自主去探索和學(xué)習(xí)AI研發(fā)工具。
(CodeFuse IDE插件的代碼生成功能(部分))
Gartner發(fā)布的2024年十大戰(zhàn)略技術(shù)趨勢也指出:到2028年,75%的企業(yè)軟件工程師將使用AI編程助手。放眼未來,在助力企業(yè)研發(fā)板塊“降本增效”的同時,代碼大模型將更大程度地解放技術(shù)人員,讓他們專注于更高維度的創(chuàng)造工作。
AI編程進(jìn)階:
從協(xié)助寫代碼到重構(gòu)研發(fā)范式
從當(dāng)前的AI編程實踐來看,代碼大模型正沿著兩個方向演進(jìn)。
一條路是不斷提高代碼生成能力,做好程序員編程智能輔助工具。代碼生成、補(bǔ)全、解釋與轉(zhuǎn)換能力,從行級到片段到倉庫級不斷進(jìn)化。在生成代碼時,支持多輪對話式需求理解,支持自然語言、語音、圖生代碼等多模態(tài)指令理解,這也是包括GitHub Copilot在內(nèi)的AI編程平臺在主攻的方向,它們基于云提供SaaS服務(wù)或插件工具,著重于助力程序員提高代碼編寫的效率和質(zhì)量。
另一條路則是讓AI滲透到研發(fā)的全生命周期,重構(gòu)研發(fā)體系。
軟件開發(fā)涉及到需求分析、編程開發(fā)、測試與構(gòu)建、發(fā)布與運維、數(shù)據(jù)洞察等鏈路。每一個鏈路都需要使用大量的專業(yè)工具,且與上下游研發(fā)鏈路進(jìn)行協(xié)作。理論上來說,所有研發(fā)工具都可以被AI重做一遍,軟件研發(fā)范式(包括工具鏈、協(xié)作流程、項目管理方法、設(shè)計模式等等)都將被重構(gòu)。
在國內(nèi),螞蟻CodeFuse 是AI全?命周期研發(fā)的首倡者和積極探索者。在內(nèi)部,螞蟻已將?模型技術(shù)應(yīng)?在研發(fā)的全鏈路環(huán)節(jié),在CodeFuse的版圖中,在需求階段,Project Copilot提供多場景開發(fā)助手,提供需求/設(shè)計文檔智能生成等服務(wù);在開發(fā)、測試、運維和數(shù)據(jù)環(huán)節(jié),分別提供Code Copilot(IDE插件)、Test Copilot、Ops Copilot、Data Copilot等AI研發(fā)工具,大幅提高對應(yīng)環(huán)節(jié)研發(fā)人員的工作效率。CodeFuse 在螞蟻內(nèi)部被大規(guī)模應(yīng)用在工業(yè)化生產(chǎn)場景,經(jīng)過反復(fù)驗證與迭代后再以開發(fā)助手、IDE插件、AI Native IDE、Open API、開源等形式開放給行業(yè),同時也針對小程序開發(fā)等特殊場景定制了AIGC方案。
(螞蟻CodeFuse探索AI全?命周期研發(fā)范式)
第二種路線可被簡單地理解成企業(yè)研發(fā)的數(shù)智化升級,這將是科技類企業(yè)數(shù)智能升級中不容忽視的一環(huán)。自動駕駛技術(shù)不只是改變了車輛駕駛方式,也將重構(gòu)出行、物流、道路、交管、法規(guī)等交通體系。同理,AI大模型不只是會提升程序員個體的工作效率,也將締造全新的研發(fā)范式。大部分的AI編程工具強(qiáng)調(diào)通用性,不大可能面向前端工程師提供“圖生代碼”這樣的細(xì)化服務(wù),因此目前更多是影響個人開發(fā)者。但在AI大模型重構(gòu)研發(fā)體系時,開發(fā)團(tuán)隊更需要去做全生命周期的AI研發(fā)的頂層布局,在每一個鏈路中使用AI研發(fā)工具且采取全新的協(xié)作模式、管理方法。
AI研發(fā)勢不可擋,
IT技術(shù)人員何去何從?
回到開篇的問題:編程到底會不會消亡?
看上去,隨著AI編程技術(shù)的發(fā)展,人人都可用自然語言來編程,程序員確實將成為不復(fù)存在的職業(yè)。
但事實并非如此。
一方面,程序員的核心價值是“創(chuàng)造”,創(chuàng)造本身不可能被機(jī)器取代。自然語言編程只是降低了編程的“交互門檻”,但編程的根本是抽象思維、邏輯思維、系統(tǒng)思維、算法思維以及創(chuàng)造思維,特別是對物理世界的認(rèn)知、理解與抽象,這些并非AI所長。
另一方面,產(chǎn)品研發(fā)不只是編程。正如前文所言,研發(fā)涉及到需求分析等等環(huán)節(jié),同時需要與產(chǎn)品運營、市場推廣、商業(yè)化等環(huán)節(jié)密切配合,這些更是AI不可能做好的事情,比如AI就不可能洞察到用戶有在手機(jī)上收發(fā)紅包這樣的細(xì)微需求,更不可能做出網(wǎng)絡(luò)紅包這樣的創(chuàng)新產(chǎn)品——當(dāng)然,有了AI編程工具,網(wǎng)絡(luò)紅包的開發(fā)會更敏捷,更高效。螞蟻“2024支付寶五福節(jié)”的游戲中心項目代碼,就有30%由AI提交。
受過軟件開發(fā)專業(yè)訓(xùn)練的人都知道,編程不等于寫代碼,項目管理、軟件測試、需求分析、算法、數(shù)據(jù)結(jié)構(gòu)等等全鏈路研發(fā)技能也是所有計算機(jī)軟件類專業(yè)的必修課。正因為此,技術(shù)人員要盡可能地用好AI編程工具提升個體工作效率,同時增強(qiáng)復(fù)合型能力,當(dāng)重復(fù)性等工作大幅減少可用更多時間“創(chuàng)造”,強(qiáng)化用戶需求分析、創(chuàng)意設(shè)計、業(yè)務(wù)理解、項目管理等能力。
正如螞蟻集團(tuán)CodeFuse負(fù)責(zé)人所言:“AI的普及不僅可以減少開發(fā)人員的工作壓力,讓他們有更多精力投入到更有創(chuàng)造力的工作中去。”而AI研發(fā)范式的變革,并不代表“人”在研發(fā)場景的角色會消失,反而對AI和人如何協(xié)同提出了更高的要求。“AI目前主要集中在輔助編程(code copilot),編程要從copilot走向co-worker,甚至替代人,還有很多未解決的問題,而整個研發(fā)生命周期的AI自動化,還有很長的路要走。”
AI不會取代任何舊的職業(yè),但會淘汰思維陳舊的人。長期來看,AI將成為人類的助手,?機(jī)協(xié)同是AI發(fā)展的終局,這一點會在研發(fā)特別是編程場景率先體現(xiàn)。對于企業(yè)來說,研發(fā)是根基,其本質(zhì)是用技術(shù)解決問題和創(chuàng)造產(chǎn)品,這將是硅基文明基礎(chǔ)生產(chǎn)方式。2024年的一個顯著趨勢是,編程以及研發(fā)本身,正在被AI大模型技術(shù)重構(gòu)。所有技術(shù)人員必須擁抱AI研發(fā)的全新理念,適應(yīng)新的研發(fā)協(xié)作模式。
是時候重新出發(fā)了。
原文標(biāo)題 : 巨頭狂卷代碼大模型
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 2024 智能家居出海論壇
-
精彩回顧立即查看>> 【在線會議】多物理場仿真助跑新能源汽車
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市