訂閱
糾錯
加入自媒體

個性化大模型“裝進”隨身終端,不是想象,是風向

大模型時代下的應(yīng)用革命正在加速到來。

今年以來生成式AI與大模型的研究與應(yīng)用進展高潮迭起,4月初天貓精靈一個接入了阿里大語言模型通義千問的個性化DEMO,徹底點燃了智能終端市場。更擬人的對話方式、更有情感的交互能力、人格化標簽,打破了智能終端一度難以尋找新想象力的僵局。

然而就在近日,網(wǎng)上一款研發(fā)中的AIGC新型硬件demo——天貓精靈智能隨身眼鏡又引起了我們的關(guān)注。視頻中可以看出,雖然外觀、重量上該眼鏡與普通眼鏡相差無二,但有千問大模型樣機的加入使其能夠“才思敏捷”,骨傳導(dǎo)技術(shù)的加持也建立了一個相對私密對話環(huán)境。

例如UP主在吃飯時問道,“我好想吃面,可是我最近在健身,淀粉不能攝入過量怎么辦?”天貓智能眼鏡迅速給出了具體建議,“可以吃一些低熱量面食,蕎麥面、意大利面”;此外,后續(xù)UP在日常環(huán)境下與其交流愛好、游戲時,天貓精靈智能眼鏡也能夠像朋友一樣對答如流。

500

事實上,ChatGPT類產(chǎn)品實現(xiàn)語義理解最快延伸出的場景,首先是文字,然后是圖像和語音,而考慮到語音輸入較文字輸入的便捷性和實用性,智能音箱、智能眼鏡、智能耳機等擁有語音交互能力的場景,可能會最先受益。

如果從場景倒推的話,更垂直的終端產(chǎn)品,也能在更垂直的大模型加持下,用更低的成本帶來更專業(yè)、更個性的體驗。而在垂直之下,“微調(diào)模型+智能終端”的打法,也將會成為應(yīng)用升級的新風向。

個性化大模型升溫

毋庸置疑,在行業(yè)共同作用下,大模型在通識任務(wù)上的表現(xiàn)越來越出色,基于超大規(guī)模語料訓(xùn)練的大模型在知識評測等任務(wù)上超越了人類平均水平。以ChatGPT等為代表的大模型出現(xiàn),更讓人切身感受到AI的智能水平。

然而這種以廣義理論框架搭建、公用數(shù)據(jù)訓(xùn)練出的通用大模型,對于普通用戶來說,在使用時也缺少個性,有時候更像是一個問答機器,而非像朋友一樣互相交流。

在主流通用大模型的基礎(chǔ)之上注入專業(yè)化、個性化是一個重要的探索方向,個性化大模型也逐漸成為“大模型時代”的另一種不同玩法。加入了人格化的標簽、融入了更加細分領(lǐng)域的數(shù)據(jù)后,一個微調(diào)大模型會變得更加獨特有趣。

例如在辦公場景中,戴上眼鏡便可以通過語音命令操作電子郵件、日程安排,當不清楚文檔內(nèi)容時,還可通過詢問智能眼鏡口頭回答問題;在戶外露營時,遇到陌生物種時,可以通過語音描述,得到鑒定和解說。甚至在開車外出時,可以通過眼鏡來尋找目的地并且導(dǎo)航路線。

500

另外,這款眼鏡本身是一個骨傳導(dǎo)眼鏡,技術(shù)核心在于用一種新的震動發(fā)聲裝置,采用了振子專利技術(shù),搭配貓耳算法,讓設(shè)備不入耳就能聽到聲音,并且能夠有更小噪音、更低失真的聲音表現(xiàn)。

目前在實驗環(huán)境下加入了千問大模型demo,大模型在進行微調(diào)后,就能夠成為交互更加流暢智能的個性化隨身AIGC終端,可以支持佩戴者和眼鏡隨時進行不間斷的語音交流,配合骨傳導(dǎo)的技術(shù)特點,形成完全私密的聲場。

500

“骨傳導(dǎo)+定制大模型”的組合不僅僅可以應(yīng)用于眼鏡,也可以用于耳機、頭盔等穿戴設(shè)備中。這一定程度上也標志著AIGC硬件會逐漸走入更加個人化的、隨身的垂直使用場景中。

事實上,相對于“廣而泛”的ChatGPT,垂直GPT的發(fā)展優(yōu)勢十分明顯。

個性化大模型多是以深度解決垂直領(lǐng)域問題為主,以產(chǎn)品開發(fā)為目的,即企業(yè)在自己擅長的領(lǐng)域開發(fā)一個專業(yè)版大模型,然后直接應(yīng)用到自己的相關(guān)AI產(chǎn)品上,使該產(chǎn)品實現(xiàn)或增強某種功能。

并且從成本角度來看,個性化大模型是針對特定領(lǐng)域或行業(yè)進行優(yōu)化,只需利用該領(lǐng)域內(nèi)的專業(yè)數(shù)據(jù)進行訓(xùn)練,避免了通用大模型數(shù)據(jù)采集的高成本和高難度。

錢學森在《系統(tǒng)工程論》提出這樣一個核心觀點,那就是做任何技術(shù)產(chǎn)品,都要從現(xiàn)有條件出發(fā),不求單項技術(shù)的先進性,只求總體設(shè)計的合理性,充分利用現(xiàn)有資源,各個子系統(tǒng)需要充分協(xié)作,服務(wù)于整體目標。

把這個理論放在如今的大模型上,一樣適用。大模型再厲害,也只是一項技術(shù),它必須應(yīng)用到具體產(chǎn)品上,才能發(fā)揮最大作用。因此大模型并不是做得越大越通用就越好,而是應(yīng)該基于產(chǎn)品,聚焦在某個需求上,合理開發(fā)和利用,進而實現(xiàn)大模型在產(chǎn)品中功能的最大化。

落地更快更真實

如果要說大眾對AIGC的終極幻想,那一定是人均一個賈維斯這樣的全能助手,這也是目前行業(yè)的終極目標。

雖然大模型技術(shù)打破了AI難以用于不同領(lǐng)域的壁壘,加上多模態(tài)的快速發(fā)展,智能助理的發(fā)展方向一定是越來越全能,但不得不承認的是,科幻電影中的賈維斯離我們還很遙遠。

不過目前可以實現(xiàn)的是,利用個性化大模型具備的專業(yè)性、獨特性、定制性,微調(diào)出針對不同應(yīng)用場景的智能助理,并且快速落地、快速應(yīng)用,落地到消費端的產(chǎn)品上。

例如前不久爆火的接入了千問大模型的Sound Pro,通過知識增強、工具增強、個性化對話增強、人類反饋強化學習,四個訓(xùn)練步驟便實現(xiàn)了“知識+情感+記憶+人設(shè)”統(tǒng)一體驗,在接入天貓精靈后能夠?qū)崿F(xiàn)多輪流暢對答、符合人設(shè)的人格化表達、富有創(chuàng)意的隨機創(chuàng)作等能力,被稱為“鳥鳥分鳥”。這本質(zhì)上是“個性化”大模型,能夠塑造特定的人格化特征,對“看法是什么”、“喜歡吃什么”等開放式問題作出符合自身“人設(shè)”的個性化回答。

比如問大模型“怎樣做一道美味的意大利面?”,設(shè)定為專業(yè)廚師的大模型可能會分享正宗的意大利面做法,例如使用哪種面粉、如何制作面團、如何制作醬汁等等;而一位素食主義者大模型可能會提供素食意大利面的做法,例如使用哪些蔬菜和豆類代替肉類等。

這些高可玩性與可用性,給語音交互注入了前所未有的生命力,讓行業(yè)初步看到大模型所激發(fā)的交互躍遷。

當然,除了以家庭中心為入口的智能設(shè)備外,終端穿戴式AIGC產(chǎn)品想象力更為豐富。因為人類物理條件限制,在許多場景最合適的語音智能載體還是耳機或者鋼鐵俠那樣的眼鏡。除非腦機接口或其它新技術(shù)突破,目前語言依然是人類交流的最通用方式,也是與智能助理交流的最佳方式。

更聰明的交互、更豐富的終端

2021年以來,傳統(tǒng)智能音箱行業(yè)面臨需求下滑、創(chuàng)新不足的困境。出貨大跌的原因也不模糊,隨著消費者的認知回歸理性,交互模式機械化、產(chǎn)品嚴重同質(zhì)化的智能硬件產(chǎn)品早已算不上新穎,且智能家居的“入口”概念早已淡化。

用戶希望與智能音箱、手表等智能終端設(shè)備實現(xiàn)類似人與人之間的“對話式”交流,但多數(shù)設(shè)備無法理解復(fù)雜的語言場景,只能實現(xiàn)播放音樂、天氣查詢、快遞查詢等簡單的功能,并且現(xiàn)階段沒能依靠技術(shù)或內(nèi)容或某一特征打動更多消費者。

另外雖然眾多終端配備了兒童模式、老人模式、青少年模式等個性化模式,但在實際使用中,除了內(nèi)容上的些許不同,其他方面并未像“鳥鳥分鳥”那樣真正的有個性。

方正證券認為,智能音箱需要更加“智能”,才能找到自己的獨特定位,得到長足發(fā)展,而ChatGPT這類生成式AI具有智能對話、多模態(tài)表達的支持,對于智能音箱等都是可以彌補缺陷的方案。

比如將這種個性化定制的大模型可能和圖像生成聯(lián)系在一起,激發(fā)更多潛能。如為每臺音箱、智能眼鏡等智能終端產(chǎn)品裝備一個虛擬數(shù)字人管家,通過用戶的訓(xùn)練掌握用戶的日常習慣,做到更私人、更個性。

行業(yè)的底層邏輯是產(chǎn)品周期,周期的強度取決于產(chǎn)品創(chuàng)新與痛點挖掘。目前行業(yè)處于庫存逐步去化、周期將起未起的拐點時刻。對于企業(yè)來說,當下已經(jīng)過了爭奪“入口”的階段,而大模型的爆發(fā)也促進了軟硬一體的生態(tài)發(fā)展,所以,從實際體驗出發(fā),尋找更聰明的交互、更豐富的AIGC終端形態(tài),不拘泥于單個“入口”,才是未來各大廠商角逐的方向。

據(jù)不完全統(tǒng)計,目前除了天貓精靈在深耕“大模型+智能硬件”外,百度旗下的小度科技也宣布將融合文心一言,打造針對智能設(shè)備場景的人工智能模型“小度靈機”,并且應(yīng)用到小度全系產(chǎn)品;科大訊飛也將其星火大模型落地應(yīng)用層,融合進了訊飛智能辦公本中。

在「科技新知」看來,“個性化大模型”有望成為引爆下一輪產(chǎn)品創(chuàng)新的關(guān)鍵,不僅僅是文本、語音交互,圖像、視頻甚至手勢動作都有望實現(xiàn)革新,而隨之帶來的便是,更多AIGC智能硬件的涌現(xiàn),以及整個行業(yè)的二次爆發(fā)。

       原文標題 : 個性化大模型“裝進”隨身終端,不是想象,是風向

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號