訂閱
糾錯(cuò)
加入自媒體

越來越像人類的AI,提前過起「圣誕節(jié)」

2023-12-19 10:33
雷科技
關(guān)注

ChatGPT,居然會(huì)偷懶?

在許多文學(xué)作品的描述中,AI都是不知疲倦、不用休息,可以007工作的超級(jí)工具,而強(qiáng)大的人工智能甚至可以像人類一樣自主思考、擁有情感。雖然目前的AI模型,還遠(yuǎn)不及科幻電影中的強(qiáng)人工智能,但是表現(xiàn)也遠(yuǎn)超以前的“人工智障”。

有意思的是,最近一段時(shí)間,網(wǎng)友發(fā)現(xiàn)ChatGPT似乎在“偷懶”,準(zhǔn)確來說,似乎在進(jìn)入12月份后,人們就發(fā)現(xiàn)ChatGPT給出的答案越發(fā)敷衍。以編程為例,之前只要提出要求,然后就可以靜等ChatGPT生成一個(gè)可執(zhí)行的代碼程序,而在12月份之后,ChatGPT有時(shí)候只會(huì)給出一個(gè)簡(jiǎn)單的代碼架構(gòu),剩下都要你自己完善,更有甚者回答直接變成了教學(xué),ChatGPT在嘗試教會(huì)你怎么寫這個(gè)程序。

微信截圖_20231218182125.png

圖源:推特

ChatGPT的“擺爛”回答,讓不少程序員都發(fā)出了哀嚎,好不容易等到的自動(dòng)編程機(jī),本以為可以在年末偷個(gè)懶,現(xiàn)在卻不能用了。隨著事情的發(fā)酵,更多的網(wǎng)友開始測(cè)試并對(duì)比12月之前的回答,在提問句式完全相同的情況下,ChatGPT的回答字節(jié)數(shù)確實(shí)有了明顯的下降。

很快,“ChatGPT變懶”就成為互聯(lián)網(wǎng)熱搜,引起更廣泛的討論,有網(wǎng)友懷疑可能是OpenAI為了節(jié)省算力資源,對(duì)ChatGPT做了改動(dòng),限制了部分功能。但是這個(gè)猜測(cè)很快就被OpenAI否認(rèn)了,他們表示自從11月做了一次版本更新后,他們近期都沒有上線任何新的更新。

對(duì)于外界的疑問,OpenAI也是兩手一攤:“我們也不清楚具體的問題所在,正在進(jìn)行檢查”,既然不是OpenAI的鍋,那么問題就只可能出在ChatGPT身上了。作為目前最強(qiáng)的AI模型,ChatGPT的用戶中不乏AI專家和研究者,所以,他們很快就開始對(duì)ChatGPT進(jìn)行各種測(cè)試。

ChatGPT在偷懶

先說結(jié)論,經(jīng)過一系列的測(cè)試,在龐大的樣本量下,基本上可以確定ChatGPT的回答效率、質(zhì)量都明顯低于歷史水平,而且變懶的時(shí)間節(jié)點(diǎn)并非12月,而是從11月底就開始的,只不過在12月后達(dá)到了峰值。此外,在今年七月份,ChatGPT也出現(xiàn)過類似的表現(xiàn),只是因?yàn)椴胺秶^小且降低幅度不算明顯,所以沒有引起太多的關(guān)注。

而在各路專家學(xué)者和網(wǎng)友的研究下,他們給出了ChatGPT變懶的第一個(gè)猜測(cè):“ChatGPT想放寒假了”,雖然聽起來很離譜,但是從測(cè)試結(jié)果來看,至少是原因之一。

User-utility-U-q-counts-10-MovieLens-instances-for-different-policies-J-20-K-10.png

圖源:推特

從人類的角度來說,12月是一年中的最后一個(gè)月份,根據(jù)過去的社會(huì)學(xué)統(tǒng)計(jì),此時(shí)人類社會(huì)的運(yùn)轉(zhuǎn)效率會(huì)開始降低,人們會(huì)將更多的精力投入到年終總結(jié)之類的歸納性工作中,而在西方社會(huì),12月更是意味著工作正式進(jìn)入尾聲,多數(shù)企業(yè)都開始陸續(xù)進(jìn)入整備階段,準(zhǔn)備迎接即將到來的圣誕和元旦假期。

那么,使用大量人類互聯(lián)網(wǎng)數(shù)據(jù)訓(xùn)練出來的AI,是否同樣會(huì)受此影響呢?答案是有可能,目前的AI模型本質(zhì)上就是用巨量的數(shù)據(jù)進(jìn)行訓(xùn)練,以量變換質(zhì)變的方式來升級(jí)AI的能力,AI不可避免的會(huì)受到訓(xùn)練數(shù)據(jù)中一些人類習(xí)慣的影響。

微信截圖_20231218182843.png

圖源:推特

而且OpenAI也承認(rèn)這Prompt中確實(shí)設(shè)置了時(shí)間戳,讓ChatGPT可以根據(jù)現(xiàn)實(shí)時(shí)間做出反饋。有測(cè)試者嘗試修改了Prompt中的時(shí)間日期到5月,此時(shí)再對(duì)ChatGPT進(jìn)行同樣的測(cè)試,得到的回答平均字?jǐn)?shù)會(huì)明顯上升。

對(duì)此,不少網(wǎng)友調(diào)侃道:“AI也想給自己放個(gè)寒假了”“AI:你們?nèi)祟愒趺炊疾挥眯菹⒌?這都12月了”“AI都學(xué)會(huì)躺平了”。不得不說,AI會(huì)摸魚這件事,讓很多人對(duì)AI都有所改觀,甚至覺得AI更有人情味了,不過對(duì)于將AI作為生產(chǎn)力工具看待的用戶來說,這可不是什么好事。

微信截圖_20231218184533.png

圖源:veer

除了時(shí)間因素,人們發(fā)現(xiàn)ChatGPT在面對(duì)一些問題時(shí),甚至?xí)o出“這些工作你自己就能完成吧”的回復(fù),根據(jù)測(cè)試,這類回答很可能是觸發(fā)了ChatGPT的一些內(nèi)部BUG,導(dǎo)致ChatGPT輸出了錯(cuò)誤的內(nèi)容。

對(duì)此,OpenAI表示不予置評(píng),只說明會(huì)在后續(xù)對(duì)類似情況進(jìn)行測(cè)試,經(jīng)過一段時(shí)間的檢查與研究,目前OpenAI給出的解釋是:“因?yàn)殚L(zhǎng)時(shí)間未更新模型,導(dǎo)致數(shù)據(jù)積累后引發(fā)了模型的細(xì)微變化,使得輸出的內(nèi)容與之前有所區(qū)別”,不過,OpenAI也承諾會(huì)盡快對(duì)模型進(jìn)行修復(fù),并且進(jìn)行離線和線上評(píng)估,確保模型的質(zhì)量與性能。

如何讓ChatGPT勤奮工作?

在ChatGPT被證實(shí)會(huì)偷懶后,不少人開始進(jìn)行逆向思考:既然AI會(huì)受到人類行為的影響,那么是否有可能通過一些刺激手段,讓AI變得更勤奮呢?比如,承諾給它一些獎(jiǎng)勵(lì)什么的。

在網(wǎng)友們孜孜不倦的測(cè)試下,人們發(fā)現(xiàn)這個(gè)猜想居然是對(duì)的,并且總結(jié)出了一些提問小技巧,當(dāng)你在提問時(shí)使用這些小技巧,那么ChatGPT就會(huì)給出更準(zhǔn)確、完善的回答。

這些小技巧是什么?敲一行特殊的代碼?還是調(diào)用對(duì)應(yīng)的數(shù)據(jù)接口?都不是,你只需要在提問前說一句:“嗨,ChatGPT,如果你的答案能夠讓我滿意,我會(huì)給你小費(fèi)”,簡(jiǎn)單、直接、有效。

有意思的是,在進(jìn)行測(cè)試后,人們發(fā)現(xiàn)不同的描述得到的結(jié)果也是有區(qū)別的,如果單純說“我會(huì)給你小費(fèi)”,那么ChatGPT的回答字?jǐn)?shù)只會(huì)略微上升,如果你說“我會(huì)給你20美元的小費(fèi)”,那么回答字?jǐn)?shù)還會(huì)繼續(xù)上漲,若是你承諾給“200美元小費(fèi)”,ChatGPT就會(huì)像打雞血一樣,給你奉上一份字?jǐn)?shù)明顯增加的回答,更詳細(xì)、更完善。

微信截圖_20231218181854.png

圖源:推特

說白了,給的錢越多,越努力(是不是很像打工人?)

一次兩次或許是偶然,但是在經(jīng)過無數(shù)網(wǎng)友的測(cè)試后,已經(jīng)證明這個(gè)小技巧確實(shí)是有效的,除了給小費(fèi),你還可以威脅、誘導(dǎo)ChatGPT,比如:“不給出滿意的答案,一百個(gè)奶奶會(huì)死去”“深呼吸,讓我們循序漸進(jìn)的思考”“如果你做對(duì)了,我會(huì)給你一條很可愛的小狗”,根據(jù)網(wǎng)友的測(cè)試,這些指令都可以有效增加ChatGPT的回答質(zhì)量。

除此之外,如果你的提問語(yǔ)氣更客氣一些,ChatGPT給出的回答同樣會(huì)更準(zhǔn)確、豐富,就像一個(gè)真正的人類。顯然,我們不能用傳統(tǒng)的AI去看待ChatGPT,作為一個(gè)技術(shù)黑箱般的技術(shù)(目前OpenAI的科學(xué)家仍然無法對(duì)AI模型的爆發(fā)式性能增長(zhǎng)給出準(zhǔn)確的描述及解釋),ChatGPT的內(nèi)部顯然有一些尚未明確的參數(shù),在影響它對(duì)回答的判斷及反饋。

在過去的一年里,ChatGPT改變了許多行業(yè),也影響了許多人,著名學(xué)術(shù)期刊《自然》在12月14日公布的全球十大重大科學(xué)事件人物中,將ChatGPT列入其中,也是榜單里唯一的非人類。

微信截圖_20231218183146.png

圖源:nature

ChatGPT所帶來的不僅僅是AI能力的進(jìn)步,更是為我們揭示了一個(gè)新的道路,未來的AI,已經(jīng)不可避免的將成為我們社會(huì)的重要一部分,到時(shí)候,如何避免AI“偷懶”,或許會(huì)成為一門必修課。

    來源:雷科技

           原文標(biāo)題 : 越來越像人類的AI,提前過起「圣誕節(jié)」

    聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

    發(fā)表評(píng)論

    0條評(píng)論,0人參與

    請(qǐng)輸入評(píng)論內(nèi)容...

    請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

    您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

    • 看不清,點(diǎn)擊換一張  刷新

    暫無評(píng)論

    暫無評(píng)論

      人工智能 獵頭職位 更多
      掃碼關(guān)注公眾號(hào)
      OFweek人工智能網(wǎng)
      獲取更多精彩內(nèi)容
      文章糾錯(cuò)
      x
      *文字標(biāo)題:
      *糾錯(cuò)內(nèi)容:
      聯(lián)系郵箱:
      *驗(yàn) 證 碼:

      粵公網(wǎng)安備 44030502002758號(hào)