久久97超碰色中文字幕总站,国产一区二区内射最近更新,中文字幕丰满乱子伦

9.11和9.9大模型全錯，場景將成AI搜索護城河

2024-07-26 09:38

Ai芯天下

關(guān)注

前言：

根據(jù)全球研究與咨詢公司Gartner于今年2月發(fā)布的報告預(yù)測，至2026年，傳統(tǒng)搜索引擎的搜索量預(yù)計將下降25%。

此預(yù)測凸顯了隨著生成式人工智能技術(shù)的不斷發(fā)展，人們的搜索習(xí)慣正在發(fā)生顯著變化，進而推動了AI搜索領(lǐng)域的快速進步。

作者 | 方文三

圖片來源 | 網(wǎng) 絡(luò)

9.11與9.9的比較時大模型[犯渾]

在數(shù)學(xué)領(lǐng)域，比較兩個小數(shù)的大小是一個基本問題。然而，當這個問題被提出給當前的AI大模型時，卻引發(fā)了一系列的錯誤回答。

具體來說，當被問及[9.11和9.9哪個更大]時，多數(shù)AI大模型錯誤地認為9.11大于9.9，這一錯誤源于對小數(shù)點后數(shù)字的錯誤比較。

大部分大模型在處理此類問題時，錯誤地將小數(shù)點后的數(shù)字進行比較，而忽略了整數(shù)部分的大小。

此次事件中，多個知名的AI大模型均未能正確回答這一問題，包括但不限于ChatGPT-4o、字節(jié)豆包、月之暗面kimi等。

在對12個AI大模型的測試中，只有阿里通義千問、百度文心一言、Minimax和騰訊元寶給出了正確答案，其余8個模型均未能正確回答。

在某些場景表現(xiàn)不佳反映了技術(shù)的局限性

從技術(shù)層面來看，大模型在分析文本時，通常會使用特定機制將文本拆分成更小的單元進行處理，這種拆分方式在處理數(shù)學(xué)問題時可能不夠嚴謹，容易出現(xiàn)[斷章取義]的情況。

①AI大模型在數(shù)學(xué)能力上的不足，部分源自其技術(shù)架構(gòu)的固有限制。

當前的AI大模型主要基于Transformer架構(gòu)，該架構(gòu)在處理序列數(shù)據(jù)時表現(xiàn)出色，但對數(shù)學(xué)和邏輯推理的精確性存在局限。

Transformer模型依賴于自注意力機制來捕捉輸入數(shù)據(jù)中的依賴關(guān)系。

然而，這種機制在處理數(shù)學(xué)表達式時可能無法有效捕捉數(shù)學(xué)運算的精確順序和邏輯結(jié)構(gòu)。

②AI大模型通常使用浮點數(shù)來表示數(shù)值，但這種表示方式在處理小數(shù)點后的精確比較時可能會引入誤差，導(dǎo)致錯誤的數(shù)學(xué)判斷。

盡管大模型在訓(xùn)練過程中接觸到了大量數(shù)據(jù)，但其泛化能力在數(shù)學(xué)問題上仍顯不足，特別是在處理未見過的數(shù)學(xué)問題或需要復(fù)雜推理的場景。

③大模型的設(shè)計初衷可能更側(cè)重于文字思維而非數(shù)字思維。

它們在處理自然語言時表現(xiàn)出色，但在應(yīng)對數(shù)學(xué)這種需要精確計算和嚴格邏輯的領(lǐng)域時，就顯得力不從心。

④訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性直接影響AI大模型的數(shù)學(xué)能力。

現(xiàn)有訓(xùn)練數(shù)據(jù)集中缺乏對數(shù)學(xué)邏輯和推理過程的描述，模型未能學(xué)習(xí)到數(shù)學(xué)問題解決的邏輯鏈條。

AI技術(shù)中場景的選擇和適配性至關(guān)重要

雖然[9.11]和[9.9]大模型可能在某些場景下遇到挑戰(zhàn)，但將特定場景視為AI搜索的護城河是一種具有戰(zhàn)略意義的思考方式。

它強調(diào)了場景適配性、定制化優(yōu)化和技術(shù)創(chuàng)新在構(gòu)建競爭優(yōu)勢中的重要性。

在AI搜索領(lǐng)域，這可能意味著通過專有技術(shù)、數(shù)據(jù)資源、用戶體驗設(shè)計等手段，構(gòu)建獨特的競爭優(yōu)勢。

不同的應(yīng)用場景可能對模型的性能有不同的要求。

因此，將特定場景視為AI搜索的護城河，意味著在這個特定場景下，通過優(yōu)化模型或整合相關(guān)技術(shù)，可以實現(xiàn)更優(yōu)越的用戶體驗和搜索效果。

①定制化優(yōu)化：針對特定場景，可以調(diào)整和優(yōu)化搜索算法，使其更符合該場景下的用戶需求和信息結(jié)構(gòu)。

②數(shù)據(jù)優(yōu)勢：在特定場景下積累的大量相關(guān)數(shù)據(jù)，可以用于訓(xùn)練更精準的模型，從而提升搜索的準確性和效率。

③技術(shù)創(chuàng)新：在特定場景下不斷探索和研發(fā)新技術(shù)，如語義理解、圖像識別等，以提供更豐富的搜索功能和服務(wù)。

場景是AI搜索的長期護城河

在中國當前的搜索市場格局中，AI與搜索的融合呈現(xiàn)出兩種主要趨勢。

①以360和昆侖萬維為代表的企業(yè)，通過推出[AI搜索]應(yīng)用，實現(xiàn)了對話式搜索的創(chuàng)新體驗；

②如字節(jié)、騰訊、百度等公司，則選擇將自身的AI技術(shù)融入傳統(tǒng)搜索框中，為用戶提供更智能的搜索服務(wù)。

其中，360AI搜索、天工AI及秘塔AI搜索在體驗上仿照了Perplexity的模式，即先給出總結(jié)性的[答案]，再通過[參考資料]的形式呈現(xiàn)相關(guān)網(wǎng)頁內(nèi)容。

根據(jù)AIwatch.ai發(fā)布的[全球AI產(chǎn)品增速黑馬榜]，360AI搜索在3月份的訪問量環(huán)比增加了1677%；天工AI搜索網(wǎng)頁版在4月份的訪問量達到400萬，環(huán)比增長120%；

而秘塔AI搜索在推出不到兩個月的時間里，便累積了數(shù)百萬的訪問量。

然而，隨著AI搜索熱潮的逐漸降溫，場景適用性、用戶留存等現(xiàn)實問題開始浮出水面，標志著行業(yè)已邁入比拼內(nèi)功的新階段。

在這一階段，競爭的核心將不再局限于融資額或產(chǎn)品功能的極端化，而是轉(zhuǎn)向?qū)φ鎸嵱脩魣鼍暗睦斫夂蜐M足。

因此，中國AI搜索市場的下半場，或?qū)⒕劢褂谀Ｐ椭獾睦斫饽芰Α⑴老x程序的邏輯思維、數(shù)據(jù)集的全面性，以及在回答時精準判斷哪些頁面對于用戶獲取準確數(shù)據(jù)最為重要。

綜上所述，AI搜索產(chǎn)品并非僅具備搜索功能。原有的搜索市場參與者通過AI技術(shù)搶奪并留住用戶；

而新進入者則借助AI拓寬業(yè)務(wù)邊界，開辟通往搜索領(lǐng)域的新道路。

無論何種AI搜索產(chǎn)品，其本質(zhì)目標均在于更好地滿足用戶的搜索需求，即利用AI能力為用戶提供更精準的內(nèi)容匹配。

經(jīng)過對比體驗發(fā)現(xiàn)，當前市場上的AI搜索產(chǎn)品在應(yīng)對泛化信息需求時表現(xiàn)出色，但在垂直領(lǐng)域的精細要求下，往往難以提供專業(yè)、準確、全面的回答。

因此，無論是原生AI搜索還是傳統(tǒng)搜索引擎，在追求低門檻的同時，還需注重產(chǎn)品差異化以形成核心競爭力。

同時，應(yīng)警惕因缺乏應(yīng)用場景、數(shù)據(jù)支撐和用戶基礎(chǔ)而導(dǎo)致的市場淘汰，因為AI搜索產(chǎn)品的根本驅(qū)動力在于用戶需求而非技術(shù)本身。

只有在擁有成熟的應(yīng)用場景和穩(wěn)定的用戶留存基礎(chǔ)上，AI搜索的飛輪才能持續(xù)轉(zhuǎn)動。

AI搜索面臨工程化和產(chǎn)品化問題

①在于搜索排序算法的設(shè)計。相較于傳統(tǒng)搜索引擎主要依賴的基于網(wǎng)頁關(guān)系的算法（如PageRank），其計算過程相對簡化。

然而，AI搜索則引入了深度學(xué)習(xí)、強化學(xué)習(xí)等高級模型，這要求在海量數(shù)據(jù)上執(zhí)行大規(guī)模訓(xùn)練與優(yōu)化，對算法的性能提出了極高的標準。

據(jù)統(tǒng)計，搜索引擎每日需響應(yīng)數(shù)十億次查詢請求，而當前主流的大型語言模型在每次查詢時均需執(zhí)行數(shù)十次參數(shù)計算，這無疑加劇了整個過程的難度與復(fù)雜性。

②實時輸出成為另一關(guān)鍵挑戰(zhàn)。隨著用戶對搜索結(jié)果實時性要求的提升，任何明顯的延遲都將嚴重影響用戶體驗。

然而，大型模型因其推理過程而常導(dǎo)致反應(yīng)時間相對較長。

例如，谷歌的LaMDA對話模型在單次交互中，因涉及大量自然語言推理與生成，其計算延遲往往達到數(shù)秒，這對于搜索場景下的即時響應(yīng)需求構(gòu)成了顯著挑戰(zhàn)。

③推理準確度是AI搜索的另一核心要求。在極短時間內(nèi)完成復(fù)雜的邏輯推理，以提供最為精準的搜索結(jié)果，這既需要算法具備高效的計算能力，又需能夠妥善處理模糊與多義的查詢。

結(jié)尾：

在可預(yù)見的未來，隨著AIPC、AI手機等智能設(shè)備的日益普及，AI搜索有望成為這些設(shè)備的核心功能構(gòu)成部分。

這些設(shè)備將預(yù)裝AI搜索引擎，進而將搜索流量從傳統(tǒng)瀏覽器遷移至AIPC、AI手機等平臺。

此舉不僅將重塑傳統(tǒng)搜索行業(yè)的格局，確立AI搜索為流量匯聚的主要渠道；

而且，通過語音或手勢與AI搜索進行交互，用戶將享受到更為自然、高效的信息檢索體驗。

部分資料參考：第一財經(jīng)：《AI算不出9.11和9.9哪個大？六家大模型廠商總結(jié)了這些原因》，科技新和：《AI搜索新貴彎道超車難》，周天財經(jīng)：《AI搜索之戰(zhàn)：誰在成為中國的Perplexity》，AI科技評論：《AI搜索熱潮背后：注定要逾越場景的門檻》，技術(shù)領(lǐng)導(dǎo)力：《AI搜索，正在殺死傳統(tǒng)搜索》

原文標題 : AI芯天下丨產(chǎn)業(yè)丨9.11和9.9大模型全錯，場景將成AI搜索護城河