讓大模型超級(jí)有用,李彥宏放了個(gè)大招
摘要:應(yīng)用驅(qū)動(dòng)
文 | 山核桃 無(wú)銹缽
“過(guò)去這24個(gè)月,這種全球性的大模型狂熱,究竟是一場(chǎng)新的技術(shù)革命,還是新一輪泡沫?”
11月12日的百度世界大會(huì)上,以標(biāo)志性白襯衫現(xiàn)身的百度集團(tuán)創(chuàng)始人兼CEO李彥宏在他的演講開(kāi)頭,就向外界拋出了這一重磅的“大模型之問(wèn)”。
AI究竟是不是泡沫?
李彥宏和百度對(duì)這一“大模型之問(wèn)”的回答顯然很堅(jiān)定——AI不是泡沫,文心大模型調(diào)用量的高速增長(zhǎng)印證了這一點(diǎn)。
截至目前,百度文心大模型的日均調(diào)用量已超15億次,相較一年前首次披露的5000萬(wàn)次,增長(zhǎng)約30倍,這說(shuō)明AI是真需求,大模型應(yīng)用正處于爆發(fā)前夜。
李彥宏和百度沒(méi)有滿足于此。在剛剛結(jié)束的百度世界大會(huì)上,百度發(fā)布了最新的檢索增強(qiáng)的文生圖技術(shù)(iRAG)和無(wú)代碼工具“秒噠”。
未來(lái)已來(lái),人們與“AI應(yīng)用創(chuàng)造世界的距離”,又近了一步。
1、為「超級(jí)有用」鋪路造橋
“我們不是要推出一個(gè)‘超級(jí)應(yīng)用’,而是要不斷地幫助更多人、更多企業(yè)打造出數(shù)以百萬(wàn)‘超級(jí)有用’的應(yīng)用?!?/p>
在此次百度世界大會(huì)上,李彥宏率先在行業(yè)里喊話——“要打造超級(jí)有用的應(yīng)用”的原因所在。
iRAG技術(shù)和無(wú)代碼工具“秒噠”,其實(shí)是百度為“加速應(yīng)用滲透”送上的錘子。
想讓大模型落地直接應(yīng)用、產(chǎn)生實(shí)用價(jià)值,國(guó)內(nèi)外大模型廠商其中的一個(gè)主線任務(wù),就是各出奇招解決大模型的“幻覺(jué)問(wèn)題”。
李彥宏認(rèn)為,?過(guò)去24個(gè)月,大模型的最大變化是基本消除了“幻覺(jué)”?,這主要得益于RAG(檢索增強(qiáng)生成)等技術(shù)對(duì)模型性能等提升。
RAG技術(shù)結(jié)合了信息檢索和生成的能力,有效提高了大模型文本內(nèi)容生成的質(zhì)量,但隨著圖像等多模態(tài)AI的飛速發(fā)展,大模型的“幻覺(jué)”問(wèn)題變得越來(lái)越復(fù)雜,各類文生圖模型盡管反復(fù)宣稱在生成效果上“超越人類設(shè)計(jì)師”,但在實(shí)際使用過(guò)程中,用戶的翻車體驗(yàn)并不在少數(shù)。
在AI生圖領(lǐng)域,怎么殺死“幻覺(jué)”?關(guān)鍵時(shí)刻,還是百度帶來(lái)了好消息。
據(jù)百度CTO王海峰介紹,在今年年初,百度就決定下場(chǎng)通過(guò)自研iRAG技術(shù),結(jié)合不同應(yīng)用場(chǎng)景下用戶具體的生圖需求,解決圖像生成的幻覺(jué)問(wèn)題。
王海峰具體介紹了iRAG實(shí)現(xiàn)可控生圖的技術(shù)鏈路,和此前百度的檢索增強(qiáng)技術(shù)類似,這依舊是一個(gè)“理解-檢索-生成”協(xié)同優(yōu)化的過(guò)程。
首先,大模型會(huì)用戶的具體需求進(jìn)行分析理解,自動(dòng)規(guī)劃精確或者泛化的方案,比如對(duì)哪些實(shí)體進(jìn)行增強(qiáng);
其次,在增強(qiáng)階段,對(duì)需要增強(qiáng)的實(shí)體進(jìn)行檢索,并選擇對(duì)應(yīng)的參考圖;
最后,在生成階段,百度自研了多模態(tài)可控生圖大模型,一方面,通過(guò)局部注意力計(jì)算,大模型能在保持實(shí)體特征不變的情況下,實(shí)現(xiàn)圖像的高泛化生成;另一方面,通過(guò)整體注意力計(jì)算,可實(shí)現(xiàn)圖像的高精確生成,保持生成圖和原圖相關(guān)物體等元素的一致性。
「財(cái)經(jīng)無(wú)忌」以“錘子手機(jī)”、“虎皮雞蛋”等prompt,實(shí)測(cè)文心一言AI生圖功能發(fā)現(xiàn),對(duì)比國(guó)內(nèi)其他模型廠商,在iRAG技術(shù)加持下,所生成的圖片對(duì)prompt的理解更準(zhǔn)確,圖片的生成質(zhì)量也不錯(cuò)。
左圖為其他廠商,右圖為文心一言
以人物動(dòng)作和環(huán)境的一致性,我們以“生成一張?jiān)谕媸謾C(jī)的華妃的圖”為需求,也“考了考”文心一言的表現(xiàn),不到20s文心一言就完成了任務(wù),所生成的圖片也與真實(shí)世界高度相似,沒(méi)有什么“AI味兒”。
對(duì)prompt的理解、人物一致性、 生成速度都超出我們預(yù)期
iRAG技術(shù)無(wú)幻覺(jué)、超真實(shí)、低成本、立等可取等一系列優(yōu)勢(shì),這也意味著,小到普通自媒體工作者的圖文編輯,大到上市公司宣傳海報(bào)制作,都有望直接從中受益,AI應(yīng)用的空間也得以打開(kāi)。
李彥宏在接受媒體專訪時(shí)也提到:“多模態(tài)要想進(jìn)入真正實(shí)用階段,也得有準(zhǔn)確性,或者說(shuō)可控性。讓你不變就不能變。有了這種能力后,應(yīng)用空間才能打開(kāi)”。
除了消除大模型的幻覺(jué),是AI應(yīng)用爆發(fā)的技術(shù)前置條件,更關(guān)鍵的是還有找到大模型時(shí)代應(yīng)用落地的載體。
百度瞄準(zhǔn)的方向就是就是智能體。
今天,智能體幾乎已成為頭部大模型廠商探索的“標(biāo)配”。
麥肯錫報(bào)告顯示,過(guò)去的一年里,Google、OpenAI都將智能體作為大模型最重要的應(yīng)用場(chǎng)景,OpenAI創(chuàng)始人奧特曼近期采訪中提及「5級(jí)AGI」藍(lán)圖里也反復(fù)強(qiáng)調(diào)“智能體”的作用:“第三級(jí)是智能體,能夠執(zhí)行長(zhǎng)期任務(wù),比如與環(huán)境多次互動(dòng),并與人類協(xié)同工作”。
李彥宏認(rèn)為,智能體相當(dāng)于 PC 時(shí)代的網(wǎng)站和自媒體時(shí)代的賬號(hào),其特點(diǎn)是門(mén)檻低、天花板又足夠高。
本質(zhì)上,智能體是一個(gè)更輕量化、更具主動(dòng)性和更強(qiáng)交互性的AI應(yīng)用,但對(duì)一個(gè)毫無(wú)編程經(jīng)驗(yàn)的普通人來(lái)說(shuō),想要?jiǎng)?chuàng)造一個(gè)專屬智能體或?qū)崿F(xiàn)多智能體的協(xié)作,依舊有很高的門(mén)檻。
而百度的無(wú)代碼工具“秒噠”的誕生,解決了這一問(wèn)題,用戶只需要向大模型表達(dá)出自己所需要的智能體工作流等信息,僅依靠自然語(yǔ)言交互,就可以完成一整套系統(tǒng)的設(shè)計(jì)、開(kāi)發(fā)、測(cè)試。
區(qū)別于其他的低代碼或無(wú)代碼開(kāi)發(fā)平臺(tái),“秒噠”的特色有兩點(diǎn):一是不局限在程序員等開(kāi)發(fā)者,門(mén)檻更低。二是整個(gè)應(yīng)用的開(kāi)發(fā)過(guò)程,可實(shí)現(xiàn)多智能體的協(xié)作。
據(jù)王海峰透露,這主要是因?yàn)椤懊雵}”所采用的是智能體的“中心化模式”。
舉例來(lái)說(shuō),如果用戶想針對(duì)某新技術(shù)發(fā)布會(huì)開(kāi)發(fā)一個(gè)嘉賓邀請(qǐng)和管理系統(tǒng),“秒噠”在受到需求后,“小組長(zhǎng)智能體(0號(hào)智能體)”進(jìn)行規(guī)劃調(diào)度,將任務(wù)拆解并召喚各智能體來(lái)完成任務(wù),策劃設(shè)計(jì)方案會(huì)交給“策劃智能體”,文字編輯內(nèi)容會(huì)交給“編輯智能體”,網(wǎng)頁(yè)的代碼編寫(xiě)、系統(tǒng)制作和部署由“程序員智能體”完成,最后還有負(fù)責(zé)質(zhì)檢的智能體,檢查和測(cè)試代碼,并能和其他智能體配合一起改bug。
總結(jié)來(lái)看, iRAG技術(shù)進(jìn)一步解決大模型的“幻覺(jué)”,“秒噠”則是以低門(mén)檻的方式讓小白輕松上手應(yīng)用開(kāi)發(fā),為「超級(jí)有用」鋪路造橋的百度,其實(shí)也為應(yīng)用爆發(fā)打好了基礎(chǔ)。
2、祛魅超級(jí)應(yīng)用,從“智能涌現(xiàn)”到“價(jià)值涌現(xiàn)”
“國(guó)外有一種說(shuō)法叫‘軟件吞噬世界’。但我認(rèn)為,這個(gè)世界不應(yīng)該被吞噬,而應(yīng)該被創(chuàng)造。AI時(shí)代,應(yīng)用創(chuàng)造世界。”
在漫長(zhǎng)的科技史上,對(duì)新技術(shù)的質(zhì)疑,從來(lái)都不是什么新鮮話題。
那些“AI泡沫論”的擁躉者,所給出的理由是:“至今未出現(xiàn)一個(gè)大模型時(shí)代的超級(jí)應(yīng)用”。
這實(shí)際陷入了一個(gè)“應(yīng)用誤區(qū)”——對(duì)“超級(jí)應(yīng)用的過(guò)度迷戀”。過(guò)去兩年里,市場(chǎng)涌現(xiàn)出諸多號(hào)稱“大模型時(shí)代的超級(jí)應(yīng)用”,但又迅速衰落,根本原因在于“好看但不有用”,難以與個(gè)人、企業(yè)的實(shí)際場(chǎng)景和需求結(jié)合,形成產(chǎn)品迭代的增長(zhǎng)飛輪,自然也難以長(zhǎng)紅。
“如果說(shuō)2023年大家還在卷模型,讓模型能力逐步地達(dá)到可用地步的話,那未來(lái)所謂的‘可用’,就是真的有東西用?!崩顝┖暾f(shuō)。
“超級(jí)應(yīng)用”到“超級(jí)有用”,一字之差,所對(duì)應(yīng)的是兩種完全不同的認(rèn)知和實(shí)踐邏輯。
一方面,在認(rèn)知上強(qiáng)調(diào)“有用”更偏向談生成式AI的落地價(jià)值,而不是“為了創(chuàng)新而創(chuàng)新”;另一方面,在實(shí)踐上強(qiáng)調(diào)“有用”是關(guān)注用戶和企業(yè)的實(shí)際需求,避免“拿著錘子找釘子”。
在“超級(jí)有用”的思路下,再看百度推出iRAG技術(shù)和無(wú)代碼工具“秒噠”,其實(shí)有更深遠(yuǎn)的兩重含義:
一是將真技術(shù)創(chuàng)新與真需求場(chǎng)景融合,降低普通人實(shí)踐AI的門(mén)檻,打開(kāi)AI應(yīng)用落地的規(guī)?;臻g。
無(wú)論是關(guān)注幻覺(jué)問(wèn)題的iRAG技術(shù),抑或是讓零編程經(jīng)驗(yàn)的普通人也能手搓智能體的“秒噠”,都是百度結(jié)合現(xiàn)有模型能力,將復(fù)雜的技術(shù)場(chǎng)景留給自己,將最簡(jiǎn)單的體驗(yàn)留給用戶,縮短人們與AI間的距離。
二是在瞬息萬(wàn)變的技術(shù)發(fā)展中為更多人找到可確定的方法論。在GPT-5遲遲未至,Scaling law放緩的諸多質(zhì)疑中,李彥宏認(rèn)為,這對(duì)應(yīng)用層來(lái)說(shuō)是反而是新機(jī)遇。
“從應(yīng)用端來(lái)看,技術(shù)進(jìn)步的速度不僅沒(méi)有放慢,甚至有變快趨勢(shì)。從另外一個(gè)角度來(lái)講,反而是基礎(chǔ)模型不能夠特別快的迭代,如果老在變,那做應(yīng)用的人就無(wú)所適從了。”
當(dāng)然,長(zhǎng)期來(lái)看,在復(fù)雜的應(yīng)用場(chǎng)景里,模型能力的提升依舊還會(huì)遵循大力出奇跡的Scaling law或依賴模型精調(diào)、數(shù)據(jù)標(biāo)注等工程化手段,但在一些相對(duì)沒(méi)有那么復(fù)雜的應(yīng)用場(chǎng)景里,比如代碼領(lǐng)域,人們可以借助大模型能力,提升認(rèn)知、創(chuàng)造價(jià)值,這是確定性的趨勢(shì)。
“我今天能夠?qū)憙砂傩写a,一年以后可能能寫(xiě)兩千行代碼,再過(guò)三年可以寫(xiě)兩萬(wàn)行代碼,這個(gè)能力會(huì)逐步發(fā)展出來(lái),那它會(huì)讓更多人的創(chuàng)造性給激發(fā)出來(lái)?!崩顝┖暾f(shuō)。
而當(dāng)更多人看見(jiàn)AI產(chǎn)生的實(shí)際價(jià)值,大模型或許也能從“智能涌現(xiàn)”、“能力涌現(xiàn)”再到最終實(shí)現(xiàn)“價(jià)值涌現(xiàn)”。
3、中國(guó)大模型彎道超車,機(jī)會(huì)是應(yīng)用驅(qū)動(dòng)
伴隨AI成果的涌現(xiàn),人們也在關(guān)注中國(guó)大模型的“未來(lái)之問(wèn)”:
中國(guó)大模型產(chǎn)業(yè)爆發(fā)能否復(fù)刻移動(dòng)互聯(lián)網(wǎng)時(shí)期的輝煌?中國(guó)AI公司與硅谷企業(yè)相比,又有哪些比較優(yōu)勢(shì)?
回到“第一性”原理,李彥宏認(rèn)為百度就是“應(yīng)用驅(qū)動(dòng)”。
”美國(guó)很多公司一直都是夢(mèng)想說(shuō)我要做顛覆性的技術(shù),我更多希望盡早接觸場(chǎng)景及接觸應(yīng)用,看在這個(gè)過(guò)程當(dāng)中,到底遇到了什么問(wèn)題,把這些問(wèn)題帶回來(lái),我們綜合看一下,大家遇到的最多的問(wèn)題,就是我們優(yōu)先解決的問(wèn)題?!袄顝┖杲忉尅?/p>
“應(yīng)用驅(qū)動(dòng)”既是百度的底層戰(zhàn)略思考,也是中國(guó)大模型彎道超車的優(yōu)勢(shì)。
畢竟,從移動(dòng)互聯(lián)網(wǎng)時(shí)代開(kāi)始,中國(guó)就誕生出諸多超級(jí)應(yīng)用,在技術(shù)落地的終端入口上,中國(guó)同樣也是全球最大的消費(fèi)電子生產(chǎn)國(guó)、出口國(guó)和消費(fèi)國(guó)。在迭代的技術(shù)革命主題背后,將技術(shù)創(chuàng)新與市場(chǎng)需求結(jié)合,落地用戶端的應(yīng)用,這一直都是中國(guó)廠商的優(yōu)勢(shì)和機(jī)遇所在。
近期,由弗若斯特沙利文發(fā)布的《2024年全球AI生態(tài)全景概覽》中,百度也和 OpenAI、谷歌一起,成為了全球唯三被該機(jī)構(gòu)承認(rèn)的“AI 原生巨頭”。
作為中國(guó)唯一一個(gè)榜上有名的公司,這份榜單恰好給出了我們答案:中國(guó)大模型彎道超車,機(jī)會(huì)就在應(yīng)用驅(qū)動(dòng)。
關(guān)于應(yīng)用的故事,李彥宏和百度顯然瞄準(zhǔn)的是AI的長(zhǎng)期主義,十二年前,投身AI浪潮的百度選擇成為彼時(shí)AI火種的傳播者時(shí),沒(méi)人能想到這場(chǎng)“應(yīng)用來(lái)了”的浪潮或許將改變每個(gè)參與者的命運(yùn)。
現(xiàn)在,他們繼續(xù)沿著這條路行走,李彥宏將人工智能比喻成“一次新的工業(yè)革命”:“這意味著它不是三五年就結(jié)束,不是一兩年就出現(xiàn)‘超級(jí)應(yīng)用’的過(guò)程,它更像是三五十年對(duì)于整個(gè)社會(huì)的方方面面一個(gè)非常徹底的重構(gòu)?!?/p>
拉長(zhǎng)科技史,無(wú)論是微軟谷歌,抑或是如今的英偉達(dá),那些將經(jīng)歷放在?!凹夹g(shù)是否真的有用”的科技巨頭也都收獲了時(shí)間的玫瑰,或許如李彥宏所言“我們即將迎來(lái)AI應(yīng)用的群星閃耀時(shí)刻”,而中國(guó)大模型,也有望借助應(yīng)用驅(qū)動(dòng),講述更多的新故事。