實測智譜新智能體AutoGLM沉思:跨平臺“邊想邊干”破信息壁壘,免費不限量開放
圖片來源:視覺中國
藍(lán)鯨新聞3月31日訊(記者 朱俊熹)3月31日,大模型獨角獸智譜AI在中關(guān)村論壇上正式發(fā)布全新智能體“AutoGLM沉思”。據(jù)智譜介紹,該智能體具備深度研究能力(Deep Research),同時還能實現(xiàn)實際操作(Operator),推動AI Agent進(jìn)入“邊想邊干”的階段。
智能體一直是國內(nèi)外AI公司競相押注的方向。本月初,中國初創(chuàng)企業(yè)Monica發(fā)布智能體產(chǎn)品Manus,稱其為“全球首款通用Agent”,引發(fā)科技行業(yè)熱議。OpenAI也于2月推出deep research(深度研究)功能,通過智能體對復(fù)雜任務(wù)進(jìn)行多步驟研究,在數(shù)十分鐘內(nèi)做到人類需要數(shù)小時才能完成的工作。
智譜CEO張鵬在中關(guān)村論壇的演講中表示,“智譜很早在布局AI Agent,甚至早過海外的OpenAI和Anthropic。”自去年10月起,智譜陸續(xù)推出能模擬人類操作手機(jī)、計算機(jī)等電子設(shè)備的智能體,支持跨應(yīng)用操作,一句話讓AI幫忙發(fā)微信紅包或下單采購?fù)赓u。
據(jù)智譜介紹,最新的AutoGLM沉思是國內(nèi)首個正式開放給所有用戶的deep research類智能體功能。除deep research能力外,AutoGLM沉思還具備實際操作能力,能夠主動行動。智譜稱,這一能力的實現(xiàn)依賴于三個關(guān)鍵特性:一是深度思考,模擬人類在面對復(fù)雜問題時的推理與決策過程;二是感知世界,像人一樣獲取并理解環(huán)境信息;三是工具使用,像人一樣調(diào)用和操作工具,完成復(fù)雜任務(wù)。
“此次發(fā)布的是preview版本,核心是以research類場景為主。在未來的兩周時間之內(nèi),我們將進(jìn)一步擴(kuò)展更多的agent場景和執(zhí)行的能力。”張鵬介紹稱。
在實測中,藍(lán)鯨新聞向AutoGLM沉思測試版提出這樣的Prompt:我最近在研究AI Coding(AI編程)領(lǐng)域,幫我整理一份行業(yè)報告,要包含國內(nèi)外主流的AI Coding工具。
AutoGLM沉思會先對用戶的請求進(jìn)行拆解,再逐步執(zhí)行研究計劃。該智能體的操作過程貼近人類的行為方式,會跳轉(zhuǎn)打開Cursor、Windsurf等AI編程工具的官網(wǎng)。瀏覽網(wǎng)頁并收集相關(guān)信息,整合到最終生成的研究報告中。
圖片來源:AutoGLM沉思實測
藍(lán)鯨新聞發(fā)現(xiàn),AutoGLM沉思通過瀏覽器插件的方式實現(xiàn)對網(wǎng)頁的調(diào)用。如果用戶此前未登陸相關(guān)官網(wǎng),智能體在執(zhí)行任務(wù)時會受阻,需要用戶介入,等待手動確認(rèn)?;蛘咚矔鲃诱{(diào)整搜索策略,轉(zhuǎn)向其他信源來獲取詳細(xì)信息。
圖片來源:AutoGLM沉思實測
相較而言,當(dāng)通過Manus執(zhí)行同一任務(wù)時,雖然Manus也會主動瀏覽不同AI編程工具的官網(wǎng),但僅體現(xiàn)在對步驟的簡要描述中,不會像AutoGLM沉思一樣彈出瀏覽器頁面。
圖片來源:Manus截圖
通過模擬人類瀏覽網(wǎng)頁的方式,智譜的智能體AutoGLM沉思能夠突破各平臺間的“信息壁壘”。以制定一項旅游計劃的任務(wù)為例,Manus等產(chǎn)品參考的是互聯(lián)網(wǎng)上能被抓取到的公開信息,而AutoGLM沉思可以觸達(dá)更多相對封閉的內(nèi)容生態(tài),包括小紅書筆記、知乎、嗶哩嗶哩視頻等,提供更優(yōu)質(zhì)的信息來源。
圖片來源:AutoGLM沉思實測
從用戶體驗來看,Manus運行在獨立虛擬機(jī)中,執(zhí)行任務(wù)時可以關(guān)閉其頁面,不影響它在后臺繼續(xù)保持工作。當(dāng)用戶提出任務(wù)請求后,Manus會補(bǔ)充提問以進(jìn)一步確認(rèn)需求細(xì)節(jié)。用戶也可以隨時發(fā)送信息,對任務(wù)進(jìn)行修改、補(bǔ)充或要求停止。
圖片來源:Manus截圖
而智譜的AutoGLM沉思在任務(wù)進(jìn)行過程中,不支持對任務(wù)進(jìn)行修改或開啟新對話,否則會直接終止任務(wù)進(jìn)程。AutoGLM沉思跳轉(zhuǎn)打開的瀏覽器頁面雖然可以小窗化,但必須全程保持在線,且用戶難以直觀判斷任務(wù)的進(jìn)度條。智譜表示,之后計劃推出“虛擬機(jī)”版本,進(jìn)一步增強(qiáng)AI Agent的實際落地能力。
圖片來源:Manus任務(wù)進(jìn)度
智譜稱,AutoGLM沉思向用戶免費、不限量地開放體驗。OpenAI的deep research功能需要用戶每月至少付費20美元。Manus也在3月28日公布了其收費方案:Manus Starter每月收費39美元,獲得3900積分;Manus Pro每月收費199美元,獲得19900積分。
積分是Manus使用的標(biāo)準(zhǔn)計量單位,任務(wù)越復(fù)雜或越耗時,所需積分越多。以藍(lán)鯨新聞實測的任務(wù)為例,生成一份關(guān)于AI編程的行業(yè)報告需要花費23分鐘,消耗456積分。而生成旅游計劃需要17分鐘,消耗197積分。
智譜表示,AutoGLM沉思的背后,融合了新版基座模型GLM-4-Air-0414的通用能力、全新深度思考模型 GLM-Z1-Air的反思能力、沉思模型GLM-Z1-Rumination,以及AutoGLM的自動執(zhí)行能力。其中核心鏈路的模型和技術(shù),預(yù)計將于4月14日正式開源。
新版GLM-Z1-Air在性能表現(xiàn)上可媲美DeepSeek-R1。其推理速度相比R1提升了8倍,成本可以降低至1/30?;贕LM-Z1訓(xùn)練出的沉思模型GLM-Z1-Rumination,能通過更長的深度思考時間來換取更優(yōu)的效果,突破了實時聯(lián)網(wǎng)搜索、動態(tài)工具調(diào)用、深度分析和自我驗證。
“相比于傳統(tǒng)的推理模型,我們期待沉思模型引領(lǐng)AI助手進(jìn)入一個‘高智商’到‘高智商+高自主’的階段?!敝亲V稱。