國(guó)產(chǎn)AI“三英”戰(zhàn)OpenAI:DeepSeek、月之暗面、MiniMax相繼上新 戰(zhàn)況如何?
《科創(chuàng)板日?qǐng)?bào)》1月21日訊(編輯 宋子喬)?OpenAI的GPT系列身后,國(guó)產(chǎn)大模型正緊追不舍。
1月20日,DeepSeek正式發(fā)布DeepSeek-R1,并同步開(kāi)源模型權(quán)重。據(jù)介紹,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版。
根據(jù)其公布的測(cè)試數(shù)據(jù),DeepSeek-R1在美國(guó)AIME 2024、MATH-500和SWE-bench Verified測(cè)試中的比分均高于OpenAI o1(小K注:前兩個(gè)測(cè)試專(zhuān)注于數(shù)學(xué)能力,SWE-bench Verified旨在評(píng)估AI模型解決現(xiàn)實(shí)世界軟件問(wèn)題的能力)。
同一天,Kimi全新SOTA模型——k1.5多模態(tài)思考模型上線(xiàn)。在long-CoT模式下,Kimi k1.5的數(shù)學(xué)、代碼、多模態(tài)推理能力,也達(dá)到長(zhǎng)思考SOTA模型OpenAI o1正式版的水平。官方表示,這應(yīng)該是全球范圍內(nèi),OpenAI之外的公司首次實(shí)現(xiàn)o1正式版的多模態(tài)推理性能。Kimi技術(shù)團(tuán)隊(duì)第一次準(zhǔn)備了詳細(xì)的技術(shù)報(bào)告。
在short-CoT模式下,Kimi k1.5的數(shù)學(xué)、代碼、視覺(jué)多模態(tài)和通用能力,大幅超越了全球范圍內(nèi)短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,領(lǐng)先達(dá)到550%。
其他國(guó)產(chǎn)大模型同樣表現(xiàn)出色,1月15日,MiniMax發(fā)布全新開(kāi)源模型系列Minimax-01,在多個(gè)標(biāo)準(zhǔn)和內(nèi)部基準(zhǔn)測(cè)試中,Minimax-01的性能與GPT-4o、Claude3.5-Sonnet等頂尖模型相當(dāng),尤其在長(zhǎng)上下文處理方面表現(xiàn)突出。
OpenAI分別在2024年5月、9月和12月發(fā)布了GPT-4o、GPT-o1(包括o1-preview和o1-mini,o1正式版推遲到2024年12月發(fā)布)和GPT-o3,目前最強(qiáng)大的模型是o3,具備出色的推理能力、科學(xué)知識(shí)掌握更優(yōu)秀、編碼能力更強(qiáng)。
o1緊隨其后,擅長(zhǎng)編碼、數(shù)學(xué)和寫(xiě)作,其多模態(tài)功能支持圖片上傳,允許它將推理應(yīng)用于視覺(jué),以獲得更詳細(xì)、更有用的回復(fù)。
以DeepSeek為代表的國(guó)產(chǎn)大模型團(tuán)隊(duì)力圖在性能上比肩最先進(jìn)的大模型,定價(jià)則展示了極致性?xún)r(jià)比。
DeepSeek-R1 API服務(wù)定價(jià)為每百萬(wàn)輸入tokens 1元(緩存命中)/4元(緩存未命中);每百萬(wàn)輸出tokens 16元。
與之對(duì)比,GPT-o1模型每百萬(wàn)輸入tokens 15美元(約合人民幣110元);每百萬(wàn)輸出tokens 60美元(約合人民幣438元)。OpenAI目前最便宜的模型是GPT-4o mini,其定價(jià)為每百萬(wàn)輸入Tokens 10美元(約合人民幣73元);每百萬(wàn)輸出tokens 20美元(約合人民幣146元)。
國(guó)產(chǎn)大模型呼喚國(guó)產(chǎn)算力
國(guó)內(nèi)外大模型廠(chǎng)商你追我趕,短時(shí)間內(nèi)迅速迭代,意味著大模型廠(chǎng)商對(duì)算力的需求仍在繼續(xù)增加。
火山引擎智能算法負(fù)責(zé)人吳迪此前曾表示,字節(jié)跳動(dòng)綜合考慮算力資源儲(chǔ)備、市場(chǎng)未來(lái)用量、模型成本下降等因素判斷,2027年豆包每天Token消耗量會(huì)超過(guò)100萬(wàn)億,將是現(xiàn)在的100倍以上。
1月20日消息稱(chēng),據(jù)蕪湖市生態(tài)環(huán)境局官網(wǎng),字節(jié)跳動(dòng)(抖音集團(tuán))旗下蕪湖江東名邑科技有限公司擬在安徽蕪湖建設(shè)火山引擎長(zhǎng)三角算力中心項(xiàng)目,項(xiàng)目環(huán)境影響評(píng)價(jià)文件近日獲受理,并正在實(shí)施批前公示。該項(xiàng)目總投資80億元,設(shè)計(jì)服務(wù)器機(jī)柜數(shù)為21824臺(tái),網(wǎng)絡(luò)機(jī)柜236臺(tái),一座220kV變電站。
此前有消息稱(chēng),小米正在搭建自己的GPU萬(wàn)卡集群,并對(duì)AI大模型進(jìn)行大規(guī)模投資。
東莞證券此前表示,未來(lái),隨著字節(jié)、幻方、小米等國(guó)內(nèi)廠(chǎng)商積極布局AI領(lǐng)域,國(guó)產(chǎn)大模型有望快速崛起,推動(dòng)國(guó)產(chǎn)算力需求增長(zhǎng),促進(jìn)國(guó)產(chǎn)算力基礎(chǔ)設(shè)施建設(shè),我國(guó)國(guó)產(chǎn)算力產(chǎn)業(yè)鏈有望迎來(lái)發(fā)展機(jī)遇。
上海證券也發(fā)布研報(bào)稱(chēng),以字節(jié)為代表的國(guó)產(chǎn)大模型崛起,以及小米等玩家的入局,有望拉動(dòng)國(guó)內(nèi)互聯(lián)網(wǎng)大廠(chǎng)在算力端的支出,國(guó)內(nèi)算力軍備競(jìng)賽剛剛開(kāi)始,國(guó)產(chǎn)算力廠(chǎng)商迎來(lái)發(fā)展機(jī)遇。
東方證券表示,算力建設(shè)持續(xù)性至關(guān)重要,在此背景下,服務(wù)器及液冷廠(chǎng)商、PCB廠(chǎng)商等有望受益。此外,數(shù)據(jù)存力和運(yùn)力需求的持續(xù)攀升,為存儲(chǔ)、光模塊和光芯片等企業(yè)創(chuàng)造了更多的市場(chǎng)機(jī)會(huì),促使整個(gè)產(chǎn)業(yè)鏈不斷優(yōu)化升級(jí),以滿(mǎn)足日益增長(zhǎng)的AI算力需求。