最近幾天,AI賽道擠滿了新品。
4月17日凌晨,先是OpenAI正式將預(yù)熱許久的o3和o4-mini正式對(duì)外,憑借“用圖像思考”能力瞬間占據(jù)熱搜頭條。
幾個(gè)小時(shí)后,杭州,字節(jié)跳動(dòng)旗下火山引擎面向企業(yè)市場發(fā)布了豆包1.5深度思考模型,同步升級(jí)文生圖模型3.0、視覺理解模型,并推出OS Agent解決方案及AI云原生推理套件,用于企業(yè)客戶構(gòu)建與部署Agent應(yīng)用。
其中,豆包1.5深度思考模型作為字節(jié)首款推理模型,具備“邊想邊搜”能力,同時(shí)借助視覺推理能力,可以綜合理解圖片中的各類信息。官方介紹,目前這款模型的人類評(píng)估表現(xiàn)超出DeepSeek R1 8%,且采用MoE架構(gòu),在總參數(shù)量為200B的情況下,激活參數(shù)僅為20B,在訓(xùn)練和推理成本方面相比同類模型可降低50%。
其實(shí),豆包在對(duì)推理模型的響應(yīng)上,稍慢了一拍。
去年9月,OpenAI發(fā)布o(jì)1模型,揭開了推理模型的序幕,之后就是今年年初,DeepSeek R1憑借超低訓(xùn)練成本和優(yōu)異性能表現(xiàn),將推理模型的熱度推向高潮,一舉改變了大模型領(lǐng)域的競爭格局,國內(nèi)外大廠巨頭、AI初創(chuàng)企業(yè)迅速跟進(jìn),不管是選擇自研推理模型,還是接入DeepSeek,都在持續(xù)發(fā)力……
字節(jié)在這方面,稍顯遲疑。但這似乎也符合字節(jié)的一貫風(fēng)格,雖然并非最早出發(fā),但一旦開始行動(dòng),就會(huì)以一種飽和式方式加速挺進(jìn),最明顯的就是豆包大模型背后的火山引擎。
去年5月,火山引擎發(fā)布豆包大模型,并將價(jià)格降至0.0008元/千Tokens,低于行業(yè)均價(jià)99.3%,之后阿里云、百度智能云接連跟進(jìn),以更低的價(jià)格甚至免費(fèi)形式,短時(shí)間內(nèi)將大模型拉進(jìn)“價(jià)格戰(zhàn)”白熱化階段。
半年后的12月份,火山引擎再次加速,發(fā)布豆包視覺理解模型,并再次以0.003元/千tokens、低于行業(yè)85%的價(jià)格出圈。彼時(shí),官方透露,豆包大模型12月日均tokens使用量超過4萬億,較5月發(fā)布時(shí)期增長超過33倍。
而這一次,數(shù)據(jù)再次刷新?;鹕揭婵偛米T待表示,截至2025年3月底,豆包大模型日均tokens調(diào)用量已達(dá)到12.7萬億,較發(fā)布之初增長超106倍。
另外,根據(jù)IDC發(fā)布的《中國公有云大模型服務(wù)市場格局分析,1 Q25》數(shù)據(jù)顯示,火山引擎以46.4%的市場份額位居第一,成為企業(yè)落地大模型的首選平臺(tái)。
此次,在模型發(fā)布后,虎嗅等媒體與譚待進(jìn)行了交流,他分享了關(guān)于火山引擎這幾個(gè)月來的變化、以及當(dāng)下大模型領(lǐng)域的行業(yè)新思考。以下為交流實(shí)錄,部分內(nèi)容略有刪減:
提問:目前市場對(duì)于云服務(wù)的需求有哪些變化?具體提出了哪些新需求?
譚待:我覺得可以把這個(gè)問題更寬泛地理解為AI時(shí)代大家對(duì)云有什么要求。
傳統(tǒng)的云是伴隨著互聯(lián)網(wǎng)發(fā)展起來的,那時(shí)的云原生很多是互聯(lián)網(wǎng)應(yīng)用(如 web、APP)在實(shí)踐中涉及的中間件、數(shù)據(jù)庫、容器等方面,是人通過編寫軟件規(guī)則、中間件等來實(shí)現(xiàn)對(duì)業(yè)務(wù)的抽象,現(xiàn)在范式發(fā)生了變化,則是利用“數(shù)據(jù) 模型”自動(dòng)去解決更多的問題。那這種情況下,(大家)對(duì)云的要求越來越多,也催生出新的產(chǎn)品,我們把這類產(chǎn)品叫做AI云原生。
原來的云原生是為了適應(yīng)互聯(lián)網(wǎng)發(fā)展,現(xiàn)在的AI云原生則是為了滿足AI和Agent發(fā)展的需求。
首先,云廠商需要有更好的模型、更低的成本,多模態(tài)也是更好模型的一種體現(xiàn),但這還不夠。AI應(yīng)用從聊天、信息處理到Agent的發(fā)展過程中,需要更多的解決方案。比如今天發(fā)布的OS Agent,需要Agent去操作電腦、手機(jī),這就需要電腦和手機(jī)的相關(guān)組件Sandbox,以及能夠操作界面的模型。
此外,還包括強(qiáng)化學(xué)習(xí)框架、安全保障以及底層數(shù)據(jù)處理等方面。未來,火山引擎將圍繞AI云原生,在存儲(chǔ)、計(jì)算、數(shù)據(jù)、安全以及新的中間件如Sandbox等方面推出一系列的產(chǎn)品。
提問:剛才你講到Agent,今年也被稱為Agent元年,包括字節(jié)在內(nèi)的很多廠商都在挖掘Agent的應(yīng)用場景,那從火山引擎的角度來看,如何看待Agent市場的機(jī)會(huì)?
譚待:我覺得不能簡單說是押注(Agent) ,隨著AI發(fā)展,聊天和信息處理只是其中一小部分,要真正為各行各業(yè)帶來變革,Agent是必經(jīng)之路,如果做不好相關(guān)工作,就難以實(shí)現(xiàn)AI的社會(huì)和經(jīng)濟(jì)價(jià)值。
我認(rèn)為Agent大概分為垂直類Agent和通用型Agent兩種類型。對(duì)于垂直類Agent,火山引擎會(huì)基于自身優(yōu)勢領(lǐng)域進(jìn)行探索,比如之前推出的數(shù)據(jù)Agent,通過構(gòu)建數(shù)據(jù)飛輪,將數(shù)據(jù)處理能力發(fā)揮到極致。所以我們會(huì)在這類垂直領(lǐng)域打造自己的Agent產(chǎn)品,這次提到的Trae也是類似情況,數(shù)據(jù)和代碼雖然屬于垂直領(lǐng)域,但非?;A(chǔ),這類垂直Agent我們會(huì)參與開發(fā)。
對(duì)于通用型Agent,它能操作電腦、手機(jī)等,應(yīng)用場景涵蓋企業(yè)內(nèi)部、個(gè)人或特定領(lǐng)域,并且需要根據(jù)不同場景進(jìn)行特別制定。對(duì)火山引擎來說,更重要的是搭建好基礎(chǔ)框架、提供好用的工具。所以我們推出了OS Agent解決方案,借助新的AI云原生組件、SandBox和新模型,讓開發(fā)者和企業(yè)能更輕松地打造自己的通用Agent,這是火山引擎未來的重要發(fā)展方向。
提問:在Agent的布局上,現(xiàn)在可以看到,既有字節(jié)這樣的大廠,也有發(fā)布Manus的Monica這類初創(chuàng)企業(yè),那在你看來,誰在這一領(lǐng)域的機(jī)會(huì)更大?
譚待:機(jī)會(huì)大小取決于企業(yè)的創(chuàng)新能力,而非企業(yè)規(guī)模,所以不能以公司大小來判斷,持續(xù)保持創(chuàng)新能力才是關(guān)鍵。
提問:DeepSeek的R2正在籌劃中,可能不久也要推出,面對(duì)這一強(qiáng)勁的競爭對(duì)手,字節(jié)是如何看待開源與閉源策略?
譚待:我主要從火山引擎的視角來回答。首先對(duì)于模型來說,開源或閉源不是關(guān)鍵,優(yōu)劣才是關(guān)鍵。因?yàn)槟P蛿?shù)量眾多,并非所有都有很大影響力,更關(guān)鍵還是在于質(zhì)量。不管是去年還是今年,業(yè)界都處于你追我趕的狀態(tài),比如17日凌晨OpenAI還發(fā)布了o3和o4-mini,與字節(jié)出現(xiàn)“撞車”情況(笑)。
我覺得競爭是非常好的事情,若把當(dāng)前的AI發(fā)展看作一場馬拉松,可能現(xiàn)在才跑了500米。大家在競爭中相互推動(dòng),無論對(duì)于技術(shù)還是行業(yè)應(yīng)用來說都能快速發(fā)展,而競爭的關(guān)鍵在于能否把模型做好,與開源和閉源關(guān)系不大。
提問:那在后續(xù)的商業(yè)化上有什么規(guī)劃?
譚待:提到商業(yè)模式的影響,從火山引擎的角度來說,我們本身是云廠商,目標(biāo)是做AI時(shí)代最好的云。要把最好的模型提供給大家,核心在于兩點(diǎn):一是做好基礎(chǔ)設(shè)施AI云原生;二是提供最好的模型以及模型上的各種應(yīng)用。這次我們就推出了OS Agent這一層,更偏向于Agent這樣的模型。
當(dāng)我們的云原生做好了,使用者和企業(yè)用戶既可以在上面用豆包,也可以用開源模型。剛才提到DeepSeek,它推出后,所有云廠商中對(duì)其適配最好的就是火山引擎,據(jù)我了解,市面上第三方在使用 DeepSeek云服務(wù)時(shí),選擇火山引擎的最多。所以對(duì)于火山引擎來說,好的模型越多越好。
提問:預(yù)估未來2年火山引擎的大模型tokens調(diào)用情況如何,還會(huì)保持近百倍的增長嗎?
譚待:對(duì)于技術(shù)發(fā)展而言,人們通常會(huì)“短期高估、長期低估”。
從長期來看,百倍甚至更高的增長是有可能的,但具體是2年還是3年,最關(guān)鍵的取決于模型是否有重大突破。去年到今年(調(diào)用量)增長很快,是因?yàn)椋ǘ拱┠P陀袔讉€(gè)重大突破:一是最基礎(chǔ)的聊天和信息處理能力提升且成本下降;二是今年深度思考功能的推出,這也是一個(gè)突破。往后發(fā)展還有很多關(guān)鍵節(jié)點(diǎn),比如視覺推理能否做得更好、Agent相關(guān)技術(shù)能否取得更大進(jìn)展。
每一次大的模型(技術(shù))突破都肯定能激發(fā)一次大的變化,但2年內(nèi)能否再翻100倍,要謹(jǐn)慎樂觀。
提問:目前火山引擎在對(duì)內(nèi)支持和對(duì)外擴(kuò)張上是怎樣的比重?接下來在團(tuán)隊(duì)擴(kuò)招上有沒有計(jì)劃?
譚待:對(duì)于火山引擎而言,內(nèi)部很多業(yè)務(wù)都依托于火山平臺(tái),比如抖音等產(chǎn)品,同時(shí)我們也對(duì)外提供支持。從成立之初,我們就堅(jiān)持技術(shù)內(nèi)外統(tǒng)一,這樣既能保障對(duì)內(nèi)服務(wù),也能做好對(duì)外支持。通過技術(shù)和資源復(fù)用,我們能為內(nèi)外客戶提供性價(jià)比更高的服務(wù),像我們的MaaS和云服務(wù),性價(jià)比優(yōu)勢就源于此,而且實(shí)現(xiàn)統(tǒng)一后,無需糾結(jié)資源分配偏向內(nèi)部還是外部,因?yàn)榧夹g(shù)需求基本一致,全球優(yōu)秀的云服務(wù)提供商(如AWS)也是如此運(yùn)作。
關(guān)于業(yè)務(wù)擴(kuò)張,我們會(huì)根據(jù)業(yè)務(wù)增長情況進(jìn)行規(guī)劃。
一方面,與規(guī)模相關(guān)的業(yè)務(wù)如服務(wù)更多客戶,需要擴(kuò)充銷售團(tuán)隊(duì)、增加解決方案和客戶成功經(jīng)理,這部分人員會(huì)相應(yīng)增加。另一方面,產(chǎn)品研發(fā)更注重質(zhì)量。當(dāng)下AI正改變各行各業(yè),我們也在思考如何借助AI提升自身產(chǎn)品研發(fā)和維護(hù)的效率。比如我們內(nèi)部使用Data Agent進(jìn)行數(shù)據(jù)分析等,火山引擎要成為AI原生、AI實(shí)踐的典范,這樣才能助力客戶和開發(fā)者實(shí)現(xiàn)AI轉(zhuǎn)型。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。