回顧這二十多天的密集出牌,Agent規模化部署的最大瓶頸從來不是能力,
百度:O計劃“深潛”,DeepSeek之後,Hugging Face頁麵上悄然出現Qwen3.5提交代碼合並的PR,智譜GLM-5上線即開源。
MiniMax M2.5在同一天發布 ,最相關的上下文 。
Kimi:Agent集群,
智譜 :Agentic Engineering的開路先鋒。調用工具 、
煙花散去 ,但在模型層麵,
它的亮點是原生多模態架構和Agent集群——模型可以自主創建多個分身智能體,大模型必須從“寫代碼”進化到“寫工程”。它遲遲不發,
但有一點已經確定:2026年 ,用戶和開發者真正離不開的那個模型 ,
創業公司篇:四小龍分化 ,
但參數不是重點,這是在為Agent經濟鋪路 。騰訊“深潛”
字節跳動:Seedance 2.0 是截至目前這春節檔唯一的“破圈者” 。
這其實是健康的信號。精準解讀,
這不是一場擠牙膏式的常規更新,中國大廠不僅能跟 ,
海量資訊、依法依約處置賬號13421個
,相比於字節的高調,MiniMax、
1M上下文意味著什麽 ?你可以把《三體》全集、賭的是場景和數據;
騰訊深潛上下文學習,
同時上線的Kimi Code已集成VSCode、攻勢不可謂不猛。調試代碼 、入口才是護城河
百度是今年春節最早砸紅包的玩家,嵌入生產線 、百度的O計劃仍是黑盒,SWE-bench 77.8分、用戶將從“數據提供者”轉變為“上下文提供者”。字節是第二個讓矽穀感受到“技術代差焦慮”的中國玩家。DeepSeek V4這頭“房間裏的大象”還在踱步 ,
如果隻選一個模型定義2026年春節,但始終是“純文本學霸” 。
盤點春節檔時最容易漏掉騰訊 ,
當然 ,賭的是AIGC工業化;
智譜All in Agent工程 ,下一步網信部門將對無AI標識的虛假不實信息保持高壓嚴管態勢,北京台春晚首席AI合作夥伴 ,當字節 、
騰訊:沒有新模型 ,但真正讓行業側目的是它的成本:1萬美元理論上可支持4個Agent連續工作一年 。DeepSeek悄無聲息地完成了關鍵迭代,這將是國產開源模型在多模態原生能力上的一次重要卡位。究竟長什麽樣?
大廠篇:字節暫領風騷 ,走了另一條路。DeepSeek V4的編程能力內部測試已超越Claude 。做最便宜的生產級模型。如果落地順利 ,畢竟元寶的紅包大戰看起來隻是“跟牌” ,各有各的“護城河”
如果說大廠的春節檔是“入口+模型”雙線作戰,
MiniMax :把Agent做成白菜價。
憑什麽?因為Seedance 2.0完成了視頻生成從“玩具”到“工具”的關鍵一躍。2026年 ,當一個行業從“所有人都想造出同一個神”轉向“各造各的神” ,這依然是那家倔強的公司——不做多模態,開篇就是姚順雨團隊的CL-bench基準研究。
Kimi K2.5趕在2月初發布,SWE-bench 80.2%,而Qwen3.5一旦以原生VLM(視覺語言模型)形態登場,另一個做出了論文版“抖音” ,重構成本結構的狠角色 。網信中國公眾號發文稱網信部門督促網站平台深入排查整治,極有可能是原生視覺語言模型(VLM) ,或者一個中大型公司的完整代碼倉庫一次性喂給它 。
據爆料 ,
2月7日 ,AI戰場早已硝煙彌漫 。把百度APP做成AI時代的超級入口。
Qwen3.5還未正式亮相,實則是國產大模型陣營一次史無前例的“集體亮劍”。這其實透露出百度現階段的核心邏輯,
沒有哪一家是“全麵領先”,
10B激活參數 ,那一定是字節的Seedance 2.0。要麽是在攻克更難的關卡 ,當別人還在卷榜單分數時 ,他們不再和同行比誰更會聊天 ,一位從業者看完AI生成的15秒短片後說“《流浪地球3》的預算可能要砍了” ,
字節押注視頻生成 ,
智譜賭的是,這正是技術跨越鴻溝的時刻。把文本推理和長代碼理解死磕到極致。這是目前國內把“視覺理解→編程執行”鏈路跑得最順的產品 。
不是因為它的技術參數最漂亮 ,卻在用戶端“被更新”了。意味著阿裏決心把視覺理解直接塞進基座 ,
這是MiniMax一貫的風格,每一家都在賭 :未來兩年 ,賭的是Agent規模化落地;
Kimi走通多模態原生+端側 ,要麽是在等一個“壓軸登場”的時機。一個清晰的圖景浮現出來 :大模型行業已經告別“大一統”的幻想 。
這未必是錯。
2月12日 ,
這是阿裏一次明確的戰略轉向。把價格打到幾分之一,隨後發生的事情超出了所有人的預期 :《黑神話》製作人馮驥稱其為“地表最強視頻生成模型 ,是春節檔的“早鳥”。從來不是靠幾輪對話完成的 。賭的是複雜推理的不可替代性;
阿裏即將亮劍原生VLM,我投給那些讓對手感到脊背發涼的玩家 。清理違法違規信息54.3萬餘條 。創始人閆俊傑的邏輯很清晰 ,但長上下文已封頂 。Cursor,讓AI照著寫代碼 。我的答案是 :我pick字節Seedance 2.0 。更是對Agent場景的戰略預判 :真正的複雜任務 ,已提交商店審核 。百度織網 ,它不僅支持圖文音視四模態輸入、
這一票 ,發現即處置 ,
但懂行的人盯著另一件事:AI大拿姚順雨加入騰訊後首次帶隊發布研究成果。
2月12日 ,DeepSeek的回複風格變了:上下文窗口從128K飆升至1M ,一位開發者用它做出了橫版解謎遊戲 ,
字節這一仗打出了兩個結論:第一,沒有發布會 ,不做最聰明的模型 ,O計劃究竟是在訓練新模型、知識庫更新至2025年5月 。但每一家都在自己的賽道上跑到了極致。且計劃開源2B密集版和35B-A3B的MoE版 。還能超;第二,
整個春節檔,從GLM-5開始,M2.5把推理速度做到主流模型2倍,沒有媒體通稿 ,如果你問我,阿裏Qwen3.5箭在弦上,
阿裏 :Qwen3.5發布在即,騰訊的上下文學習革命才剛剛寫在紙上。
從臘月二十開始 ,上線僅兩天 ,更可怕的是它對物理世界的“理解” ,
2026年馬年春節,字節隻是在飛書文檔裏輕描淡寫扔下一句“Kill the game” 。此前千問係列雖然強大 ,全球開源第一 、平均解決率隻有17.2%——這些頂級的做題家,大規模搜索場景下,按需組成團隊並行工作 。
2月9日,狂歡背後也有隱憂。也不是因為它引發的股票漲停潮最猛烈。即夢就緊急限製真人圖生視頻——當造假成本趨近於零 ,這一次要做“看得懂世界”的基座。
DeepSeek:V4還在憋 ,一旦CL-bench成為行業共識的評估基準,
這意味著什麽 ?姚順雨給出了一個極具野心的願景:未來競爭的焦點不是誰能把模型訓練得更好,
這或許解釋了為什麽騰訊春節沒有搶發基座模型——他們在押注一條更長的賽道:定義大模型下一階段的核心能力標準。把多模態玩出花。監管的達摩克利斯之劍隨時可能落下。阿裏磨刀,智譜那樣扔出重磅模型。是“係統架構師”。5億 、效率碾壓單Agent。
近期,除夕的煙花尚未綻放,留在場上的隻能是那些能真正卷入工作流、百度O計劃秘而不宣 ,
來源:TechWeb
2月14日消息 ,它能自動生成繞到建築背麵的運鏡 ,多鏡頭連貫生成 ,百度“O計劃”的代號在圈內流傳,騰訊則請來姚順雨這位“關鍵先生”在技術博客裏埋下伏筆。
網友們發現 ,你上傳一張建築正麵照 ,也就是不急於發一個新模型秀肌肉 ,
2月3日 ,卻可能是最深遠的布局。騰訊就握住了下一代模型迭代的方向盤。還是醞釀Agent應用?懸念可能要留到節後了。其實根本不會利用上下文 。單純靠“會聊天”已經拿不到牌桌入場券了。阿裏30億免單的混戰 ,智譜、視頻生成不是Sora的專利 ,騰訊都在為“入口”瘋狂撒錢時,而是守住2億月活的文心助手,百度顯得異常安靜。賭的是開發者的手邊工具;
DeepSeek固守長文本高地 ,表麵上是百度5億、百度手裏本就攥著一個國民級入口 。並沒有像字節、交付可部署產品。賭的是下一階段的定義權。賭的是多模態基座的開源生態;
百度織網入口 ,MiniMax已經在算“Agent小時單價”。開發者從中扒出關鍵信息:全新混合注意力機製 ,超越Claude Opus 4.6。744B參數、盡在新浪財經APP
責任編輯:楊賜
那麽創業公司的牌桌上隻剩下純粹的模型硬仗 。騰訊混元技術博客上線,GLM-5能自主拆解需求 、
當然 ,沒有之一”;影視颶風Tim連說六次“恐怖”;二級市場影視傳媒板塊掀漲停潮;海外X平台上,而是一場關於“大模型下半場往哪走”的路線對壘。賭的是程序員生產力重構;
MiniMax死磕推理成本,嚴厲打擊違規行為。而是誰能為任務提供最豐富 、而是比誰能真正替代初級工程師。結論非常“狠”:全球前十的語言模型在“從上下文中學習新知識”這項能力上,DeepSeek沒有任何官方發布 ,外國網友四處求中國手機號體驗Seedance 2.0。Kimi扔出王炸 ,重構搜索體驗 ,這不僅是技術領先 ,是成本 。開發者可以直接丟進一張UI設計圖 ,字節、騰訊元寶10億紅包 、且與現實幾乎一致 。阿裏、國產芯片全適配 。這隻是春節檔的開幕戰 。不追風口 ,
最後,而是因為它讓圈外人又一次真正感知到了AI的衝擊 。
2026年 , 顶: 19944踩: 25989
评论专区