久久久久久影院|深夜高潮喷水视频|久久五级视频|5566无码网址

Kimi K2拿到了世界第一,也殺死了過去的自己
來源:新財富作者:新財富產(chǎn)業(yè)研究院2025-07-28 16:07

7月12日深夜,月之暗面更新了最新的大模型——Kimi K2,并將模型權(quán)重和代碼全部開源。

海內(nèi)外AI圈瞬間炸鍋。在大模型競技場LMArena排行榜中,Kimi K2綜合排名斬獲全球第五,在開源大模型中位居全球第一,超越Claude 4、DeepSeek-R1-0528。海外AI圈大佬紛紛點贊,Perplexity CEO次日即宣布將基于K2開啟后訓(xùn)練。

我們原本認(rèn)為,K2的發(fā)布只不過意味著月之暗面趕上了節(jié)奏,獲得了“短暫的呼吸權(quán)”。

但當(dāng)深入閱讀技術(shù)文檔后我們卻發(fā)現(xiàn),K2對于月之暗面以及行業(yè)的意義,遠(yuǎn)比短暫的第一要更加重大。

01

Kimi為何“遲到”?

月之暗面曾憑借獨樹一幟的長上下文技術(shù)和天才創(chuàng)始人背景,成為中國“AI六小虎”中最典型的代表。然而從今年1月份,Kimi的聲量卻逐漸式微,模型及產(chǎn)品的口碑開始出現(xiàn)下滑。

要理解Kimi K2的轉(zhuǎn)向,我們必須先理解一個問題:為何Kimi陷入長達(dá)數(shù)月的沉寂。

楊植麟以及月之暗面,在過去一直都是Scaling Law的忠實信徒。

他們堅信,更大的模型、更多的數(shù)據(jù),必然會涌現(xiàn)出更強(qiáng)的智能。通過卓越的產(chǎn)品體驗吸引用戶,利用用戶數(shù)據(jù)反哺模型訓(xùn)練,從而形成“用戶數(shù)據(jù)”與“模型性能”的增長飛輪。

因此月之暗面自創(chuàng)立之初起,就一直采取激進(jìn)的“買量”策略,以期獲得更多用戶數(shù)據(jù)來驅(qū)動飛輪旋轉(zhuǎn)。2024年11月,楊植麟在接受采訪時表示,Kimi當(dāng)前最核心的任務(wù)仍然是提升用戶留存。

這個戰(zhàn)略聽起來很完美,但它建立在一個脆弱的前提之上——高質(zhì)量的互聯(lián)網(wǎng)數(shù)據(jù)是取之不盡的。

然而2024年底AI技術(shù)圈的風(fēng)向徹底改變。前OpenAI科學(xué)家Ilya在演講中,預(yù)告了一個殘酷的現(xiàn)實:全球范圍內(nèi),可用于高質(zhì)量預(yù)訓(xùn)練的公開數(shù)據(jù),已經(jīng)被消耗殆盡。

這與月之暗面一直堅持的Scaling信仰產(chǎn)生了巨大的矛盾。

之后的故事我們已經(jīng)很熟悉了。

深度求索搶先布局,依靠DeepSeek R1開辟了一種新的技術(shù)范式:依靠后訓(xùn)練強(qiáng)化學(xué)習(xí),讓大模型從“模仿學(xué)習(xí)”轉(zhuǎn)向更本質(zhì)的“目標(biāo)導(dǎo)向?qū)W習(xí)”來突破智能上限,是這個版本實現(xiàn)AGI的新路徑。

盡管月之暗面也意識到強(qiáng)化學(xué)習(xí)的重要性,但在Kimi 1.5的訓(xùn)練中,強(qiáng)化學(xué)習(xí)僅僅只是一個解決長文本 “上下文衰減問題”的輔助環(huán)節(jié),而并非如R1那樣聚焦 “提升推理能力”,幫助模型突破智能上限。

根據(jù)AppGrowing測算,2024年Kimi一年花掉的營銷預(yù)算接近9億人民幣,月活流量數(shù)據(jù)峰值為10月的 3600 萬。而一分廣告費沒花的DeepSeek,單單依靠產(chǎn)品實力和用戶口碑,月活一個月就暴漲至6181 萬。

DeepSeek R1的出現(xiàn)直接引發(fā)了AI創(chuàng)業(yè)公司的存在主義危機(jī)。

月之暗面的用戶增長策略開始備受質(zhì)疑。這種巨大的壓力當(dāng)然不僅僅只有月之暗面一家公司需要面對,R1給行業(yè)帶來挑戰(zhàn)是一視同仁的。

當(dāng)舊地圖已經(jīng)無法通向羅馬,月之暗面必須找到一條全新的航線。

02

Kimi K2 趟出的一條新航線

Kimi K2 的“新”首先是在模型架構(gòu)、算法上的全面革新,更深層次則是月之暗面公司戰(zhàn)略甚至文化的重新出發(fā)。

在大模型層面,K2取得了兩個突破性進(jìn)展:

(1)將模型參數(shù)量擴(kuò)展到了超大的1T量級

(2)K2原生具有調(diào)用各種工具的能力,提出了“模型即Agent”的新概念

這兩個技術(shù)創(chuàng)新說起來容易,但真正實現(xiàn)卻十分困難,否則Kimi也不會消耗了大半年的時間才將K2端上來。

Kimi是怎么做到的呢?

首先,為了實現(xiàn)K2 1T的參數(shù)量規(guī)模,Kimi果斷放棄了此前自研的模型架構(gòu),轉(zhuǎn)而積極擁抱DeepSeek V3。根據(jù)Kimi團(tuán)隊的觀點,V3是一個被市場驗證過的、兼具性能和效率的選擇。

于是,很多人抨擊K2就是DeepSeek V3的套殼,這顯然又是一種淺薄的傲慢。

根據(jù)第一性原則,不拘泥于固有思維,只關(guān)注方案是否有效、可用,這恰恰反映了Kimi團(tuán)隊的進(jìn)步。

合適的架構(gòu)選擇只是第一步,K2與V3在具體參數(shù)上的差別非常大。

根據(jù)團(tuán)隊此前對Scaling的研究,為了在算力并不充裕的情況下突破智能上限,Kimi選擇減少DeepSeek V3 MoE結(jié)構(gòu)中的Attention Heads(注意力頭)數(shù)量,將節(jié)省下來的參數(shù)空間全部用于增加專家的數(shù)量(Experts)。

就理論而言,更多的專家數(shù)意味著模型擁有更龐大的知識,以及更強(qiáng)的處理復(fù)雜問題的潛力。

然而,參數(shù)的輕微改動卻產(chǎn)生了巨大的麻煩。Kimi發(fā)現(xiàn),此前內(nèi)部已經(jīng)驗證過的自研Muon優(yōu)化器,在龐大的數(shù)據(jù)集的預(yù)訓(xùn)練過程表現(xiàn)極不穩(wěn)定,會頻繁崩潰。

這困擾了Kimi團(tuán)隊很長的時間,沒有公開的解決方案能應(yīng)用于穩(wěn)定15T量級的預(yù)訓(xùn)練數(shù)據(jù)集。

經(jīng)過長期的嘗試,Kimi巧妙的將Muon與QK-Clip的組合,提出了一種新的MuonClip優(yōu)化器。MuonClip優(yōu)化器能很好地保持在預(yù)訓(xùn)練的穩(wěn)定性,最終保證了模型在15.5T tokens的巨量預(yù)訓(xùn)練中,實現(xiàn)了零崩潰的穩(wěn)定表現(xiàn)。它的Loss曲線是這樣的,海外AI圈大佬稱其為“完美的Loss曲線”。

K2的第二個壯舉,是提出來一條通往原生Agentic Intelligence(智能體人工智能)的新思路。

眾所周知,繼推理大模型普及之后,Agent 在今年正式成為 AI 新的發(fā)展方向。

AI Agent與對話類大模型最大的區(qū)別,就是AI Agent 能做到主動感知環(huán)境、影響環(huán)境,具備使用工具的能力。今年我們見證了MCP概念的火熱與普及,Cursor等 AI 編程產(chǎn)品開始大規(guī)模普及,OpenAI及國內(nèi)廠商先后也發(fā)布了不少通用Agent產(chǎn)品。

在此前的認(rèn)知中,大模型的使用工具的能力,大多需要通過復(fù)雜的提示工程(Prompt Engineering)或在預(yù)訓(xùn)練后進(jìn)行強(qiáng)化學(xué)習(xí)(RLHF)來“后補(bǔ)”。

但Kimi K2 卻提出了訓(xùn)練Agent的第三條路徑。

在模型訓(xùn)練之前,Kimi團(tuán)隊依靠AI生成了成百上千個模擬場景,例如點外賣、寫代碼、看視頻等,來模擬用戶的各種行為,并據(jù)此合成了覆蓋了數(shù)百個垂直領(lǐng)域的工具調(diào)用軌跡,其中既包括真實的MCP(模型上下文協(xié)議)工具,也包括合成工具。

通俗點說,這就相當(dāng)于直接將無數(shù)用戶未來可能使用Agent的所有場景,提前打包成了全新的、高質(zhì)量的語料。最后再通過LLM從結(jié)果去評估每條模擬結(jié)果成功與否,以此篩選出高質(zhì)量的訓(xùn)練數(shù)據(jù)。

基于此流程,月之暗面搭建出了一個完全自動化的Agent數(shù)據(jù)生產(chǎn)工廠!

正如Kimi團(tuán)隊研究員Flood Sung所言,這個生成無數(shù)個工作流的機(jī)制,十分契合老子的思想:一生二,二生三,三生萬物。

這就讓Kimi K2在預(yù)訓(xùn)練中,學(xué)到的不僅僅是知識,還包括工具和方法。

最終我們看到,Kimi K2具備了很強(qiáng)的原生Agent能力。在我們的測試案例中,Kimi K2幾乎零失誤地實現(xiàn)了我們搭建前端網(wǎng)頁、開發(fā)小游戲的需求。

在官方公開的衡量代碼任務(wù)執(zhí)行能力的LiveCodeBench測試中,K2取得了53.7%的驚人成績,遠(yuǎn)超GPT-4.1的44.7%和Claude 3.5 Opus的47.4%。

不少從業(yè)者反饋,當(dāng)K2的API完全接入Claude Code之后,能以更低的成本完美的取代原本Claude 3.5的能力,效果甚至直逼最先進(jìn)的Claude 4.0。

03

尾聲:先改變自己,再改變世界

最后,我們想聊一聊月之暗面公司本身的戰(zhàn)略轉(zhuǎn)型。

人們熟悉的月之暗面,是一家堅持產(chǎn)品、模型雙管齊下,有時候看起來甚至是更偏向產(chǎn)品驅(qū)動的AI公司。

這當(dāng)中自然有面對30億美元融資的無奈。參照過去互聯(lián)網(wǎng)時代行業(yè)“燒錢”換用戶的慣性思維,似乎只有用戶數(shù)量的持續(xù)增長,才能回應(yīng)投資人的期待。

互聯(lián)網(wǎng)可以通過平臺免費+廣告變現(xiàn)的方式,將流量無痛轉(zhuǎn)化為收入,但AI與廣告在內(nèi)核上就水火不容:前者強(qiáng)調(diào)效率提升,后者分散注意力。

真正為AI創(chuàng)業(yè)公司創(chuàng)造價值的是付費用戶,付費用戶只會為效率和結(jié)果買單。C端用戶在乎的,是模型能力是否足夠聰明、通人性;B端用戶關(guān)心的,是AI能否幫企業(yè)賺更多錢。

這也是為什么DeepSeek R1能不花一分營銷預(yù)算就收獲巨量用戶——它足夠滿足需求,這就夠了。

Kimi團(tuán)隊在社交媒體上透露,公司在DeepSeek爆火后,內(nèi)部對此前的決策進(jìn)行了深刻乃至痛苦的反思。自2025年初開始,Kimi完全停掉了所有市場營銷和買量行為。

“只要模型做的好,就會獲得市場認(rèn)可”這是一個Kimi研究員從DeepSeek成功歸納出的結(jié)論。在反思會上,楊植麟果斷決定不再更新 K1 系列模型,集中資源搞基礎(chǔ)算法和 K2,將全部資源和能力重新聚焦到大模型性能的提升上來。

截至發(fā)稿日,Kimi開源第一的位置似乎已被阿里Qwen再次反超。但這些都不重要,從Kimi K2身上我們能夠看到月之暗面正在改變自己:放棄自研的架構(gòu)去擁抱更優(yōu)秀的架構(gòu);暫停買量,回歸技術(shù)研究,用實力說話;加入開源陣營,分享探索出的新技術(shù)路徑……

無論是架構(gòu)還是戰(zhàn)略上,我們可以肯定地說,是DeepSeek喚醒了Kimi。

但我們更希望這是一個青出于藍(lán)而勝于藍(lán)的故事。

責(zé)任編輯: 孫孝熙
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機(jī)會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達(dá)個人看法,并不表明證券時報立場
暫無評論
為你推薦
新財富雜志

《新財富》雜志于2001年3月創(chuàng)刊,專注資本市場深耕細(xì)作,“最佳分析師”“最佳董秘”“500創(chuàng)富榜”“最佳上市公司”“最佳投行”等權(quán)威專業(yè)評選和《德隆系》《明天帝國》《收割者》等經(jīng)典研究案例影響深遠(yuǎn)。

新財富雜志社旗下主要新媒體平臺包括:新財富雜志微博、新財富雜志公眾號、新財富雜志視頻號。

地址:深圳市福田區(qū)彩田路7006號深科技城A座43層

媒體合作與新聞職業(yè)操守舉報
郵箱:xcf@stcn.com
微信:xincaifuzazhi
時報熱榜
換一換
    熱點視頻
    換一換