AI快訊蘇曉 2025-11-12 14:52:34 來(lái)源:中房網(wǎng)
??中房網(wǎng)訊 據(jù)“月之暗面Kimi”官微11月6日消息,月之暗面宣布發(fā)布Kimi K2 Thinking開(kāi)源思考模型,并稱(chēng)其為“Kimi 迄今能力最強(qiáng)的開(kāi)源思考模型”。
??據(jù)悉,該模型基于「模型即 Agent」理念訓(xùn)練的新一代 Thinking Agent,它原生掌握「邊思考,邊使用工具」的能力。在人類(lèi)最后的考試(Humanity's Last Exam)、自主網(wǎng)絡(luò)瀏覽能力(BrowseComp)、復(fù)雜信息收集推理(SEAL-0)等多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到 SOTA 水平。
??Kimi K2 Thinking 模型無(wú)需人類(lèi)干預(yù),即可憑借持續(xù)穩(wěn)定的深度思考能力自主實(shí)現(xiàn)高達(dá) 300 步的工具調(diào)用,從而幫助用戶解決更復(fù)雜的問(wèn)題。
??月之暗面Kimi指出,該模型推理性能全面提升。Kimi K2 Thinking 模型在人類(lèi)最后的考試(Humanity's Last Exam)中展現(xiàn)出強(qiáng)大的推理與問(wèn)題解決能力。人類(lèi)最后的考試是一項(xiàng)涵蓋 100 多個(gè)專(zhuān)業(yè)領(lǐng)域的終極封閉式學(xué)術(shù)測(cè)試。在允許使用工具——搜索、Python、網(wǎng)絡(luò)瀏覽工具的同等情況下,Kimi K2 Thinking 在這項(xiàng)基準(zhǔn)評(píng)測(cè)中取得了 44.9% 的 SOTA 成績(jī)。
??自主搜索與瀏覽能力全面提升。在復(fù)雜搜索和瀏覽場(chǎng)景中,Kimi K2 Thinking 模型也表現(xiàn)出色。BrowseComp 是由 OpenAI 發(fā)布的一個(gè)專(zhuān)門(mén)評(píng)估 AI Agent 網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試,這項(xiàng)測(cè)試的初衷是衡量 AI Agent 在信息過(guò)載環(huán)境中展現(xiàn)出的堅(jiān)持性與創(chuàng)造力,即能否像人類(lèi)研究員一樣「刨根問(wèn)底」。在這項(xiàng)極具挑戰(zhàn)的任務(wù)上,人類(lèi)平均只能達(dá)到 29.2% 的成績(jī)。Kimi K2 Thinking 在這項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出極強(qiáng)的鉆研能力,以 60.2% 的成績(jī)成為新的 SOTA 模型。
??Agentic 編程能力持續(xù)精進(jìn)。Kimi K2 Thinking 模型的編碼能力也得到了增強(qiáng),在多語(yǔ)言軟件工程基準(zhǔn) SWE-Multilingual、SWE-bench 驗(yàn)證集和 Terminal 終端使用等基準(zhǔn)測(cè)試中的表現(xiàn)有了進(jìn)一步提升。Kimi K2 Thinking 在處理 HTML、React 以及組件豐富的前端任務(wù)時(shí)性能有明顯提升,能將創(chuàng)意轉(zhuǎn)變?yōu)楣δ荦R全、響應(yīng)式的產(chǎn)品。在 Agentic Coding 場(chǎng)景中,Kimi K2 Thinking 能在調(diào)用各種工具的同時(shí)進(jìn)行思考,靈活地融入 software agents 中,處理更復(fù)雜、多步驟的開(kāi)發(fā)工作流。
??此外,通用基礎(chǔ)能力升級(jí)。Kimi K2 Thinking 顯著提升了寫(xiě)作能力,它能將粗略的靈感轉(zhuǎn)化為清晰、動(dòng)人且意圖明確的敘述,使其兼具韻律感和深度。它能輕松駕馭微妙的文風(fēng)差異和模糊的結(jié)構(gòu),并在長(zhǎng)篇大論中保持風(fēng)格的連貫性。在創(chuàng)意寫(xiě)作方面,它筆下的意象更生動(dòng),情感共鳴更強(qiáng)烈,將精準(zhǔn)的表達(dá)與豐富的表現(xiàn)力融為一體。在學(xué)術(shù)研究和專(zhuān)業(yè)領(lǐng)域,Kimi K2 Thinking 在分析深度、信息準(zhǔn)確性和邏輯結(jié)構(gòu)方面均有顯著提升。它能有條不紊地剖析復(fù)雜的指令,并以清晰嚴(yán)謹(jǐn)?shù)姆绞酵卣顾悸贰_@使其尤其擅長(zhǎng)處理學(xué)術(shù)論文、技術(shù)摘要,以及那些對(duì)信息完整性和推理質(zhì)量要求極高的長(zhǎng)篇報(bào)告。在回應(yīng)個(gè)人或情感類(lèi)問(wèn)題時(shí),Kimi K2 Thinking 的回答更富同理心,立場(chǎng)也更中正平和。它的思考深入周到且具體明確,能提供細(xì)致入微的觀點(diǎn)和切實(shí)可行的后續(xù)建議。它能清晰并關(guān)切地幫助用戶梳理復(fù)雜的決策,其語(yǔ)氣既腳踏實(shí)地又切實(shí)中肯,更有人情味。
??目前,Kimi K2 Thinking 模型已上線 kimi.com 和最新版 Kimi 手機(jī)應(yīng)用的常規(guī)對(duì)話模式。Kimi Agent 模式的底層模型后續(xù)也將升級(jí)為 Kimi K2 Thinking 模型,帶來(lái)完整的多步思考和工具調(diào)用能力。
- 11:09
- 10:34
年末價(jià)格戰(zhàn)提前打響 長(zhǎng)沙開(kāi)發(fā)商借勢(shì)促銷(xiāo)保回款
- 10:14
- 09:27
- 09:13
- 09:11
- 08:35
- 08:32
- 08:29
- 報(bào)告|10月全國(guó)大中城市租金均價(jià)繼續(xù)下降
- 多家房企高層密集變動(dòng)
- 報(bào)告|10月房?jī)r(jià)繼續(xù)調(diào)整,一線城市承壓
- 報(bào)告|百?gòu)?qiáng)房企10月業(yè)績(jī)環(huán)比微增,投資呈現(xiàn)筑底反彈態(tài)勢(shì)
- 倪虹:推動(dòng)房地產(chǎn)高質(zhì)量發(fā)展,全面落實(shí)六方面重點(diǎn)任務(wù)
- “十五五”規(guī)劃公布,房地產(chǎn)重點(diǎn)部署多項(xiàng)工作
- “十五五”時(shí)期,房地產(chǎn)高質(zhì)量發(fā)展目標(biāo)明確
- 2025年九月房地產(chǎn)大事件盤(pán)點(diǎn)
中國(guó)城市住房?jī)r(jià)格288指數(shù)
(2023-02)1571.9點(diǎn)
- 0.13%

- -0.91%

| 日期 | 指數(shù) | 環(huán)比 | 同比 |
|---|---|---|---|
| 2023.01 | 1569.9 | -0.97% | -0.14% |
| 2022.12 | 1572.1 | -0.92% | -0.11% |
| 2022.11 | 1573.9 | -0.12% | -1.08% |
| 2022.10 | 1575.8 | -0.20% | -1.01% |
| 2022.09 | 1579.0 | -0.02% | -0.87% |
| 2022.08 | 1579.3 | -0.04% | -0.62% |