欧美黄片二区亚州伦伦在线|深夜福利亚洲一区|超碰人人模人人爽最新地址|大量精品视频在线|百深爱五月激情婷婷|www.欧美…黄…|国产毛片无码视频|强奸在线观看视频网站|亚洲欧美精选另类|日韩一区二区三区黄色片

自主選拔在線

登錄 | 注冊

DeepSeek V3.2 正式版:強化 Agent 能力,融入思考推理

2025-12-02 10:08|編輯: 小李老師|閱讀: 44

摘要

2025年12月1日,DeepSeek V3.2 正式版發(fā)布,強化 Agent 能力,融入思考推理!自主選拔在線特整理相關(guān)內(nèi)容,一起來共同學(xué)習(xí)。

12月1日,深度求索團隊正式發(fā)布 DeepSeek-V3.2。本次升級包含以下主要變化:

DeepSeek V3.2 正式版:強化 Agent 能力,融入思考推理

  兩個月前,深度求索團隊發(fā)布了實驗性的 DeepSeek-V3.2-Exp,并收到了眾多熱心用戶反饋的對比測試結(jié)果。目前未發(fā)現(xiàn) V3.2-Exp 在任何特定場景中顯著差于 V3.1-Terminus,這驗證了 DSA 稀疏注意力機制的有效性。也感謝廣大用戶一直以來的積極反饋與支持,為我們的持續(xù)創(chuàng)新注入了更多信心與動力。

  12月1日,深度求索團隊同時發(fā)布兩個正式版模型:

  DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

  官方網(wǎng)頁端、App 和 API 均已更新為正式版 DeepSeek-V3.2,歡迎使用。Speciale 版本目前僅以臨時 API 服務(wù)形式開放,以供社區(qū)評測與研究。

  新模型技術(shù)報告已同步發(fā)布:

  https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf(復(fù)制鏈接至瀏覽器)

DeepSeek V3.2 正式版:強化 Agent 能力,融入思考推理

  推理能力全球領(lǐng)先

  • DeepSeek-V3.2 的目標(biāo)是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用 Agent 任務(wù)場景。在公開的推理類 Benchmark 測試中,DeepSeek-V3.2 達到了 GPT-5 的水平,僅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。
  • DeepSeek-V3.2-Speciale 的目標(biāo)是將開源模型的推理能力推向極致,探索模型能力的邊界。V3.2-Speciale 是 DeepSeek-V3.2 的長思考增強版,同時結(jié)合了 DeepSeek-Math-V2 的定理證明能力。該模型具備出色的指令跟隨、嚴謹?shù)臄?shù)學(xué)證明與邏輯驗證能力,在主流推理基準(zhǔn)測試上的性能表現(xiàn)媲美 Gemini-3.0-Pro(見表1)。更令人矚目的是,V3.2-Speciale 模型成功斬獲 IMO 2025(國際數(shù)學(xué)奧林匹克)、CMO 2025(中國數(shù)學(xué)奧林匹克)、ICPC World Finals 2025(國際大學(xué)生程序設(shè)計競賽全球總決賽)及 IOI 2025(國際信息學(xué)奧林匹克)金牌。其中,ICPC 與 IOI 成績分別達到了人類選手第二名與第十名的水平。

  Tips:在高度復(fù)雜任務(wù)上,Speciale 模型大幅優(yōu)于標(biāo)準(zhǔn)版本,但消耗的 Tokens 也顯著更多,成本更高。目前,DeepSeek-V3.2-Speciale 僅供研究使用,不支持工具調(diào)用,暫未針對日常對話與寫作任務(wù)進行專項優(yōu)化。

表1:DeepSeek-V3.2 與其他模型在各類數(shù)學(xué)、代碼與通用領(lǐng)域評測集上的得分(括號內(nèi)為消耗 Tokens 總量約數(shù))

  思考融入工具調(diào)用

  • 不同于過往版本在思考模式下無法調(diào)用工具的局限,DeepSeek-V3.2 是我們推出的首個將思考融入工具使用的模型,并且同時支持思考模式與非思考模式的工具調(diào)用。我們提出了一種大規(guī)模 Agent 訓(xùn)練數(shù)據(jù)合成方法,構(gòu)造了大量「難解答,易驗證」的強化學(xué)習(xí)任務(wù)(1800+ 環(huán)境,85,000+ 復(fù)雜指令),大幅提高了模型的泛化能力。

表2:DeepSeek-V3.2 與其他模型在各類智能體工具調(diào)用評測集上的得分

  • 如表 2 所示,DeepSeek-V3.2 模型在智能體評測中達到了當(dāng)前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。值得說明的是,V3.2 并沒有針對這些測試集的工具進行特殊訓(xùn)練,所以我們相信,V3.2 在真實應(yīng)用場景中能夠展現(xiàn)出較強的泛化性。

  開源

  • DeepSeek-V3.2

  HuggingFace:

  https://huggingface.co/deepseek-ai/DeepSeek-V3.2

  ModelScope:

  https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

  • DeepSeek-V3.2-Speciale

  HuggingFace:

  https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

  ModelScope:

  https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

  網(wǎng)頁端、APP 與 API 更新

  DeepSeek-V3.2 是我們當(dāng)前正式提供服務(wù)的模型,官網(wǎng)網(wǎng)頁、APP、API 模型均已由 DeepSeek-V3.2-Exp 升級為正式版 DeepSeek-V3.2,使用方式不變。

  同時,為了方便社區(qū)評測與研究,我們非正式部署了 DeepSeek-V3.2-Speciale 的 API 服務(wù),API 用戶可以通過設(shè)置

  base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

  訪問該模型。該模型 API 價格不變,只支持思考模式下的對話功能,不支持工具調(diào)用等功能,最大輸出長度默認為 128K,支持時間截止至北京時間 2025-12-15 23:59。

  思考模式下的工具調(diào)用

  本次 API 更新支持了 DeepSeek-V3.2 思考模式下的工具調(diào)用能力。當(dāng)前在思考模式下,模型能夠經(jīng)過多輪的思考 + 工具調(diào)用,最終給出更詳盡準(zhǔn)確的回答。下圖為思考模式下進行工具調(diào)用的 API 請求示意圖:

 

  • 在回答問題 1 過程中(請求 1.1 - 1.3),模型進行了多次思考 + 工具調(diào)用后給出答案。在這個過程中,用戶需回傳思維鏈內(nèi)容(reasoning_content)給 API,以讓模型繼續(xù)思考。
  • 在下一個用戶問題開始時(請求 2.1),需刪除之前的思維鏈,并保留其它內(nèi)容發(fā)送給 API。
  • 更詳細的使用方法請參考 API 文檔:

  https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

  DeepSeek-V3.2 的思考模式也增加了對 Claude Code 的支持,用戶可以通過將模型名改為 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 鍵開啟思考模式進行使用。但需要注意的是,思考模式未充分適配 Cline、RooCode 等使用非標(biāo)準(zhǔn)工具調(diào)用的組件,我們建議用戶在使用此類組件時繼續(xù)使用非思考模式。

聲明:本文信息來源于deepseek官微,由自主選拔在線團隊(微信公眾號:zizzsw)排版編輯,如有侵權(quán),請及時聯(lián)系管理員刪除。

0

收藏

分享到:

微信掃一掃分享

QR Code

微信里點“發(fā)現(xiàn)”

掃一下二維碼便可將本文分享至朋友圈

報錯
DeepSeekDeepSeek-V3.2 模型

DeepSeek銳評北京東、西海、朝四區(qū)第一梯隊高中院校!2025-02-07

一起來看看!DeepSeek銳評大學(xué)專業(yè)!2025-02-08

DeepSeek版中國高校top100,復(fù)旦勇闖前3!2025-02-08

DeepSeek評選出“北京家長最想讓孩子上的15所大學(xué)”2025-02-08

普通家庭年收入30萬左右,給孩子最好的托舉是什么?DeepSeek的回答令人茅塞頓開!2025-02-09

沒有更多了

友情鏈接: