欧美黄片二区亚州伦伦在线|深夜福利亚洲一区|超碰人人模人人爽最新地址|大量精品视频在线|百深爱五月激情婷婷|www.欧美…黄…|国产毛片无码视频|强奸在线观看视频网站|亚洲欧美精选另类|日韩一区二区三区黄色片

自主選拔在線

登錄 | 注冊

2025年8月21日DeepSeek-V3.1 正式發(fā)布

2025-08-21 14:39|編輯: 小李老師|閱讀: 546

摘要

8月21日,DeepSeek-V3.1正式發(fā)布,邁向 Agent 時代的第一步!自主選拔在線特整理相關(guān)內(nèi)容,一起來共同學(xué)習(xí)。

今天,深度求索團(tuán)隊正式發(fā)布 DeepSeek-V3.1。本次升級包含以下主要變化:

DeepSeek-V3.1 發(fā)布,邁向 Agent 時代的第一步

  混合推理架構(gòu):一個模型同時支持思考模式與非思考模式;

  更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時間內(nèi)給出答案;

  更強(qiáng)的 Agent 能力:通過 Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。

  官方 App 與網(wǎng)頁端模型已同步升級為 DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實現(xiàn)思考模式與非思考模式的自由切換。

  DeepSeek API 也已同步升級,deepseek-chat 對應(yīng)非思考模式,deepseek-reasoner 對應(yīng)思考模式,且上下文均已擴(kuò)展為 128K。同時,API Beta 接口支持了 strict 模式的 Function Calling,以確保輸出的 Function 滿足 schema 定義。(詳見官方文檔:https://api-docs.deepseek.com/zh-cn/guides/function_calling)

  另外,增加了對 Anthropic API 格式的支持,讓大家可以輕松將 DeepSeek-V3.1 的能力接入 Claude Code 框架。(詳見官方文檔:https://api-docs.deepseek.com/zh-cn/guides/anthropic_api)

  工具調(diào)用/智能體支持增強(qiáng)

  編程智能體

DeepSeek-V3.1

表 1:編程智能體測評(SWE 使用內(nèi)部框架測評,相比開源框架 OpenHands 所需輪數(shù)更少;Terminal Bench 使用官方 Terminus 1 framework)

  在代碼修復(fù)測評 SWE 與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。

  搜索智能體

DeepSeek-V3.1 發(fā)布

表 2:搜索智能體測評(測試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁過濾+128K context window;R1-0528 使用內(nèi)部 workflow 模式測試;HLE 測試同時使用 python 與 search 工具)

  DeepSeek-V3.1 在多項搜索評測指標(biāo)上取得了較大提升。在需要多步推理的復(fù)雜搜索測試(browsecomp)與多學(xué)科專家級難題測試(HLE)上,DeepSeek-V3.1 性能已大幅領(lǐng)先 R1-0528。

  思考效率提升

  我們的測試結(jié)果顯示,經(jīng)過思維鏈壓縮訓(xùn)練后,V3.1-Think 在輸出 token 數(shù)減少 20%-50% 的情況下,各項任務(wù)的平均表現(xiàn)與 R1-0528 持平。

DeepSeek-V3.1 發(fā)布

在各項評測指標(biāo)得分基本持平的情況下(AIME 2015: 87.5/88.4, GPQA: 81/80.1, liveCodeBench: 73.3/74.8),R1-0528 與 V3.1-Think 的 token 消耗量對比圖

  同時,V3.1 在非思考模式下的輸出長度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能夠在輸出長度明顯減少的情況下保持相同的模型性能。

  API & 模型開源

  模型開源

  V3.1的Base模型在V3的基礎(chǔ)上重新做了外擴(kuò)訓(xùn)練,一共增加訓(xùn)練了 840B tokens。Base 模型與后訓(xùn)練模型均已在 Huggingface 與魔搭開源。

  Base 模型:

  Hugging Face:

  https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

  魔搭:

  https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

  后訓(xùn)練模型:

  Hugging Face:

  https://huggingface.co/deepseek-ai/DeepSeek-V3.1

  魔搭:

  https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

  需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。另外,V3.1 對分詞器及 chat template 進(jìn)行了較大調(diào)整,與 DeepSeek-V3 存在明顯差異。建議有部署需求的用戶仔細(xì)閱讀新版說明文檔。

  價格調(diào)整

  將于北京時間 2025 年 9 月 6 日凌晨起,對 DeepSeek 開放平臺 API 接口調(diào)用價格進(jìn)行如下調(diào)整:

  執(zhí)行新版價格表(如下圖所示,詳見定價頁面);

  取消夜間時段優(yōu)惠。

  在 9 月 6 日前,所有 API 服務(wù)仍按原價格政策計費,您可繼續(xù)享受當(dāng)前優(yōu)惠。

  同時,為更好地滿足用戶的調(diào)用需求,我們已進(jìn)一步擴(kuò)容 API 服務(wù)資源,歡迎使用!

聲明:本文信息來源于deepseek官微,由自主選拔在線團(tuán)隊(微信公眾號:zizzsw)排版編輯,如有侵權(quán),請及時聯(lián)系管理員刪除。

0

收藏

分享到:

微信掃一掃分享

QR Code

微信里點“發(fā)現(xiàn)”

掃一下二維碼便可將本文分享至朋友圈

報錯
DeepSeekDeepSeek-V3.1 模型

高三考生,DeepSeek教你如何使用“首考診斷報告”2025-02-07

DeepSeek銳評北京東、西海、朝四區(qū)第一梯隊高中院校!2025-02-07

一起來看看!DeepSeek銳評大學(xué)專業(yè)!2025-02-08

DeepSeek版中國高校top100,復(fù)旦勇闖前3!2025-02-08

DeepSeek評選出“北京家長最想讓孩子上的15所大學(xué)”2025-02-08

沒有更多了

  • 2023強(qiáng)基計劃筆試真題

  • 2023強(qiáng)基計劃面試真題

  • 2024北京大學(xué)強(qiáng)基轉(zhuǎn)段名單

  • 強(qiáng)基計劃轉(zhuǎn)段

  • 2024上海交大強(qiáng)基轉(zhuǎn)段名單

  • 2024四川大學(xué)強(qiáng)基轉(zhuǎn)段名單

  • 2024強(qiáng)基計劃轉(zhuǎn)段名單

  • 2024年強(qiáng)基計劃

  • 上交大2024強(qiáng)基計劃

  • 競賽生強(qiáng)基計劃優(yōu)勢

  • 強(qiáng)基備考

    強(qiáng)基備考

  • 綜評備考

    綜評備考

  • 選科指導(dǎo)

    選科指導(dǎo)

  • 優(yōu)質(zhì)試題

    優(yōu)質(zhì)試題

  • 熱門資料

    熱門資料

  • 競賽經(jīng)驗

    競賽經(jīng)驗

  • 熱門講座

    熱門講座

  • 升學(xué)規(guī)劃

    升學(xué)規(guī)劃

  • 查分?jǐn)?shù)線

    查分?jǐn)?shù)線

掃碼關(guān)注,回復(fù)關(guān)鍵詞“2026”,領(lǐng)取升學(xué)福利

自主選拔在線

zizzsw 復(fù)制

友情鏈接: