查看: 13760|回复: 0
收起左侧

[IT业界] DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价

[复制链接]
a20584
发表于 2025-9-29 22:59:36 | 显示全部楼层 |阅读模式
IT之家 9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。

e3950354-3be1-41a0-bd1e-3cee410842b8.png

作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(IT之家注:一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

ff526275-9752-4d15-a15c-2dabdb4cb9d7.png

为了严谨地评估引入稀疏注意力带来的影响,官方特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

14f7ac22-75f7-4221-b8a8-2f49b0a386c3.png

目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。

本次更新带来了 API 大幅度降价,开发者调用 DeepSeek API 的成本将降低 50% 以上

3f8651ca-2767-4291-8aa4-23a15a5301f6.png

DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试。为方便用户进行对比测试,官方为 V3.1-Terminus 临时保留了额外的 API 访问接口。

DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源。

来源:https://www.ithome.com/0/886/710.htm

您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2025-12-8 04:39 , Processed in 0.076138 second(s), 4 queries , Redis On.

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表