查看: 1600|回复: 2

DeepSeek-V3.2-Exp发布并开源 [复制链接]

coffee198375

军衔等级：

大元帅

注册：2007-12-10 点赞数

2287

电梯直达

1^# 大中小

发表于 2025-9-30 11:18:14 |只看该作者 |倒序浏览

DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构，这种架构能够降低计算资源消耗并提升模型推理效率。

DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。DeepSeek介绍，得益于新模型服务成本的大幅降低，官方API价格也相应下调，新价格即刻生效。在新的价格政策下，开发者调用DeepSeek API的成本将降低50%以上。

DeepSeek-V3.2发布当天寒武纪与昇腾均已实现适配，业内人士指出，DeepSeek-V3.2最大的意义在于软硬协同设计支持国产算力，全新DeepSeek Sparse Attention机制，叠加国产芯片的计算效率，可大幅降低长序列场景下的训推成本，共同为客户提供极具竞争力的软硬件解决方案。day 0适配和优化彰显了国产芯片的生态建设和技术积累成果，芯片和算法的联合创新，软硬件协同方式将进一步加速国内AI产业发展。

据财联社主题库显示，相关上市公司中：

寒武纪-U在官方微信号宣布，已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配。依托DeepSeek Sparse Attention机制，叠加寒武纪的极致计算效率，可大幅降低长序列场景下的训推成本。

海光信息表示，其DCU实现无缝适配+深度调优，DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能，同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

本主题由版主或管理员于 2025-9-30 12:37 移动

0 举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-11-23 00:43 , Processed in 0.084062 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册