通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102126
跳转到指定楼层
1#
发表于 2025-9-30 11:18:14 |只看该作者 |倒序浏览

DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。


DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。


DeepSeek-V3.2发布当天寒武纪与昇腾均已实现适配,业内人士指出,DeepSeek-V3.2最大的意义在于软硬协同设计支持国产算力,全新DeepSeek Sparse Attention机制,叠加国产芯片的计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。day 0适配和优化彰显了国产芯片的生态建设和技术积累成果,芯片和算法的联合创新,软硬件协同方式将进一步加速国内AI产业发展。


据财联社主题库显示,相关上市公司中:


寒武纪-U在官方微信号宣布,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配。依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。


海光信息表示,其DCU实现无缝适配+深度调优,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。


举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-10-1 06:24 , Processed in 0.081320 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部