ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

​深度求索DeepSeek V3.2基础版已现身Hugging Face,国庆前或迎正式发布​

时间:2025-09-29 23:55:24来源:互联网编辑:快讯

近日,人工智能领域传来新动向,深度求索公司即将推出一款备受瞩目的全新大模型——DeepSeek V3.2。这款模型计划在国庆假期前完成正式发布,其基础版本(V3.2-Base)已悄然上传至Hugging Face平台,但目前处于隐藏状态,普通用户暂时无法直接访问。

据技术文档披露,DeepSeek V3.2的参数规模高达6850亿,采用BF16-F8_E4M3-F32张量类型进行计算,并以Safetensors格式存储模型权重。这种配置在同类模型中属于较高水平,显示出开发团队在算力优化和存储效率上的技术追求。不过,截至目前,官方尚未发布完整的模型卡片,也未部署可供调用的推理服务,开发者社区暂时无法进行实际测试。

与该系列此前模型的发布策略不同,此次DeepSeek V3.2选择在技术文档准备尚未完全就绪时提前上传基础版本,这种“先存后释”的节奏引发了AI社区的广泛讨论。部分开发者认为这可能是为后续快速迭代预留空间,也有观点指出这或许与当前大模型领域的竞争态势有关。尽管具体发布细节仍待官方确认,但可以预见的是,这款参数规模庞大的新模型将为行业带来新的技术参考。

更多热门内容
南宁“多快好省”发力 搭建中国—东盟AI产业合作新桥梁
南宁积极打造可信数据专区,中国—东盟可信数据专区(测试版)已建成,初步形成“境外中心+境内智算中心”双架构,为东盟国家在人工智能数据、算力和模型领域的合作提供体系化支撑。 南宁致力将南A中心打造成为中国—东盟…

2025-09-29

“AI引擎+全球航道”双驱动,阿里专有云擘画未来十年增长新蓝图
据介绍,阿里专有云面向国际市场主要包括三种服务方式:一是主权云,基于专有云构建本地的公共云,比如与当地运营商合作,构建当地的“专有公共云”,像泰国、南非都采用这种方式,在满足当地合规要求的同时支持客户本地…

2025-09-29

许主洪加盟阿里通义:或投身基础前沿大模型研发,助力多模态创新突破
在9月底举办的2025云栖大会期间,阿里云智能集团首席技术官、通义实验室负责人周靖人透露,连续发布数十款模型背后有战略考量:全球AI模型进展都在加速,整个通义家族一直在跟全球AI领域的领先者进行你追我赶,A…

2025-09-29

观安信息亮相2025北京互联网大会,解锁可信数据空间与AI安全新实践
他表示,观安信息以“亲近客户、服务监管”为核心价值,专注于数据安全领域,已在大模型安全护栏、智能分类分级、AI深度伪造检测、AI安全智能体四个方向取得实践成果。为此,观安信息以“大模型语义理解+行业规则引擎”…

2025-09-29