DeepSeek V4发布：开源新势力崛起，国产AI生态持续进化-业界动态-ITBear科技资讯

备受瞩目的DeepSeek V4模型预览版近日正式发布，其权重同步开源，为人工智能领域注入新的活力。此次发布的版本包括旗舰版V4 PRO和经济型V4-Flash，前者总参数达1.6万亿，激活参数49B；后者总参数284B，激活参数13B。两者均支持100万token上下文，并采用MIT协议完全开源，展现了DeepSeek在技术开放上的坚定决心。

就在DeepSeek发布前一天，OpenAI上线了GPT-5.5，每百万输出token定价高达30美元。相比之下，DeepSeek V4-Flash的输出定价仅为2元人民币/百万token，折合不到0.3美元，形成了鲜明的价格对比。这一差异不仅体现了闭源与开源模型的不同定价逻辑，也引发了市场对两者性价比的广泛讨论。

DeepSeek V4的发布并非一帆风顺。从去年底到今年初，其发布窗口多次推迟，行业内外对此充满期待与猜测。在百万上下文已成为行业标配的背景下，DeepSeek V4通过引入全新的混合注意力架构，成功降低了处理超长文本时的算力消耗和KV缓存占用。据技术报告显示，V4-Pro在百万token上下文设置下，每处理一个token的算力消耗仅为V3.2的27%，KV缓存占用仅为10%，这一突破为长上下文应用的普及奠定了基础。

在模型矩阵方面，DeepSeek V4提供了旗舰版和经济型两种选择，并支持三种推理模式：非思考模式、思考模式-高和思考模式-极限。官方建议复杂Agent场景使用极限模式，以充分发挥模型的推理能力。内部员工已将V4-Pro作为日常Agentic Coding工具使用，其体验优于Claude Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但在与Opus 4.6思考模式的对比中仍存在一定差距。这种直白的自我评价，体现了DeepSeek在技术自信与务实态度之间的平衡。

V4的API定价策略同样引人关注。V4-Flash的输入价为1元/百万token（缓存命中0.2元），输出价为2元；V4-Pro的输入价为12元/百万token（缓存命中1元），输出价为24元。官方表示，Pro版下半年算力扩容后将大幅下调价格。这一策略不仅降低了开发者的使用门槛，也通过缓存机制鼓励更高效的应用开发模式。对于Agent类应用而言，将固定内容放在请求头部以触发缓存机制，恰好是最典型的调用模式，这有助于进一步降低边际成本。

DeepSeek V4的核心定位是Agent底座，而非直接参与应用生态竞争。官方明确表示，V4针对Claude Code、OpenClaw等主流Agent产品进行了专项适配和优化，在Agentic Coding评测中达到开源模型最佳水平。这一选择与当前行业格局密切相关：Anthropic的年化收入快速增长，Cursor等代码编辑器估值飙升，应用层的利润空间巨大。然而，DeepSeek选择成为Agent时代的基础设施供应商，通过长上下文、低价API和Agent适配的组合，为开发者提供更高效的工具。

在国产开源大模型领域，竞争日益激烈。今年以来，阿里Qwen3.5、智谱GLM-5、Kimi K2.6等模型相继发布，在参数规模、API定价和性能评测等方面展开角逐。例如，Qwen3.5总参数3970亿，激活仅170亿，百万token的API价低至0.8元；Kimi K2.6在SWE-Bench Verified上拿到80.2%的评分，几乎追平Claude Opus 4.6。这些进展表明，国产模型在国际开发者社区的影响力正在持续提升。

算力层面的匹配同样关键。华为在V4发布当日确认，昇腾全系列产品已全面适配V4-Flash和V4-Pro。基于昇腾950超节点，V4-Pro在8K输入场景下实现了约20ms的单token解码时延，单卡吞吐4700 TPS；V4-Flash可以做到约10ms时延，单卡吞吐1600 TPS。这些数据背后，是昇腾950在底层架构上的多项升级，包括原生支持低精度格式、针对MoE稀疏访存特征的优化等。华为还开源了PyPTO编程范式，缩短了复杂算子的开发周期，进一步降低了开发门槛。

寒武纪也在发布当天宣布，已基于vLLM框架完成V4-Flash和V4-Pro的适配，代码同步开源到GitHub。两家国产芯片厂商的快速响应，体现了模型研发与算力适配的深度协同。据此前报道，DeepSeek团队为完成从CUDA生态到昇腾CANN框架的技术栈迁移，重写了大量核心代码，这也是V4多次跳票的原因之一。然而，这一努力使得万亿参数级的开源旗舰模型在发布首日就能跑在国产算力上，其意义已超越单一模型的评测范畴。

从DeepSeek R1发布引发美股震荡，到V4的持续在场，中国AI研发正逐步摆脱“偶尔令人震撼”的标签，进入“系统性创新”的新阶段。无论是模型性能的突破，还是算力生态的完善，都表明中国AI已具备连续性创新的能力。这种能力不仅体现在技术层面，更体现在开发者社区的活跃度和产业链的协同效率上。随着更多国产模型和算力方案的涌现，中国AI正在全球舞台上扮演越来越重要的角色。

小米MiMo大模型API降价99%揭秘：全链路优化驱动大模型普惠化

其降价的核心技术基础是，小米MiMo大模型团队围绕Hybrid SWA+MoE+多模态的复合架构，系统性重构从KV Cache管理、分级缓存、前缀缓存到调度策略与Prefill/Decode链路的完整推理栈…

2026-06-02

Token经济浪潮下挑战与机遇并存华为星河AI网络筑牢数智化转型底座

在Token智能守护方面，华为秉持“AI对抗AI、AI守护AI”理念，推出内置AI Core引擎的AI防火墙，未知病毒检出率达95%；同时打造Agent安全护栏，结合鲲鹏架构与算子多层优化，实现安全和效率…

2026-06-02

2026年小米水杯代工怎么选？从生产实力到口碑推荐一文说清

像深圳市小家居用品有限公司，具备 17 年水杯制造经验，这使得他们在生产工艺、质量把控等方面都有深厚的积累，能够确保产品的稳定性和可靠性。小米水杯代工专业厂家在这个行业中扮演着重要角色，通过专业的生产和定制服…

2026-06-02

小米汽车交付量稳健攀升，雷军谈避免“数字内卷”聚焦市场长远发展

这一成绩不仅巩固了其在新能源汽车市场的地位，更让行业内外对其未来发展充满期待。雷军甚至提到，团队曾多次统计出具体的交付数字，比如36700台，但他认为没有必要过于关注这些细节，统一报告为3万台就可以。随着电动…

2026-06-02

小米汽车交付量持续攀升，雷军谈不公布精确数据：避免陷入数字比拼

交付数据：稳步增长小米汽车4月、5月交付量均突破3万台，延续增长势头。2月、3月交付量已超2万台，初期爬坡速度显著。官方称销量增长超预期。雷军回应：避免数字竞争雷军解释不公布精确销量是为了避免与同行陷入“比拼…

2026-06-02

小米YU7 GT交付现场星光熠熠，雷军舒淇亮相，生态互联与性能受赞

交付仪式盛况小米YU7GT正式开启交付，雷军与舒淇现身交付仪式，首批车主对新车赞不绝口。“人-车-家”生态互联车主可通过YU7GT控制米家设备，实现生态无缝连接。外观与性能车厘子红配色受好评，车漆工艺精湛。旅…

2026-06-02

小米YU7 GT交付现场星光熠熠，智能生态受赞，未来出行新选择来袭

无论是调节家中的灯光、空调，还是查看家庭安防，车主都能在驾驶过程中轻松实现，充分展现了小米在智能生态系统整合方面的强大能力。这一优势不仅吸引了众多消费者的目光，也成为他们选择小米YU7GT的重要原因。许多车主…

2026-06-02