DeepSeek-V4发布开源：百万上下文突破，昇腾寒武纪全适配，国产AI算力生态加速崛起

一、DeepSeek-V4正式发布：开源与性能双突破

4月24日，深度求索（DeepSeek）正式发布全新大模型DeepSeek-V4预览版并同步开源，宣布”百万上下文时代”全面到来。这是继V3之后，深度求索在开源大模型领域的又一次重大突破。

DeepSeek-V4系列包含两个版本：总参数1.6T、激活参数49B的旗舰版DeepSeek-V4-Pro，以及总参数284B、激活参数13B的轻量版DeepSeek-V4-Flash。两个版本均支持100万token的超长上下文长度，这在开源模型中尚属首次。

深度求索官方表示，V4-Pro在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。在世界知识测评中，V4-Pro大幅领先其他开源模型，仅稍逊于顶尖闭源模型Gemini-Pro-3.1。在数学、STEM、竞赛型代码的测评中，V4-Pro超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。

更令人印象深刻的是效率提升。与前代V3.2相比，V4-Pro在1M token上下文设置下，单token推理FLOPs（浮点运算量）仅为V3.2的27%，KV Cache（键值缓存）仅为其10%；V4-Flash则分别压缩到了10%和7%。这种效率提升得益于其创新的混合注意力架构，结合了压缩稀疏注意力（CSA）和高度压缩注意力（HCA），显著降低了计算复杂度。

DeepSeek-V4 API服务的定价延续了深度求索的高性价比策略。V4-Pro每百万token输入1元（缓存命中）或12元（缓存未命中），输出24元；V4-Flash则分别为0.2元、1元、2元。这意味着即便是旗舰版的V4-Pro，其使用成本也远低于同类闭源模型。

DeepSeek-V4适配华为昇腾950、寒武纪、海光等8款以上国产芯片，多芯适配构建自主可控AI生态

二、Agent能力大幅提升：编程与代码任务全面领先

DeepSeek-V4在Agent能力上的提升尤为显著。深度求索官方表示，V4-Pro的Agent能力相比前代模型显著增强，在Agentic Coding评测中，V4-Pro已达到当前开源模型最佳水平，并在其他Agent相关评测中同样表现优异。

深度求索在官方公告中透露，目前V4已成为公司内部员工使用的Agentic Coding主力模型。据内部评测反馈，使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但仍与Opus 4.6思考模式存在一定差距。

V4-Pro针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品进行了适配和优化，在代码任务、文档生成任务等方面的表现均有提升。这意味着开发者可以将V4集成到自己的Agent工作流中，获得接近顶级闭源模型的编程辅助能力。

第三方评测机构Artificial Analysis的综合智能指数榜单也验证了V4的实力。在编程指数中，V4-Pro仅用竞争对手一半的成本就达到了最顶尖的智能水平，展现了极高的性价比。

三、国产算力生态突破：昇腾、寒武纪全适配

DeepSeek-V4发布更重要的意义在于推动中国AI算力生态实现从依赖进口到自主可控的关键跨越。

4月初的报道指出，DeepSeek-V4已首次实现了与华为昇腾等国产芯片的深度适配。由智源研究院牵头研发的众智FlagOS，第一时间对两个”巨无霸”模型进行全量适配，已经完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署。

这些芯片包括：海光信息、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数，以及英伟达（FP8）等。FlagOS同时正在推进DeepSeek-V4-Pro模型在多个芯片的迁移适配，后续即将开源。

华为方面介绍，昇腾一直同步支持DeepSeek系列模型，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销，大幅提升推理性能，结合多种量化算法，实现了高吞吐、低时延的DeepSeek V4模型推理部署。昇腾A3超节点系列产品也全面适配，同时为便于用户快速微调，提供了基于昇腾A3超节点的训练参考实现。

此外，据”寒武纪开发者”消息，寒武纪已基于vLLM推理框架完成对深度求索公司最新开源模型285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的Day 0适配，适配代码已开源到GitHub社区。

围绕DeepSeek-V4多芯适配，FlagOS系统软件技术栈突破了三大关键技术：FlagGems全算子替代（实现多芯片统一适配）、为o-group采用独立张量并行策略解锁更多低显存场景、以及”FP4+FP8混合精度”的原生权重到FP8/BF16的精度路径转换。

专家指出，除技术突破外，DeepSeek-V4发布的更重要价值在于推动中国AI算力生态实现从依赖进口到自主可控的关键跨越，这将为国产算力板块带来全链路利好，覆盖芯片、服务器、算力租赁等核心环节。

四、资本市场的连锁反应

DeepSeek-V4的发布与融资消息几乎同步传出，在资本市场引发连锁反应。

4月24日，深度求索被曝正与腾讯、阿里巴巴洽谈首轮融资，两家投资方预计共计投资18亿美元，估值可能突破200亿美元。虽然DeepSeek、腾讯、阿里三方均未公开确认或回应上述投资意向及具体数据，但资本市场已做出反应。

当天，港股已上市的两家AI大模型公司智谱和MiniMax纷纷走低。智谱当日收于935.00港元，下跌9.05%，市值4169亿港元；MiniMax收于777.50港元，下跌9.44%，市值2439亿港元。

与此同时，算力芯片板块盘中直线拉升。海光信息盘中一度大涨超10%，龙芯中科、中芯国际、通富微电、寒武纪、摩尔线程等龙头股纷纷跟涨。

五、写在最后：开源的力量与国产化的机遇

DeepSeek-V4的发布再次证明了一个趋势：在AI领域，开源与闭源的差距正在快速缩小，而中国科技企业在这一进程中扮演着越来越重要的角色。

深度求索用实际行动诠释了什么是”不诱于誉，不恐于诽，率道而行，端然正己”。从V2的MLA架构创新，到V3的混合专家模型突破，再到V4的百万上下文与全芯片适配，深度求索始终专注于技术本身，而非营销话术。

更重要的是，DeepSeek-V4与国产芯片的深度适配，标志着中国AI产业在核心环节上迈出了关键一步。当大模型不再受制于特定芯片生态，当昇腾、寒武纪们能够原生支持最先进开源模型，中国AI产业的自主可控就不再是空话。

当然，挑战依然存在。深度求索在定价说明中也坦言：”受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。”这说明国产算力的产能释放仍需时间。

但无论如何，DeepSeek-V4的发布为2026年的中国AI产业写下了浓墨重彩的一笔。它告诉我们：真正的创新，来自于对技术的专注，对开放的坚持，以及对生态共建的追求。

一、DeepSeek-V4正式发布：开源与性能双突破

二、Agent能力大幅提升：编程与代码任务全面领先

三、国产算力生态突破：昇腾、寒武纪全适配

四、资本市场的连锁反应

五、写在最后：开源的力量与国产化的机遇

评论

发表回复 取消回复

更多文章

欧易最新安全升级措施会如何影响用户资产保护

SpaceX星舰V3今日首飞：人类最强火箭的五大技术飞跃

比特币突破关键阻力位后市场情绪发生了什么变化

币安生态基金为何频繁投资AI区块链项目？2026年深度解析

发表回复取消回复