一、DeepSeek-V4正式发布:开源与性能双突破
4月24日,深度求索(DeepSeek)正式发布全新大模型DeepSeek-V4预览版并同步开源,宣布”百万上下文时代”全面到来。这是继V3之后,深度求索在开源大模型领域的又一次重大突破。
DeepSeek-V4系列包含两个版本:总参数1.6T、激活参数49B的旗舰版DeepSeek-V4-Pro,以及总参数284B、激活参数13B的轻量版DeepSeek-V4-Flash。两个版本均支持100万token的超长上下文长度,这在开源模型中尚属首次。
深度求索官方表示,V4-Pro在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。在世界知识测评中,V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。在数学、STEM、竞赛型代码的测评中,V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
更令人印象深刻的是效率提升。与前代V3.2相比,V4-Pro在1M token上下文设置下,单token推理FLOPs(浮点运算量)仅为V3.2的27%,KV Cache(键值缓存)仅为其10%;V4-Flash则分别压缩到了10%和7%。这种效率提升得益于其创新的混合注意力架构,结合了压缩稀疏注意力(CSA)和高度压缩注意力(HCA),显著降低了计算复杂度。
DeepSeek-V4 API服务的定价延续了深度求索的高性价比策略。V4-Pro每百万token输入1元(缓存命中)或12元(缓存未命中),输出24元;V4-Flash则分别为0.2元、1元、2元。这意味着即便是旗舰版的V4-Pro,其使用成本也远低于同类闭源模型。

二、Agent能力大幅提升:编程与代码任务全面领先
DeepSeek-V4在Agent能力上的提升尤为显著。深度求索官方表示,V4-Pro的Agent能力相比前代模型显著增强,在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。
深度求索在官方公告中透露,目前V4已成为公司内部员工使用的Agentic Coding主力模型。据内部评测反馈,使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。
V4-Pro针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品进行了适配和优化,在代码任务、文档生成任务等方面的表现均有提升。这意味着开发者可以将V4集成到自己的Agent工作流中,获得接近顶级闭源模型的编程辅助能力。
第三方评测机构Artificial Analysis的综合智能指数榜单也验证了V4的实力。在编程指数中,V4-Pro仅用竞争对手一半的成本就达到了最顶尖的智能水平,展现了极高的性价比。
三、国产算力生态突破:昇腾、寒武纪全适配
DeepSeek-V4发布更重要的意义在于推动中国AI算力生态实现从依赖进口到自主可控的关键跨越。
4月初的报道指出,DeepSeek-V4已首次实现了与华为昇腾等国产芯片的深度适配。由智源研究院牵头研发的众智FlagOS,第一时间对两个”巨无霸”模型进行全量适配,已经完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署。
这些芯片包括:海光信息、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数,以及英伟达(FP8)等。FlagOS同时正在推进DeepSeek-V4-Pro模型在多个芯片的迁移适配,后续即将开源。
华为方面介绍,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3超节点的训练参考实现。
此外,据”寒武纪开发者”消息,寒武纪已基于vLLM推理框架完成对深度求索公司最新开源模型285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的Day 0适配,适配代码已开源到GitHub社区。
围绕DeepSeek-V4多芯适配,FlagOS系统软件技术栈突破了三大关键技术:FlagGems全算子替代(实现多芯片统一适配)、为o-group采用独立张量并行策略解锁更多低显存场景、以及”FP4+FP8混合精度”的原生权重到FP8/BF16的精度路径转换。
专家指出,除技术突破外,DeepSeek-V4发布的更重要价值在于推动中国AI算力生态实现从依赖进口到自主可控的关键跨越,这将为国产算力板块带来全链路利好,覆盖芯片、服务器、算力租赁等核心环节。
四、资本市场的连锁反应
DeepSeek-V4的发布与融资消息几乎同步传出,在资本市场引发连锁反应。
4月24日,深度求索被曝正与腾讯、阿里巴巴洽谈首轮融资,两家投资方预计共计投资18亿美元,估值可能突破200亿美元。虽然DeepSeek、腾讯、阿里三方均未公开确认或回应上述投资意向及具体数据,但资本市场已做出反应。
当天,港股已上市的两家AI大模型公司智谱和MiniMax纷纷走低。智谱当日收于935.00港元,下跌9.05%,市值4169亿港元;MiniMax收于777.50港元,下跌9.44%,市值2439亿港元。
与此同时,算力芯片板块盘中直线拉升。海光信息盘中一度大涨超10%,龙芯中科、中芯国际、通富微电、寒武纪、摩尔线程等龙头股纷纷跟涨。
五、写在最后:开源的力量与国产化的机遇
DeepSeek-V4的发布再次证明了一个趋势:在AI领域,开源与闭源的差距正在快速缩小,而中国科技企业在这一进程中扮演着越来越重要的角色。
深度求索用实际行动诠释了什么是”不诱于誉,不恐于诽,率道而行,端然正己”。从V2的MLA架构创新,到V3的混合专家模型突破,再到V4的百万上下文与全芯片适配,深度求索始终专注于技术本身,而非营销话术。
更重要的是,DeepSeek-V4与国产芯片的深度适配,标志着中国AI产业在核心环节上迈出了关键一步。当大模型不再受制于特定芯片生态,当昇腾、寒武纪们能够原生支持最先进开源模型,中国AI产业的自主可控就不再是空话。
当然,挑战依然存在。深度求索在定价说明中也坦言:”受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。”这说明国产算力的产能释放仍需时间。
但无论如何,DeepSeek-V4的发布为2026年的中国AI产业写下了浓墨重彩的一笔。它告诉我们:真正的创新,来自于对技术的专注,对开放的坚持,以及对生态共建的追求。

发表回复