今日,万众瞩目的DeepSeek V4,紧接OpenAI推出的最新模型GPT-5.5。
4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源,按大小分为DeepSeek-V4-Flash 和 DeepSeek-V4-Pro两个版本。
据官方介绍,DeepSeek V4-Pro拥有1.6万亿总参数、490亿激活参数,能够达到百万字超长上下文,在智能体编程基准测试中达到开源最优,数学、STEM、编程能力等性能已与全球顶尖闭源模型比肩,世界知识储备仅次于Gemini 3.1 Pro。
而V4-Flash体量更小,总参数284亿、激活参数130亿,推理能力接近Pro版,响应速度更快,API价格更低,适合对成本和速度敏感的场景。

技术层面,两款模型均采用全新注意力机制,结合token级压缩与DSA(DeepSeek稀疏注意力),大幅降低长文本的计算和内存开销,将100万token上下文设为默认配置,是目前长上下文效率的全球最高水平。
此次发布的意义在于V4-Pro以开源形式实现了闭源顶尖模型的性能,V4-Flash则以极低成本提供接近顶级的推理能力,百万token上下文的普及将使整个代码库、超长文档的一次性处理成为常态,对整个AI开发生态构成实质性冲击。
据称,DeepSeek 刻意将 V4 的早期硬件访问权限优先授予华为等国产芯片厂商,而非英伟达。此前有媒体报道,V4 将运行于华为昇腾 950PR 芯片之上,这将使其成为首款在非英伟达芯片上运行的前沿 AI 模型,对美国出口管制政策构成直接挑战。
文、图|记者 扶贝贝
