午后,算力芯片概念持续走高,海光信息(688041)一度涨超11%,寒武纪、摩尔线程等跟涨。

消息面上,寒武纪在官方微信号宣布,已基于vLLM推理框架完成对深度求索公司最新开源模型285B DeepSeek-V4-Flash和1.6T DeepSeek-V4-Pro的Day 0适配,适配代码已开源到GitHub社区。
4月24日上午,深度求索(DeepSeek)正式发布全新系列大模型DeepSeek-V4预览版,同步完成开源,并开放官网、App及API调用服务,标志着百万字超长上下文能力进入普惠阶段,为国内开源领域及大模型产业发展注入新动力。
据悉,DeepSeek-V4系列大模型的核心优势的是具备100万Token(约合75万字)的超长上下文处理能力。该系列通过结构创新实现性能突破,开创全新注意力机制,结合Token维度压缩与DSA稀疏注意力(DeepSeekSparse Attention)技术,在大幅降低计算与显存开销的同时,将百万上下文能力设为所有官方服务的标配,可轻松应对整本著作、大型代码库、百万字法律合同等超长文本处理场景。(详见DeepSeek大消息!多股立刻大涨)
此前,北京时间4月24日凌晨,OpenAI发布GPT‑5.5。OpenAI称,这是迄今为止最智能、最易用的模型,也是迈向全新计算机工作方式的又一重要里程碑。

OpenAI强调,GPT‑5.5能够更快地理解用户意图,并能独立完成更多工作。该模型在编写和调试代码、在线调研、数据分析、创建文档与电子表格、操作软件以及跨工具协作以完成任务等方面表现尤为出色。用户只需向GPT‑5.5提供一项复杂且包含多个环节的任务,它便能自主规划、调用工具、检查成果、应对模糊情境,并持续推进直至任务完成。
从基准测试数据来看,GPT-5.5在几乎所有核心指标上都超越了前代GPT-5.4。

在当前AI模型能力主要聚焦的智能体编程、计算机使用、知识型工作以及早期科学研究等领域,OpenAI称,GPT‑5.5带来的提升尤为显著。
上述领域的发展往往依赖于跨情境的推理能力以及长期行动的执行力,通常而言,规模更大、功能更强大的模型在服务时会更慢。但GPT‑5.5实现了智能化的跨越式提升的同时,并未牺牲速度:其在实际服务中的每token延迟水平与GPT‑5.4相当,却能展现出远超后者的人工智能水平。此外,GPT‑5.5完成相同Codex任务所使用的token数量也大幅减少。

上图显示,GPT-5.5在Terminal-Bench 2.0得分82.7%,比GPT-5.4的75.1%有明显提升;衡量长周期真实工程任务的内部评测Expert-SWE从68.5%升至73.1%。
“GPT-5.5比GPT-5.4明显更聪明、更专注,编码能力更强,工具使用也更加可靠。它能显著延长保持任务状态的时间,不会过早中断——这一点对我们用户委托给Cursor的复杂且耗时的工作尤为重要。”AI编程助手Cursor联合创始人兼首席执行官迈克尔·特鲁尔(Michael Truell)表示。
安全性方面,OpenAI称,GPT‑5.5配备了迄今最强大的安全防护措施,旨在降低滥用风险,同时确保有益工作的顺畅开展。
目前,GPT‑5.5正面向ChatGPT和Codex中的Plus、Pro、Business及Enterprise用户逐步推出;而GPT‑5.5 Pro则正面向ChatGPT中的Pro、Business及Enterprise用户开放。但值得注意的是,GPT‑5.5的价格也更贵,其标准版价格是输入5美元/1百万tokens,输出30美元/1百万tokens,强化推理版本的GPT-5.5 Pro价格是输入30美元/1百万tokens,输出180美元/1百万tokens。
作者:孟妹 郑维汉

