曝DeepSeek V4模型春节前后发布!生成能力更强劲

赵美心

2026-01-11 12:00:01
12 浏览

据科技媒体The Information报道,有两位直接知情人士透露,DeepSeek计划在未来几周内(预计2月中旬农历新年前后)推出代号为V4的新一代旗舰人工智能模型。该模型将以强大的代码生成能力为核心突破。

据悉,DeepSeek V4在超长代码提示词处理与解析上实现了关键进展,支持百万级tokens上下文窗口。这意味着模型可一次性消化整个中型项目的代码库、技术文档与需求说明,精准理解跨文件依赖关系,有望解决复杂软件开发中因上下文断裂导致的沟通与理解障碍。

此外,V4在训练机制上取得突破,其数据模式理解能力在训练全阶段未出现衰减,这与传统模型在多次迭代后性能下降的情况形成对比。该特性使模型能更高效地从海量数据中学习,超越简单记忆,形成更深层次的抽象理解。

基于内部基准的初步测试显示,DeepSeek V4在代码生成任务上的表现优于Anthropic Claude、OpenAI GPT系列等现有主流模型。行业消息还透露,V4可能采用全新的mHC架构,具备更好的并行计算效率与国产芯片适配能力,有助于降低部署成本、提高推理速度,为其大规模商业化应用奠定基础。