DeepSeek 于 4 月 24 日正式推出 V4 预览版系列，以 MIT 许可协议开源，模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告，V4-Pro-Max（最高推理力度模式）在 Codeforces 基准取得 3206 分，超越 GPT-5.4。

两款 MoE 模型架构规格

根据 DeepSeek V4 技术报告，V4 系列包含两款混合专家（MoE）模型：

V4-Pro：总参数 1.6T，每 token 激活 49B，支持 1M token 上下文

V4-Flash：总参数 284B，每 token 激活 13B，同样支持 1M token 上下文

根据技术报告，V4-Pro 在 1M 上下文下的单 token 推理 FLOPs 仅为 V3.2 的 27%，KV 缓存降至 V3.2 的 10%，主要得益于混合注意力机制（压缩稀疏注意力 CSA ＋重度压缩注意力 HCA）的架构升级。预训练数据规模超过 32T token；训练优化器更新为 Muon。

后训练方法论：在线策略蒸馏取代混合强化学习

根据 DeepSeek V4 技术报告，V4 后训练的核心更新在于以在线策略蒸馏（On-Policy Distillation，OPD）完全取代 V3.2 的混合强化学习（mixed RL）阶段。新流程分为两步：首先针对数学、代码、Agent 及指令跟随等领域分别训练领域专家（SFT ＋ GRPO 强化学习）；随后以多教师 OPD 将十余个专家的能力蒸馏至统一模型，通过 logit 对齐避免传统方法中常见的能力冲突。

报告同时引入生成式奖励模型（Generative Reward Model，GRM），针对难以用规则验证的任务，以少量多样化人工标注数据训练，让模型同时承担生成与评估功能。

基准测试成绩：编码领先，知识推理仍有差距

根据 DeepSeek V4 技术报告，V4-Pro-Max 与 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的对比结果（不含近期发布的 GPT-5.5 及 Opus 4.7）：

Codeforces：3206（GPT-5.4：3168 / Gemini 3.1 Pro：3052）→ 全场最高

LiveCodeBench：93.5 → 全场最高

SWE Verified：80.6，落后 Opus 4.6 的 80.8 差 0.2 个百分点

GPQA Diamond：90.1，落后 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified：57.9，落后 Gemini 3.1 Pro 的 75.6

HLE：37.7，落后 Gemini 3.1 Pro 的 44.4

技术报告同时指出，上述对比不含最近发布的 GPT-5.5 及 Opus 4.7，V4 与最新一代闭源模型的差距有待第三方评测验证。

常见问题

DeepSeek V4 预览版的开源许可条款为何，可在哪里取得？

根据 DeepSeek 4 月 24 日的官方公告，V4 系列以 MIT 许可协议开源，模型权重已上线 Hugging Face 及 ModelScope，适用于商业与学术用途。

DeepSeek V4-Pro 与 V4-Flash 的参数规模有何差异？

根据 DeepSeek V4 技术报告，V4-Pro 总参数为 1.6T，每 token 激活 49B；V4-Flash 总参数为 284B，每 token 激活 13B，两款均支持 1M token 上下文。

DeepSeek V4-Pro-Max 与 GPT-5.4 及 Gemini 3.1 Pro 的基准比较结果为何？

根据 DeepSeek V4 技术报告，V4-Pro-Max 在 Codeforces（3206 分）及 LiveCodeBench（93.5）两项基准超越 GPT-5.4 及 Gemini 3.1 Pro，但在知识密集型基准（GPQA Diamond、SimpleQA-Verified、HLE）上仍落后 Gemini 3.1 Pro；比较组不含 GPT-5.5 及 Opus 4.7。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

AI 金融平台 Rogo 在不到 3 个月内完成 D 轮融资，由 Kleiner Perkins 牵头

AI Agent AI 行业动态

据《Beating》报道，面向高频金融场景的人工智能平台 Rogo 已于 2026 年 4 月完成一轮 $160 百万美元的 D 轮融资，由 Kleiner Perkins 牵头，Sequoia、Thrive Capital、Khosla Ventures 以及 J.P. Morgan 参与。该轮融资距离公司在 1 月下旬完成一轮百万美元的 C 轮融资不足三个月，使总融资额超过百万。 Rogo 同步推出 Felix，这是一款面向金融从业者的人工智能代理平台。该平台使投资银行家和分析师能够将包括财务建模、报告分析以及演示文稿制作在内的多步骤任务委托给 Felix，从而释放时间用于高杠杆的客户工作。目前，该平台已被超过 35,000 名专业人士在 250 多家顶级投资银行、资产管理公司和私募股权公司中使用。

GateNews3小时前

中国以技术与数据安全担忧为由，阻止 Meta 支持的 Manus AI 收购

AI Agent AI 行业动态

据 PANews 报道，4 月 29 日，中国国家发展和改革委员会投资安全审查办公室禁止对 Manus 项目的外国收购，并要求终止该交易。Manus 号称是世界首个通用人工智能代理，曾

GateNews4小时前

阿里云将 DeepSeek-V4-Pro 隐式缓存定价下调至 4 月 29 日每百万 tokens 1 元

AI 行业动态

据阿里云介绍，其百炼平台将下调 DeepSeek-V4-Pro 模型隐式缓存 (Implicit Cache) 的定价：自北京时间 2026 年 4 月 29 日 23:59:59 起，每百万 tokens 价格为 1 元。只有当请求命中缓存时才适用隐式缓存；缓存的输入 tokens 按 cached_token 费率计费，而未命中缓存的输入 tokens 则按标准 input_token 费率计费。此次调整仅影响隐式缓存的定价；基础模型推理费率保持不变。

GateNews4小时前

AI 平台 Certifyde 携 Ripple 首席执行官 Brad Garlinghouse 在种子轮融资中筹集 $2M

AI 行业动态

据链捕手消息，AI 应用平台 Certifyde 宣布已完成一轮 $2 百万美元的种子轮融资。投资方包括 K5 Global、Flamingo Capital，以及天使投资人，例如 Ripple 首席执行官 Brad Garlinghouse、Honey 联合创始人 George Ruan，以及 Nutra 联合创始人 Roland Peralta

GateNews6小时前

DeepSeek 在测试版中上线图像识别功能

AI 行业动态

据 PANews 报道，DeepSeek 于今日 (年4月29日) 推出其图像识别功能，目前处于测试版阶段。网页端和移动端应用用户都可能被选入此次测试版推送。

GateNews7小时前

Anthropic 为 Claude 推出 8 个创意工具连接器，包含 Blender、Adobe、Autodesk

AI 行业动态

Anthropic 已宣布一套创意工具连接器，能够让 Claude 直接控制设计师和音乐人使用的专业软件。最初的八个连接器涵盖 3D 建模、视觉设计、音乐制作和现场表演，合作伙伴包括 Blender、Adobe、Autodesk、Ableton、Splice、Canva 的 Affinity、Resolume 和 SketchUp。Blender 连接器由 Blender 官方团队使用 MCP 协议开发，使其他 AI 模型也能访问它。

GateNews7小时前

0/400

暂无评论