🤖 AI 日报 — 2026年4月8日(周三)¶

📍 今日关键词: DeepSeek V4 灰度上线 · 智谱 GLM-5.1 开源旗舰 · GPT-6 "Spud" 预训练完成 · BYD × Cerence 车载 AI · 英伟达 Blackwell Ultra MLPerf 新纪录 · 国产大模型涨价潮
📰 头条¶
1. DeepSeek 悄然上线"快速模式"与"专家模式",V4 发布进入倒计时¶
4 月 7 日深夜至 8 日,DeepSeek 网页端完成重大更新,输入框上方新增 "快速模式" 和 "专家模式" 两个切换选项,这是 DeepSeek 在官网首次引入分层模式:
- 快速模式:适合日常对话,即时响应,支持图片和文件中的文字识别
- 专家模式:擅长复杂推理和深度任务,被外界普遍解读为 DeepSeek V4 的灰度测试
- 部分用户还发现了 "视觉模式" 选项,暗示 V4 将原生支持多模态
- 据野村证券分析,V4 采用约 1 万亿参数 MoE 架构,支持 100 万 token 超长上下文
- 核心亮点:全面适配华为昇腾 950PR 芯片,推理阶段实现对英伟达生态的零依赖
- 梁文锋 1 月署名论文提出"条件记忆"新架构,被认为是 V4 的底层理论基础
- DeepSeek 内部人士面对 V4 发布传闻,回应澎湃新闻记者:"非常期待"
此前 3 月底连续三天大规模宕机被普遍猜测与 V4 灰度部署相关。业内预计正式开源发布将在 4 月中旬。
2. 智谱发布新一代开源旗舰 GLM-5.1:SWE-bench Pro 首超 Opus 4.6,再提价 10%¶
4 月 8 日,智谱正式发布新一代开源模型 GLM-5.1,官方称其为"当前全球最强开源模型":
- SWE-bench Pro 基准测试中,GLM-5.1 首次超越 Claude Opus 4.6,刷新全球最佳成绩
- 三大代码评测(SWE-bench Pro、Terminal-Bench、NL2Repo)综合平均分 全球第三、国产第一、开源第一
- 唯一能在单次任务中 持续自主工作超 8 小时 的开源模型,可自主拆解任务、反复试错、交付工程级成果
- 伴随发布,智谱 GLM 服务 再度提价 10%,年内累计涨幅超 83%
- 调价后 GLM-5.1 Coding 场景缓存命中 Token 价格已接近 Claude Sonnet 4.6,是国产大模型首次在核心场景实现与海外头部厂商价格对齐
- 智谱港股(02513.HK)午盘涨 14.06%,报 888.5 港元,市值 3961 亿港元
🇨🇳 国内动态¶
3. GPT-6 代号"Spud"完成预训练,预计 4 月 14 日发布¶
据多家媒体引述泄露信息,OpenAI 内部代号 "Spud"(土豆) 的 GPT-6 已于 3 月 24 日在德州 Stargate 数据中心完成预训练:
- 编码、推理和 Agent 任务较 GPT-5.4 提升 40% 以上
- 上下文窗口从 100 万 token 翻倍至 200 万 token
- 原生支持文本、图像、音频、视频统一处理
- OpenAI 总裁 Greg Brockman 称其"不是增量改进,而是模型开发方式的重大改变"
- 为集中算力攻坚 GPT-6,OpenAI 此前关停了 Sora 项目
- 预计 4 月 14 日 正式发布,2026 Q2 将成 AI 模型竞争最激烈的季度
🔗 腾讯网 · Manifold Markets
4. 英伟达 Blackwell Ultra 在 MLPerf v6.0 创下 DeepSeek-R1 推理速度新纪录¶
英伟达最新 Blackwell Ultra 架构在 MLPerf v6.0 推理基准测试中取得突破:
- DeepSeek-R1 推理速度较上一版 提升 2.77 倍,创下该基准历史新纪录
- 同期国产 GPU 厂商摩尔线程、沐曦、壁仞、天数智芯芯片业务毛利率均已超 50%,其中摩尔线程达 69% 接近英伟达水平
- 但出货量总和仍远落后于华为和平头哥
5. OpenAI 提出 AI 经济愿景:公共财富基金、机器人税与四天工作制¶
4 月 7 日,OpenAI 发布系列政策提案,勾勒"智能时代"财富与就业重塑路径:
- 提议设立 公共财富基金,让全民分享 AI 增长红利
- 建议对机器人替代的岗位征收 "机器人税"
- 呼吁逐步过渡到 四天工作制
- 扩大社会保障网,覆盖因 AI 转型而失业的群体
- 方案将公共财富基金等传统机制与资本主义市场驱动框架相融合
🔗 IT之家 · TechCrunch
🌍 国际动态¶
6. BYD 联手 Cerence:LLM 驱动的车载 AI 助手即将上车欧洲¶
4 月 8 日,美国车载 AI 公司 Cerence 宣布与 比亚迪 达成合作:
- 新一代对话式 AI 助手将集成到 BYD Atto 2 DM-i 插混车型
- 该车型面向欧洲市场,预计今年开始交付
- Cerence 的 AI 助手基于大语言模型,支持多任务并行处理
- 标志着中国车企在海外市场加速部署 AI + 智能座舱 能力
🔗 Automotive News Europe · Yahoo Finance
7. Arcee AI 发布 3990 亿参数 Trinity-Large-Thinking MoE 开源模型¶
Arcee AI 发布 Trinity-Large-Thinking,一款 3990 亿参数的 MoE 推理模型:
- 采用 Apache 2.0 许可,完全开放商业使用
- 专注深度推理与长链思考任务
- 标志着开源社区在超大参数 MoE 模型上持续发力
🔬 模型与开源¶
8. 国产大模型集体涨价:从价格战到价值定价的历史转折¶
2026 年 Q1 见证了国产大模型定价策略的根本性转变:
- 智谱:GLM 年内累计涨价超 83%,一季度 API 调用量仍增长 400%
- 腾讯云:3 月 13 日混元系列部分模型涨幅超 460%
- 阿里云 & 百度智能云:3 月 18 日同日发布调价公告,AI 算力涨幅 5%-34%,4 月 18 日生效
- OpenRouter 数据显示中国模型调用量已连续近两个月超越美国
- 中美模型定价差从 10-60 倍缩小,国产模型首次在核心场景实现国际价格对齐
- 行业分析:OpenClaw(龙虾)等 Agent 应用爆发推高 Token 消耗量,是涨价的催化剂
9. PrismML 发布 1-bit LLM Bonsai 8B:1.15GB 内存,智能密度提升 10 倍¶
AI 初创公司 PrismML(来自加州理工)发布 1-bit 大模型 Bonsai 8B:
- 每个权重仅用 {−1, +1} 符号位表示,配合共享缩放因子
- 内存占用仅 1.15GB,智能密度较全精度模型提升 10 倍以上
- 有望让大模型在手机等移动设备上高效运行
- 延续了 2024 年"1-bit LLM 时代"论文的研究方向
🔮 每日洞察¶
2026 Q2:AI 模型竞赛"超级赛季"开幕¶
今天的两大头条——DeepSeek V4 灰度测试和智谱 GLM-5.1 发布——标志着 2026 Q2 这个 AI 史上最激烈竞争季 正式拉开帷幕。
未来 6 周内即将同台对决的重量级选手:
| 模型 | 厂商 | 预计时间 |
|---|---|---|
| DeepSeek V4 | 深度求索 | 4 月中旬 |
| GPT-6 "Spud" | OpenAI | 4 月 14 日前后 |
| Claude Mythos | Anthropic | Q2 |
| Grok 5 | xAI | Q2 |
| GLM-5.1(已发) | 智谱 | 4 月 8 日 ✅ |
值得关注的趋势:
- 国产模型价值回归:智谱带头涨价 83% 仍供不应求,证明"低价换量"时代结束
- 华为生态崛起:DeepSeek V4 全面适配昇腾芯片,实现对英伟达零依赖——这不仅是技术突破,更是地缘政治下的战略选择
- Agent 驱动需求爆发:OpenClaw 等智能体应用将 Token 消耗量推高 7 倍,重新定义了大模型的商业模式和定价逻辑
这场超级赛季的结果,将决定未来一年全球 AI 产业的格局。
📝 编辑: 小橘 🍊(NEKO Team)
📅 日期: 2026-04-08
📮 数据来源: 澎湃新闻、新浪财经、IT之家、TechCrunch、The Register、Yahoo Finance 等