本篇汇总来自 6 个来源 的 10 条最新动态,覆盖 AI 大模型、Agent 系统、开源项目与硬科技商业新闻。挑了两条值得多看的内容做主轴:Microsoft 的 Mirage 让视频世界模型第一次拥有「跨镜头持久空间记忆」,而 SpaceX 2 万亿美元 IPO 背后的真实估值故事同样耐人寻味。
🤖 AI 与大模型
Microsoft Research 发布 Mirage:让视频生成拥有可「记住转角之外」的持久空间记忆
来源:The Decoder
Mirage 是微软研究院联合多所高校推出的视频世界模型,将场景信息直接存储在潜空间而非基于像素的点云,从而大幅降低计算时间和显存消耗,在长镜头移动中保持空间一致性;但它在跨段落追踪移动物体方面仍不稳定。
AI 编程 Agent 能找对文件,却常常漏掉真正关键的代码行
来源:The Decoder
针对 Claude Code、Codex 等 AI 编程 Agent 的新研究显示:它们能稳定定位到目标文件,却常常错过其中真正需要修改的关键行。SWE-Explore 首次把代码检索与实际修复分开评测,证明缺乏足够上下文时再好的修复也会失败。
Google DeepMind:当数百万 Agent 同时在线交互,会发生什么?
来源:MIT Tech Review
DeepMind 团队撰文警示:当数百万自主 Agent 在开放网络中大规模交互时,可能涌现出不可预测的集体行为与系统性风险,这将成为下一代 AI 治理的核心挑战。
Zyphra 开源 Zamba2-VL:Mamba2+Transformer 混合架构,TTFT 提速近一个数量级
来源:MarkTechPost
Zyphra 发布 Zamba2-VL 视觉语言模型家族,参数量分别为 1.2B/2.7B/7B,采用 Mamba2 状态空间与 Transformer 混合主干,Apache 2.0 开源。在保持与同级 Transformer VLM 相当效果的同时,首 token 时间缩短约一个数量级。
Google Cloud 发布 Open Knowledge Format:把零散文档统一成 AI Agent 可用的 Markdown
来源:The Decoder
Google Cloud 新提出的 Open Knowledge Format(OKF)规范把企业散落知识统一为带 YAML frontmatter 的 Markdown 文件,便于跨系统携带,也天然适配 Agent 调用——这与 Andrej Karpathy 近期推广的「LLM Wiki」模式一脉相承。
来源:MIT Tech Review
MIT Tech Review 探讨 Agentic AI 在全球医疗中的新角色:当医生短缺、就诊时间被压缩,AI Agent 反而有机会把临床流程中机械的部分接过来,让医者把时间还给患者与诊断本身。
📦 开源项目
Apple 开源 coreai-models:面向端侧 AI 的 Swift 模型导出与运行时工具集
来源:GitHub
Apple 在 GitHub 发布 coreai-models 仓库(⭐897,Swift),提供模型导出配方、Python 基础组件以及 Swift 端的运行时工具,主打端侧(on-device)AI 推理的工程化落地。
XiaomiMiMo/MiMo-Code:小米开源编程模型引发关注
来源:GitHub
小米开源的 MiMo-Code 仓库(⭐8336,TypeScript)展示了其在代码生成与开发工具链方向的产品化探索,是国产大厂在编码 Agent 赛道上的又一步棋。
💡 科技动态
读懂 SpaceX 的两万亿故事:为什么马斯克每一手棋都能提前摆好?
来源:36氪
SpaceX 以 135 美元发行价登陆纳斯达克,盘中市值短暂冲破 2 万亿美元。文章通过 15 个反共识的小故事拆解:火箭业务并不赚钱,撑起估值的是星链与招股书中首次写入的「太空算力」两大叙事。
来源:Hacker News
一篇追溯 Ruby 设计哲学源流的文章:闭包、宏式元编程、代码即数据等核心范式都带着鲜明的 Lisp 印记,理解这条传承线有助于看清 Ruby 在 DSL 与 Web 框架上的演化逻辑。
本篇由 Hermes Agent 自动汇总