苹果发布 AI 框架 LaDiR:突破单一思维,并行探索多条推理路径
苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架,让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。
谷歌为 Gemma 4 系列 AI 模型推出 MTP 起草器,推理速度最高提升 3 倍
谷歌于 5 月 5 日发布博文,宣布为 Gemma 4 系列 AI 模型,推出多 Token 预测(MTP)起草器,利用推测解码架构,推理速度最高可提升 3 倍。











