英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B‑A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍
该模型采用创新的 30B‑A3B 混合 MoE 架构,将视频、音频、图像和文本推理统一于单一模型,旨在替代智能体系统中常见的碎片化模型链。其在多项基准测试中表现领先,尤其在视频推理任务中,有效...
OpenAI 为应对算力紧缺推出“保证容量”服务:客户可锁定 1 至 3 年长期算力,年消费越高折扣越大
OpenAI 推出 " 保证容量 " 服务,允许客户锁定 1-3 年算力,消费越高折扣越大。该服务旨在解决 AI 算力紧缺问题,客户可在全线产品中使用承诺额度,并灵活匹配业务需求。AI 浪潮下,...
LM Studio 与苹果合作,成功用四台 Mac Studio 运行万亿参数 Kimi K2.6 大模型
在 WWDC 2026 上,LM Studio 与苹果合作,成功在由四台 Mac Studio 组成的集群上本地运行了月之暗面发布的万亿参数模型 Kimi K2.6。演示通过苹果的内存共享技术,实现了约 1.5TB 的统一内存容量...
阶跃星辰发布 StepAudio 2.5 ASR 自动语音识别模型:推理速度提升 400%,定价骤减 90%
阶跃星辰 StepAudio 2.5 ASR 将大语言模型推理加速技术引入语音识别,实现 400% 速度提升与 60% 时延降低,并支持 30 分钟长音频端到端转写,无需分段。新模型定价仅 0.15 元 / 小时,为前代 1/...












