英伟达 第7页
英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user五猫网 - AI工具、API服务与独立产品开发五猫网

英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user

英伟达今天(4 月 25 日)发布博文,宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型,开发者可通过 NVIDIA NIM 微服务下载部署,或利用 SGLang 与 vLLM 框...
谷歌 Google Cloud 推出 A5X 裸金属实例,多站点集群可支持 96 万个 Rubin GPU五猫网 - AI工具、API服务与独立产品开发五猫网

谷歌 Google Cloud 推出 A5X 裸金属实例,多站点集群可支持 96 万个 Rubin GPU

A5X 将采用英伟达的 ConnectX-9 SuperNIC 以及谷歌最新的 Virgo Network 超大规模扩展型 AI 数据中心架构。支持客户运行超大规模的 AI 工作负载。
溯波实习的头像五猫网 - AI工具、API服务与独立产品开发五猫网溯波实习49天前
2611
英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B‑A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍五猫网 - AI工具、API服务与独立产品开发五猫网

英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B‑A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍

该模型采用创新的 30B‑A3B 混合 MoE 架构,将视频、音频、图像和文本推理统一于单一模型,旨在替代智能体系统中常见的碎片化模型链。其在多项基准测试中表现领先,尤其在视频推理任务中,有效...
问舟的头像五猫网 - AI工具、API服务与独立产品开发五猫网问舟49天前
2714