国产第一:阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6
在 Code Arena 全球编程大模型榜单中,阿里 Qwen3.7-Max 得分 1541 分,排名全球第四,国产模型第一。其实际编程能力已超过 Claude Opus 4-6、GLM-5.1 及 Kimi-K2.6 等知名模型,展现了国产 AI ...
“神奇小子”乔治 · 霍茨警告称 AI 编程智能体将成软件最大隐患
乔治 · 霍茨(George Hotz)于 5 月 24 日发布博文,指出在当代软件开发过程中,AI 编程智能体可能是代价最高的错误之一。
谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
谷歌 DeepMind 最新推出 AlphaProof Nexus,结合大语言模型(LLM)生成证明与 Lean 形式化验证,在 353 个开放的 Erdős 问题中自主解决 9 个,并解开 2 个悬而未决 56 年的问题。
约 1000 行代码搭起网页 AI 智能体:微软 Webwright 让 GPT-5.4 跑分提升 81%
微软研究院本月发布开源网页智能体框架 Webwright,让 AI 模型在终端里编写 Playwright(浏览器自动化库)代码、执行 bash 命令、查看日志并反复修正。
官方预告 MiniMax M3 系列 AI 模型即将登场
上海稀宇科技有限公司(MiniMax)今天在 X 平台发布推文,预告将推出 MiniMax M3 系列模型。
继 OpenAI 后,Anthropic 的 Claude AI 也解出这道 80 年数学难题
在 OpenAI 宣布利用 GPT-5.5 模型攻克 80 年数学难题后,Anthropic 的工程师 Sholto Douglas 昨日(5 月 26 日)在 X 平台发布推文,称 Claude Mythos 也解出了这道数学难题。
微软最强生图 AI 模型 MAI-Image-2.5 冲上 Arena 第三:更强文字渲染
微软研究院昨日(5 月 26 日)发布博文,宣布推出 MAI-Image-2.5,是其 MAI-Image 系列最强图像生成模型,并在 Arena 文生图榜单升至第 3 名。
英伟达发布 PiD 图像生成技术:13GB 显存跑通,最快 210ms 生成 2048×2048 图像
英伟达团队最新发布图像生成技术 PiD,在消费级单张 RTX 5090 显卡上,能在 1 秒内将 512×512 图像潜变量直接解码并放大到 2048×2048 像素,峰值显存为 13 GB。












