DeepSeek 公布多模态模型技术报告
该模型提出“基于视觉原语的思考”框架,将点、边界框等空间标记作为推理基本单元,使 AI 在空间参照任务中能进行精确推演。尽管模型规模紧凑,但在计数和空间推理基准测试上可与 GPT-5.4 等前...
OpenAI 将推出前沿网络安全模型 GPT-5.5-Cyber,暂不向公众开放
OpenAI 即将推出专为网络安全打造的 GPT-5.5-Cyber 模型,但不会面向公众开放,仅限经过筛选的“网络安全防护人员”使用。CEO 奥尔特曼表示将在未来数日内启动限量推送,并与行业及政府共同制定...
完全由 AI 生成:《任天堂明星大乱斗》PC 移植版问世
开发者利用 Opus 4.6、Opus 4.7 和 GPT 5.5 等 AI 模型,在 25 天内独立完成了初代《任天堂明星大乱斗》的 PC 原生移植项目。该项目不仅实现了更高分辨率等进阶功能,还验证了 AI 在特定开发任...
看穿大模型的“小心思”:阿里千问开源可解释性模块 Qwen-Scope
阿里千问推出 Qwen-Scope,通过稀疏自编码器(SAE)解析模型内部机制,不仅能分析行为,更能定向控制推理结果、优化数据合成与训练过程,甚至评估评测集冗余度。这标志着大模型可解释性从“事后...
AI 编程热潮推动 GitHub 爆发增长,平台频发故障后启动底层基础设施重构
AI 编程和智能体普及,让 GitHub 用户量和业务负载激增,平台稳定性频受挑战。官方承认,未来业务规模可能达到当前的 30 倍,正在重构底层架构、迁移至 Azure 并推进多云建设以应对。近期已发生...
腾讯混元开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,仅 440MB
腾讯混元开源了手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,将支持 33 种语言的翻译大模型压缩至仅 440MB,无需联网即可在手机本地运行,翻译质量宣称优于谷歌翻译。模型采用极致量化压缩技术,...












