排序
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上
面壁智能今日联合清华大学、 OpenBMB 开源社区正式发布并开源最新一代端侧文本基座大模型 ——MiniCPM5-1B。
看穿大模型的“小心思”:阿里千问开源可解释性模块 Qwen-Scope
阿里千问推出 Qwen-Scope,通过稀疏自编码器(SAE)解析模型内部机制,不仅能分析行为,更能定向控制推理结果、优化数据合成与训练过程,甚至评估评测集冗余度。这标志着大模型可解释性从“事后...



