大模型 第2页
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上五猫网 - AI工具、API服务与独立产品开发五猫网

面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

面壁智能今日联合清华大学、 OpenBMB 开源社区正式发布并开源最新一代端侧文本基座大模型 ——MiniCPM5-1B。
沁沧实习的头像五猫网 - AI工具、API服务与独立产品开发五猫网沁沧实习25天前
207
看穿大模型的“小心思”:阿里千问开源可解释性模块 Qwen-Scope五猫网 - AI工具、API服务与独立产品开发五猫网

看穿大模型的“小心思”:阿里千问开源可解释性模块 Qwen-Scope

阿里千问推出 Qwen-Scope,通过稀疏自编码器(SAE)解析模型内部机制,不仅能分析行为,更能定向控制推理结果、优化数据合成与训练过程,甚至评估评测集冗余度。这标志着大模型可解释性从“事后...