2025年6月8日:面壁智能MiniCPM 4.0重磅发布,端侧大模型速度跃升220倍!
今日AI领域,面壁智能正式推出MiniCPM4.0系列端侧大模型,在速度、效能、性能及落地应用上均实现显著突破,极限情况下速度提升高达220倍,并成功适配Intel、高通、MTK、华为昇腾等主流芯片,为端侧AI带来强劲动力。
🚀 重磅发布:面壁智能MiniCPM 4.0端侧大模型,速度狂飙220倍!
6月6日,面壁智能(ModelBest)正式推出了其最新力作——MiniCPM4.0系列模型。这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现飞跃,更在技术创新上树立了新的标杆。该系列包含两款产品:8B闪电稀疏版和仅0.5B的轻巧灵动版。
🌟 核心亮点解析
- 极限速度突破:MiniCPM4.0实现了极限情况下220倍、常规5倍的速度提升。这得益于系统级稀疏创新的层层加速,通过高效双频换挡技术,模型能根据文本长度自动切换稀疏与稠密注意力机制,大幅减少端侧存储需求(相较于同类模型Qwen3-8B,仅需1/4的缓存存储空间)。
- 高效能架构:贡献了行业首例全开源的系统级上下文稀疏化高效创新,以5%的极高稀疏度实现极限加速。通过自研创新技术,从架构层、系统层、推理层到数据层进行全面优化,真正做到系统级软硬件稀疏化高效落地。
- “以小博大”性能优势:
- 0.5B版本:仅以2.7%的训练开销便达到了一半参数、性能翻倍的效果。
- 8B稀疏版:以22%的训练开销对标并超越Qwen3及Gemma312B,巩固了其在端侧领域的领先地位。
- 强大落地应用:通过自研CPM.cu极速端侧推理框架,结合投机采样创新、模型压缩量化创新及端侧部署框架创新,实现了模型瘦身90%的同时极致提升速度,确保端侧推理丝滑体验。
- 广泛芯片适配:目前已成功适配Intel、高通、MTK、华为昇腾等主流芯片,并在多个开源框架上实现部署,进一步拓展了其应用潜力。

此项发布无疑为端侧AI的发展注入了强劲动力,预示着未来更多智能应用有望在轻量级设备上高效运行。