2025年6月8日：面壁智能MiniCPM 4.0重磅发布，端侧大模型速度跃升220倍！

今日AI领域，面壁智能正式推出MiniCPM4.0系列端侧大模型，在速度、效能、性能及落地应用上均实现显著突破，极限情况下速度提升高达220倍，并成功适配Intel、高通、MTK、华为昇腾等主流芯片，为端侧AI带来强劲动力。

🚀 重磅发布：面壁智能MiniCPM 4.0端侧大模型，速度狂飙220倍！

6月6日，面壁智能（ModelBest）正式推出了其最新力作——MiniCPM4.0系列模型。这一系列被誉为“有史以来最具想象力的小钢炮”，不仅在端侧性能上实现飞跃，更在技术创新上树立了新的标杆。该系列包含两款产品：8B闪电稀疏版和仅0.5B的轻巧灵动版。

极限速度突破：MiniCPM4.0实现了极限情况下220倍、常规5倍的速度提升。这得益于系统级稀疏创新的层层加速，通过高效双频换挡技术，模型能根据文本长度自动切换稀疏与稠密注意力机制，大幅减少端侧存储需求（相较于同类模型Qwen3-8B，仅需1/4的缓存存储空间）。
高效能架构：贡献了行业首例全开源的系统级上下文稀疏化高效创新，以5%的极高稀疏度实现极限加速。通过自研创新技术，从架构层、系统层、推理层到数据层进行全面优化，真正做到系统级软硬件稀疏化高效落地。
“以小博大”性能优势：
- 0.5B版本：仅以2.7%的训练开销便达到了一半参数、性能翻倍的效果。
- 8B稀疏版：以22%的训练开销对标并超越Qwen3及Gemma312B，巩固了其在端侧领域的领先地位。
强大落地应用：通过自研CPM.cu极速端侧推理框架，结合投机采样创新、模型压缩量化创新及端侧部署框架创新，实现了模型瘦身90%的同时极致提升速度，确保端侧推理丝滑体验。
广泛芯片适配：目前已成功适配Intel、高通、MTK、华为昇腾等主流芯片，并在多个开源框架上实现部署，进一步拓展了其应用潜力。

此项发布无疑为端侧AI的发展注入了强劲动力，预示着未来更多智能应用有望在轻量级设备上高效运行。