2025年6月27日:谷歌开源设备端多模态大模型,OpenAI布局推荐系统与高级研究
今日AI领域动态聚焦模型创新与应用。谷歌发布轻量级设备端多模态大模型Gemma 3n和虚拟试穿应用Doppl。Black Forest Labs开源高性能图像编辑模型FLUX.1 Kontext。OpenAI通过收购Crossing Minds强化推荐系统能力,并推出Deep Research API以支持复杂研究。
谷歌发布设备端多模态大模型Gemma 3n

据 aigclink 和 imxiaohu 消息,谷歌正式推出新一代开源轻量级多模态大模型Gemma 3n,专为移动端和边缘设备设计,最低仅需2GB RAM即可运行。该模型原生支持多模态输入,能够处理文本、图像、音频和视频,并且支持设备端函数调用。其E4B版本在LMArena基准测试中得分超过1300,成为首个参数低于100亿且达到此基准的模型。Gemma 3n优化了架构和MobileNet-V5视觉编码器,推理速度显著提升,同时在数学、编程和推理方面也进行了增强,支持140多种文本语言和35种语言的多模态理解。
**一句话点评:** Gemma 3n的发布标志着多模态AI在设备端部署方面迈出了重要一步,为AI应用的普及和本地化处理提供了强大的技术支持。
Black Forest Labs开源高性能图像编辑模型FLUX.1 Kontext [dev]

由 Black Forest Labs 宣布开源的图像编辑模型FLUX.1 Kontext [dev] 引发广泛关注。该模型拥有12B参数,能在消费级硬件上运行,其在图像编辑任务的多个基准上甚至超越了OpenAI的GPT-image-1。据 oran_ge 和 aigclink 报道,FLUX.1 Kontext专注于图像编辑,支持迭代编辑、角色保持、局部与全局精细控制,即使多次修改也能最大程度地减少视觉漂移和失真。该模型已开放权重以推动研究,并可与ComfyUI等流行工具无缝结合。此外,用户可在 Krea 平台上免费体验该模型。
**一句话点评:** FLUX.1 Kontext的开源为图像编辑领域带来了革命性的进步,其在消费级硬件上的高性能表现,预示着AI辅助设计和创作将变得更加普及和高效。
OpenAI 收购AI推荐系统公司Crossing Minds

据 imxiaohu 报道,OpenAI已宣布收购专注于AI推荐系统公司Crossing Minds,其整个团队已加入OpenAI。Crossing Minds致力于为电商平台开发基于用户行为数据的个性化推荐系统,尤其强调在不依赖用户身份信息的前提下理解用户偏好。分析人士指出,此次收购旨在增强OpenAI的实时推荐能力、抢占电子商务AI市场、加速AGI研发,并防范竞争对手的战略布局。其核心技术ICLERB能够支持大型语言模型的实时更新,将显著提升ChatGPT在电商和内容推荐场景中的表现。
**一句话点评:** OpenAI此举表明其正积极拓展AI应用的边界,通过整合推荐系统技术,有望为用户提供更智能、更个性化的AI体验,并加速其AGI愿景的实现。
谷歌推出手机虚拟试穿应用Doppl

据 aigclink 和 imxiaohu 消息,Google Labs刚刚发布了一款名为Doppl的手机虚拟试穿应用。用户可以通过上传个人照片或衣服截图,体验虚拟试穿效果,并且应用能够生成试穿视频,展示衣服的动态效果,让用户更真实感受“上身”效果。Doppl基于Google Shopping的虚拟试穿功能开发,并在此基础上增加了截图试穿功能,目前已在美国推出。
**一句话点评:** Doppl的推出展示了AI在消费级应用上的创新潜力,虚拟试穿技术将极大提升在线购物体验,为时尚电商带来新的增长点。
OpenAI API发布Deep Research API与新模型

imxiaohu 报道称,OpenAI API进行了一系列重大更新,推出了Deep Research API,并发布了两款新的专用模型:o3-Deep-Research (06-25)
和 o4 mini-Deep-Research (06-25)
。这两款模型专为高级研究任务设计,支持MCP(Model Context Protocol)、代码执行等高级功能,并能够从互联网或通过MCP引入的用户数据中合成信息,执行复杂的、多步骤的研究任务。
**一句话点评:** Deep Research API及新模型的发布,意味着OpenAI正在向更深层次、更复杂的自动化研究领域迈进,这对于科学探索、行业分析等领域将产生深远影响。
Claude Code使用技巧与GUI版本“Claudia”

关于Claude Code的使用,PMbackttfuture 分享了官方访谈中的关键技巧,包括在编码前要求Claude制定计划、使用.clauderc
作为记忆库,以及利用#
进入记忆模式。访谈还强调了理解模型局限性和快速迭代的重要性。针对命令行工具对普通用户不够友好的问题,oran_ge 推荐了一款GUI版本的Claude Code项目——Claudia,旨在为Cursor用户提供更舒适的迁移体验。Claudia具备项目与会话管理、自定义AI代理、用量分析仪表盘、MCP服务器管理以及会话时间线与检查点等功能。
**一句话点评:** AI编程工具正从命令行走向更易用的GUI界面,这不仅降低了开发者使用门槛,也通过集成高级功能,让AI编程助手真正成为生产力核心。
马斯克透露Grok 4计划:跳过3.5版本

据 op7418 消息,埃隆·马斯克表示,Grok 3.5版本已被取消,Grok 4将直接在7月4日之后发布。这一决定表明xAI正在加速其模型迭代,可能旨在更快地将更强大的功能推向市场。
**一句话点评:** 跳过中间版本直接发布Grok 4,预示着xAI对下一代模型的性能抱有极高信心,竞争AI大模型的军备竞赛仍在加速。