2025年6月13日:AI工具链效能升级,大模型应用持续深化
今日AI领域更新频繁,ChatGPT Projects及GPTs能力显著增强,字节跳动AI IDE月活用户破百万。此外,谷歌将Imagen 4集成至Gemini,腾讯预告开源新3D模型,多款创新AI应用亮相,提升生产力。
今日AI领域动态频频,围绕大模型应用与效率工具的升级成为焦点。从平台功能增强到垂直领域创新应用,再到核心基础设施进展,无不彰显AI技术正在以前所未有的速度融入我们的工作与生活。
OpenAI:ChatGPT Projects 功能大升级 & GPTs 支持模型选择

据 imxiaohu 和 op7418 消息,ChatGPT Projects 功能近期迎来全面升级,现在支持深度研究、语音模式,并显著改进了记忆功能,可在项目中引用过去的聊天记录。用户可在移动设备上上传文件,并自由切换模型来指定回答。此外,任意聊天可从侧边栏菜单转换为项目,或直接将聊天拖入项目文件夹,并能从项目中生成独立聊天的分享链接,便于协作与引用。同时,imxiaohu 还指出,GPTs 已正式支持模型选择,允许创建者根据不同用途(如行业、性能需求)微调GPTs表现。值得注意的是,无自定义 Action 的GPT可选择任意模型,而有自定义 Action 的GPT目前仅支持GPT-4o与GPT-4.1。
一句话点评: 这些更新极大地提升了ChatGPT作为生产力工具的实用性与灵活性,尤其Project功能在复杂任务管理和团队协作中的潜力值得期待,而GPTs的模型选择自由度则赋予开发者更大的定制空间。
字节跳动:AI IDE Trae 月活用户破百万

据 imxiaohu 报道,在火山引擎FORCE原动力大会上,字节跳动技术副总裁洪定坤透露,旗下AI IDE工具Trae的月活用户已超过100万。Trae于今年1月19日正式发布,3月推出国内版,发展速度迅猛。该报道认为,AI编码工具作为深入开发者日常工作链条的生产力工具,正在成为第一个真正全面落地的AI应用,其“用完即弃”的特性与传统“AI爆款”形成鲜明对比,显示出极强的用户粘性和付费意愿。
一句话点评: Trae的成功证明了AI编码工具作为真正的“刚需工作流”应用,其市场潜力巨大,预示着AI在软件开发领域的深度渗透正加速改变行业生态。
谷歌:Imagen 4 图像生成功能集成至 Gemini

据 imxiaohu 消息,谷歌的Imagen 4图像生成功能已正式登陆Gemini平台,用户现在可以直接在聊天对话中通过提示词生成高质量图像。
一句话点评: 将先进的图像生成能力直接嵌入对话式AI,将极大地简化用户创作流程,降低AIGC门槛,赋能更多创意应用场景。
纳米AI:超级搜索智能体重大更新,支持多模态生成与MCP工具融合

根据 op7418 和 imxiaohu 的信息,纳米AI近期对其超级搜索智能体进行了重大更新。新版本支持多模态结果生成,包括PPT、PDF报告、网页和视频等。它还增强了医学科研等多领域的专业搜索能力,并将MCP服务(如小红书、淘宝、高德地图调用)直接植入到超级搜索中。其中,视频生成能力尤为突出,用户只需一句提示词即可生成完整视频,系统会自动生成口播稿和分镜规划,并自动整合图片、音频、视频。新版本在稳定性和成功率上也有显著提升。
一句话点评: 纳米AI的更新展示了搜索与多模态生成能力的深度融合,将传统的“搜索框”升级为多功能任务处理中心,大幅提高了信息获取和内容创作的效率。
腾讯:预告开源全新3D模型

据 imxiaohu 透露,腾讯将于今晚开源一个新的3D模型,并预告其效果非常出色。
一句话点评: 腾讯在3D模型领域的开源举动,有望进一步推动相关技术的发展与应用,尤其在元宇宙、游戏和虚拟现实等领域带来新的突破。
AI应用组合:大模型辅助产品原型与网页生成工作流

vista8 分享了一个利用AI工具组合进行产品原型和网页生成的高效工作流:首先利用元提示词生成AI辅助阅读竞品调研的提示词,然后将竞品分析提示词发送给Skywork或谷歌DS进行分析,将生成结果输出为PRD(产品需求文档),最后使用高保真原型生成提示词,将PRD转化为网页。此方法能有效提高产品设计和开发效率。
一句话点评: 这套AI驱动的工作流为产品经理和设计师提供了全新的提效范式,通过精妙的提示词工程和多模型协作,将创意快速转化为可交互的原型和网页,是未来产品开发的重要趋势。
阿里:手机端3D数字人应用 MNN TaoAvatar 发布

据 aigclink 消息,阿里发布了一款可在手机上运行的3D数字人应用MNN TaoAvatar,可用于虚拟客服、虚拟主播等场景,并支持实时渲染。该应用的核心特点是完全离线、本地运行,所有功能如ASR(自动语音识别)、TTS(文本转语音)、A2BS(音频到面部表情和身体动作)、NNR(神经渲染)以及LLM(大语言模型)均在本地运行,对设备有一定要求。目前支持Android系统,iOS版本后续上线。
一句话点评: 阿里将3D数字人及大模型能力下沉至移动端本地运行,标志着AI应用从云端向边缘计算的进一步拓展,有望开启更广泛的离线AI应用场景。
v0 dev:推出“设计模式”在线网页编辑功能
据 dotey 报道,v0 dev 推出了全新的“设计模式”(Design Mode),这是一种在线网页编辑功能,允许用户直接对AI生成的UI进行手动调整,从而减少与大语言模型(LLM)的交互。该功能支持快速调整文案、字体排版、页面布局、配色风格等,提供实时预览,且无需消耗积分或等待LLM响应。它原生支持Tailwind和shadcn,旨在提供更顺畅的设计体验。
一句话点评: “设计模式”体现了AI生成与人工精修的螺旋式上升融合,在提升AI效率的同时,仍保留了设计师对细节的最终掌控权,是实现AI辅助设计走向成熟的关键一步。
Joinly:AI赋能智能视频会议助手

据 aigclink 介绍,Joinly是一款赋能AI成为智能视频会议助手的工具。在线会议时,AI助手可以帮助用户搜索信息、做会议纪要,甚至进行实时翻译。它支持AI会议助手通过语音或聊天与与会者实时互动,即时响应,并能处理会议中断和多人对话。Joinly兼容Google Meet、Zoom、Microsoft Teams以及任何基于浏览器的会议平台。
一句话点评: Joinly通过AI技术大幅提升了在线会议的效率和协作体验,将AI从辅助记录升级为智能交互伙伴,是未来智能办公的缩影。
英伟达:发布全新 NVL72 系统,连接72个Blackwell GPU

imxiaohu 提到,英伟达发布了全新的NVL72系统,该系统能够连接72个Blackwell GPU,并提供高达130 TB/s的带宽。
一句话点评: 英伟达NVL72系统再次刷新了AI计算集群的性能上限,其惊人的互联带宽预示着未来超大规模AI模型训练和部署将迎来更高效率的硬件支撑。
云服务故障:GCP/Cloudflare 故障影响OpenAI及其他服务
据 dotey 报道,GCP(谷歌云平台)和Cloudflare同时出现了重大故障,并影响到了OpenAI及其他众多依赖这些云服务的平台。
一句话点评: 此次大面积云服务故障再次提醒我们,AI基础设施的稳定性至关重要,中心化计算带来的效率优势也伴随着潜在的单点故障风险。