2025年5月29日:AI芯片市场新局,大模型开源潮涌,应用加速落地
今日AI领域动态聚焦芯片与模型发展:英伟达AMD加速推出合规AI芯片,DeepSeek新版本性能直逼OpenAI顶尖模型。同时,Meta AI用户破10亿,字节、百度等巨头纷纷发布新应用,AI聊天模型可靠性研究引深思,行业竞争与技术伦理挑战并存。
🚀 市场动态与政策影响
1. 英伟达、AMD「新款降规AI芯片」呼之欲出,中国市场迎新机遇 芯片供应链透露,英伟达和AMD正迅速调整设计,预计2025年7月起,将推出新一波合规、可销售往中国的AI GPU。英伟达暂定新品为B20,采用Blackwell架构,而AMD则以Radeon AI PRO R9700等抢占市场,专为AI工作站设计。此举显示两大芯片巨头对中国市场的高度重视,旨在合规前提下继续深耕。 来源:电子时报
2. 英伟达预计H20限售将造成80亿美元损失,黄仁勋谈中国AI发展 英伟达CEO黄仁勋在Q1财报会议上表示,美国出口管制规定对公司收入造成巨大损失,预计第二财季将损失80亿美元。但他强调,此规定并不能阻止中国AI发展,反而会刺激中国创新。英伟达Q1 H20芯片库存过剩产生45亿美元费用,若未受限制,本可额外实现25亿美元销售额。 来源:财联社 / 英伟达
3. 英伟达数据中心销售额激增73%,财报收益超预期 英伟达Q1财报显示,数据中心销售额激增73%,调整后每股收益和收入均超预期。公司预计本季度销售额约450亿美元。虽然出口限制带来损失,但整体业绩依然强劲,显示AI芯片需求持续旺盛。 来源:cnBeta.COM
4. 扎克伯格称Meta AI助手月活用户突破10亿 Meta首席执行官马克·扎克伯格在年度股东大会上宣布,Meta AI助手目前在公司应用系列中拥有10亿月度活跃用户。他表示,今年重点是将Meta AI打造成领先的个人AI,未来将探索付费推荐或订阅服务以提供更多计算能力。 来源:CNBC
5. Telegram与xAI达成3亿美元合作,Grok聊天机器人全面整合 Telegram与埃隆·马斯克旗下的xAI公司达成一年合作协议,xAI将支付3亿美元现金和股权,以在所有Telegram应用中集成Grok AI聊天机器人。Telegram还将获得通过该应用销售xAI订阅收入的50%。Grok将可固定在聊天窗口顶部,支持通过搜索栏提问,并提供撰写建议、总结聊天、创建贴纸等功能。 来源:TechCrunch / Solidot

6. 马斯克曾力阻OpenAI阿布扎比AI中心交易 OpenAI与其他美国科技巨头将与阿联酋G42公司合作,在阿布扎比建设大型AI数据中心。报道称,埃隆·马斯克曾向阿联酋方面施压,警告若xAI未能加入该项目,交易恐难获美国政府批准。尽管马斯克表达不满,特朗普政府最终仍批准了该合作协议。 来源:华尔街日报
7. 特斯拉或在6月12日于奥斯汀推出Robotaxi 知情人士透露,特斯拉计划在6月12日于奥斯汀推出自动驾驶出租车服务。马斯克此前曾表示服务将在6月底前启动。为此次发布做准备,特斯拉本周首次在奥斯汀的公共道路上无人驾驶测试车,一名工程师坐在乘客座上,车辆在无远程操控下自动驾驶。 来源:彭博社
💡 大模型技术突破与开源进展
1. DeepSeek-R1-0528震撼发布,性能直逼OpenAI o3,免费API已上线 DeepSeek平台低调发布R1模型的最新0528版本,引发业界震动。据初步测试,其性能在代码生成与推理能力上几乎与OpenAI最新的o3模型高配版本不相上下,并在减少模型幻觉问题上表现更谨慎。新版本支持高达128K token的超大上下文窗口,并已通过HuggingFace平台开源,OpenRouter也同步上线免费API版本。 来源:AIGC开放社区 / 开源地址 / OpenRouter

2. 蚂蚁集团开源Ming-lite-omni:首个媲美GPT-4o的开源多模态模型 蚂蚁集团旗下百灵大模型团队宣布将统一多模态大模型Ming-lite-omni进行全面开源。该模型基于MoE架构,拥有220亿总参数和30亿激活参数,号称首个在模态支持方面能够与GPT-4o相媲美的开源模型。目前模型权重和推理代码已开放。 来源:AI Base

3. Meta发布Multi-SpatialMLLM:引领多模态AI的空间理解革命 Meta的FAIR团队与香港中文大学联合推出Multi-SpatialMLLM模型,显著提升多模态大语言模型的空间理解能力。该模型整合深度感知、视觉对应和动态感知三大组件,克服了单帧图像分析的局限,并在MultiSPA基准测试中平均提升36%。 来源:AI Base

4. 通义实验室、北大发布新技术ZeroSearch,LLM检索成本降低88% 通义实验室和北京大学研究团队推出ZeroSearch框架,可在不需要真实搜索的情况下激活大语言模型的检索能力,训练成本降低88%。该技术通过引入LLM作为“模拟搜索引擎”,利用其预训练知识生成检索文档,避免了真实搜索的高成本和不稳定性。 来源:AI Base

5. 谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明 谷歌正式发布开源框架LMEval,旨在为大语言模型和多模态模型提供标准化的评测工具。该框架兼容谷歌、OpenAI、Anthropic等多个主流AI平台,支持文本、图像和代码等多领域评估,并能识别模型“规避策略”,推动AI评测规范化与透明化。 来源:AI Base

6. Resemble AI开源TTS Chatterbox,性能直逼超越ElevenLabs Resemble AI发布开源TTS模型Chatterbox,基于0.5B LLaMA架构,训练数据超50万小时,在盲测中63.75%听众偏好其语音输出,性能直逼甚至超越ElevenLabs。Chatterbox支持零样本语音克隆和情感夸张控制,并嵌入神经水印技术确保内容可追溯。 来源:AI Base
7. 新神器LocAgent发布,代码定位准确率高达92.7%,程序员的福音! OpenHands、耶鲁大学、南加州大学和斯坦福大学研究团队联手推出LocAgent,一个专为代码定位设计的图索引大语言模型(LLM)代理框架。其代码定位准确率高达92.7%,通过将代码库解析成图结构,并提供工具接口供LLM Agent查询,显著提升了代码检索效率。 来源:AI Base

8. 慕尼黑初创公司Spaitial:用生成AI重塑3D空间的未来 慕尼黑初创公司Spaitial正在开发空间基础模型(SFM),旨在创建和理解三维环境,让AI具备对空间的物理理解。SFM能从文本或图像生成真实和想象的3D场景,已完成1300万美元种子轮融资,应用前景包括游戏、电影、AR/VR及工业模拟。 来源:AI Base

🛠️ AI 应用与生态建设
1. OpenAI放大招!图像生成API升级:实时流式预览+多轮编辑,MCP加持创作无界限 OpenAI图像生成API(Responses API)迎来重大更新,新增流式传输功能(实时预览)、多轮编辑(高保真修改),并与Model Context Protocol (MCP) 工具及实时网络数据搜索集成。这些新特性提升了图像生成效率,并为开发者提供了更灵活的创作方式。 来源:AI Base

2. 字节发布图像Agent“小云雀AI”,打造一键爆款创作神器 字节跳动推出全新图像Agent“小云雀AI”,一款智能创作工具。用户只需一句指令,即可主动思考、智能执行,快速生成爆款视频与图片,实现“灵感即所得,创作零门槛”。目前已上线安卓客户端,iOS版本预计6月发布。 来源:AI Base
3. MotionPro炸场!AI视频生成革命来袭,40ms一帧精准控制 AI领域迎来重大技术突破——MotionPro,一款图像到视频(I2V)生成设计的精密运动控制器正式亮相。通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,每帧画面在40毫秒内生成,为视频生成带来前所未有的灵活性和精确性。 来源:AI Base

4. 40毫秒生成一个世界!Odyssey AI交互视频引爆Web4.0,免费试玩让你秒变虚拟探险家 AI初创公司Odyssey推出突破性AI交互视频技术,以每40毫秒生成并流式传输一帧的速度,实现无需传统游戏引擎的实时互动体验。用户可通过键盘等与内容互动,探索AI生成的动态场景,被誉为“交互式视频”的开创者。 来源:AI Base

5. 百度上线AI志愿助手、高考大数据等系列AI产品,助力高考考生 距离2025年高考仅剩8天,百度推出系列AI工具。包括“高考高频考点库”汇集近三年核心考点,AI志愿助手升级可根据分数生成“冲稳保”志愿表,并开设“外援团”直播间,集结2000所高校智能体提供24小时在线答疑。 来源:AI Base

6. 全球首款AI代理浏览器Opera Neon发布,智能聊天与自动化任务引领Web4.0时代 Opera公司正式推出全新AI驱动的代理浏览器Opera Neon,开放Alpha版候补名单。该浏览器集成了智能聊天(Neon Chat)、任务自动化(Neon Do)和内容创作(Neon Make)等创新特性,旨在从被动工具向主动助手角色转变,开启Web4.0时代。 来源:AI Base

7. 可灵2.1重磅上线:价格降65%,性能显著提升 AI视频生成工具可灵2.1正式上线,在性能上显著提升的同时,价格大幅降低65%。新版本推出标准版、高品质版和大师版三个质量体系,满足不同需求,用户普遍表示其效果、速度与性价比均令人惊艳。 来源:AI Base

8. 理想汽车OTA7.4更新:全新MindGPT-4o-preview模型上线,智能座舱焕然一新 理想汽车于5月28日正式推出OTA7.4版本更新,首次上线自研MindGPT-4o-preview模型。此次升级带来全新智能座舱体验,理想同学形象升级为3D毛绒形象,音色更丰富,情感表达更人性化,并新增“小同桌”和“生活助手Agent”功能。 来源:AI Base

9. 谷歌相册推出全新AI驱动的图像编辑工具,十周年献礼 谷歌公司更新谷歌相册应用,推出重新设计的人工智能驱动编辑器。新工具提供AI建议,支持结合多种效果快速编辑,并能针对图像特定部分进行定制化建议。该功能首先向安卓用户推出,庆祝谷歌相册推出十周年。 来源:Macrumors
10. OpenAI探索用ChatGPT账号登录其他应用 OpenAI正在探索让用户使用ChatGPT账户登录第三方应用的方法,已在其开源终端人工智能编码工具Codex CLI中面向开发者提供“使用ChatGPT登录”的预览体验。此举意在将ChatGPT的登录服务与众多公司整合,构建更广泛的AI生态系统。 来源:TechCrunch
11. 全栈智能体Lemon AI横空出世:一键解锁多领域复杂任务 创新型全栈通用AI Agent——Lemon AI正式亮相,以其强大的自主性和工具调用能力,实现从任务需求到成果交付的全流程自动化。它集成自然语言处理、代码生成、网页浏览、API调用等多种功能,覆盖市场调研、金融分析、代码编程等广泛应用场景。 来源:AI Base

12. 字节推出全新AI剪辑应用“剪小映”,轻松记录生活瞬间 字节跳动发布名为“剪小映”的新应用,旨在为用户提供便捷高效的视频创作体验。该应用延续剪映易用性,并深度融入AI技术,借助火山引擎豆包大模型,用户无需专业技能即可生成高质量视频作品。 来源:AI Base

13. Anthropic表示,Claude的免费用户现在可以使用联网搜索 Anthropic宣布,其AI模型Claude的免费用户现在可以访问联网搜索功能,这意味着用户可以直接在免费版本中获得基于最新网络信息的回复。 来源:Twitter @AnthropicAI
14. v0推出GitHub同步功能,助力团队高效协作 v0官方宣布推出全新GitHub同步功能,允许用户直接从v0平台推送生成的代码至GitHub仓库,并自动检测代码更改,实现实时同步。用户还可在v0平台切换分支并创建拉取请求(PR),极大提升开发效率和团队协作能力。 来源:AI Base
15. 像素蛋糕“方糖大模型”成功获批,成国内影像行业首个备案图像大模型 像素蛋糕公司自主研发的“方糖大模型”正式通过国家网信办备案,成为国内影像行业首个获得官方资质的应用级图像大模型。这一成就标志着模型在技术和合规性上均达到国家标准,为影像行业提供高质量图像生成服务。 来源:AI Base

16. Creatify获1550万美元A轮融资,AI重新定义视频广告市场 视频广告AI平台Creatify成功获得1550万美元A轮融资,总融资达2300万美元。其新产品AdMax作为端到端AI广告代理,能自动化创意灵感、生产、测试和性能优化,已吸引超150万营销人员和10000多个团队使用,显示出强大的市场需求和增长潜力。 来源:AI Base

17. 开源+低成本!Paper2Poster让学术论文秒变学术海报 Paper2Poster是一款论文转多模态海报工具,通过自动化技术将PDF学术论文转化为视觉清晰、信息高效的PowerPoint格式海报。该工具能在数分钟内完成海报生成,成本低至0.005美元,并已开源至HuggingFace平台,极大降低学术传播门槛。 来源:AI Base

🤔 行业前瞻与挑战
1. AI聊天越久越“糊涂”:微软研究揭示语言模型可靠性骤降39% 微软和Salesforce联合研究发现,即使是最先进的AI语言模型在长时间对话中也会出现严重的可靠性问题。当用户逐步表达需求时,系统性能平均下降39%。研究识别出“过早结论”、“过度依赖历史”、“信息忽略”和“过度详述”四大核心问题,对AI助手的实际应用提出重要警示。 来源:AI Base

2. 先驱心理健康聊天机器人Woebot即将关闭 曾被誉为“治疗的未来”的先驱心理健康聊天机器人Woebot即将关闭。Woebot于2017年推出,并于2021年获得FDA突破性设备称号,但最终仍未能持续运营。这凸显了AI在心理健康领域商业化和用户接受度方面的挑战。 来源:cnBeta.COM

3. 智能AI助力打击恶意软件平台DanaBot网络犯罪
源自俄罗斯的恶意软件平台DanaBot被成功打击,该平台已感染超30万系统,造成逾5000万美元损失。智能AI在DanaBot的拆解过程中发挥关键作用,将调查时间从数月缩短至数周,显示出AI在网络安全领域打击复杂威胁的强大能力。
来源:AI Base

