2025年5月29日：AI芯片市场新局，大模型开源潮涌，应用加速落地

今日AI领域动态聚焦芯片与模型发展：英伟达AMD加速推出合规AI芯片，DeepSeek新版本性能直逼OpenAI顶尖模型。同时，Meta AI用户破10亿，字节、百度等巨头纷纷发布新应用，AI聊天模型可靠性研究引深思，行业竞争与技术伦理挑战并存。

🚀 市场动态与政策影响

1. 英伟达、AMD「新款降规AI芯片」呼之欲出，中国市场迎新机遇 芯片供应链透露，英伟达和AMD正迅速调整设计，预计2025年7月起，将推出新一波合规、可销售往中国的AI GPU。英伟达暂定新品为B20，采用Blackwell架构，而AMD则以Radeon AI PRO R9700等抢占市场，专为AI工作站设计。此举显示两大芯片巨头对中国市场的高度重视，旨在合规前提下继续深耕。 来源：电子时报

2. 英伟达预计H20限售将造成80亿美元损失，黄仁勋谈中国AI发展 英伟达CEO黄仁勋在Q1财报会议上表示，美国出口管制规定对公司收入造成巨大损失，预计第二财季将损失80亿美元。但他强调，此规定并不能阻止中国AI发展，反而会刺激中国创新。英伟达Q1 H20芯片库存过剩产生45亿美元费用，若未受限制，本可额外实现25亿美元销售额。 来源：财联社 / 英伟达

3. 英伟达数据中心销售额激增73%，财报收益超预期 英伟达Q1财报显示，数据中心销售额激增73%，调整后每股收益和收入均超预期。公司预计本季度销售额约450亿美元。虽然出口限制带来损失，但整体业绩依然强劲，显示AI芯片需求持续旺盛。 来源：cnBeta.COM

4. 扎克伯格称Meta AI助手月活用户突破10亿 Meta首席执行官马克·扎克伯格在年度股东大会上宣布，Meta AI助手目前在公司应用系列中拥有10亿月度活跃用户。他表示，今年重点是将Meta AI打造成领先的个人AI，未来将探索付费推荐或订阅服务以提供更多计算能力。 来源：CNBC

5. Telegram与xAI达成3亿美元合作，Grok聊天机器人全面整合 Telegram与埃隆·马斯克旗下的xAI公司达成一年合作协议，xAI将支付3亿美元现金和股权，以在所有Telegram应用中集成Grok AI聊天机器人。Telegram还将获得通过该应用销售xAI订阅收入的50%。Grok将可固定在聊天窗口顶部，支持通过搜索栏提问，并提供撰写建议、总结聊天、创建贴纸等功能。 来源：TechCrunch / Solidot

6. 马斯克曾力阻OpenAI阿布扎比AI中心交易 OpenAI与其他美国科技巨头将与阿联酋G42公司合作，在阿布扎比建设大型AI数据中心。报道称，埃隆·马斯克曾向阿联酋方面施压，警告若xAI未能加入该项目，交易恐难获美国政府批准。尽管马斯克表达不满，特朗普政府最终仍批准了该合作协议。 来源：华尔街日报

7. 特斯拉或在6月12日于奥斯汀推出Robotaxi 知情人士透露，特斯拉计划在6月12日于奥斯汀推出自动驾驶出租车服务。马斯克此前曾表示服务将在6月底前启动。为此次发布做准备，特斯拉本周首次在奥斯汀的公共道路上无人驾驶测试车，一名工程师坐在乘客座上，车辆在无远程操控下自动驾驶。 来源：彭博社

💡 大模型技术突破与开源进展

1. DeepSeek-R1-0528震撼发布，性能直逼OpenAI o3，免费API已上线 DeepSeek平台低调发布R1模型的最新0528版本，引发业界震动。据初步测试，其性能在代码生成与推理能力上几乎与OpenAI最新的o3模型高配版本不相上下，并在减少模型幻觉问题上表现更谨慎。新版本支持高达128K token的超大上下文窗口，并已通过HuggingFace平台开源，OpenRouter也同步上线免费API版本。 来源：AIGC开放社区 / 开源地址 / OpenRouter

2. 蚂蚁集团开源Ming-lite-omni：首个媲美GPT-4o的开源多模态模型 蚂蚁集团旗下百灵大模型团队宣布将统一多模态大模型Ming-lite-omni进行全面开源。该模型基于MoE架构，拥有220亿总参数和30亿激活参数，号称首个在模态支持方面能够与GPT-4o相媲美的开源模型。目前模型权重和推理代码已开放。 来源：AI Base

3. Meta发布Multi-SpatialMLLM：引领多模态AI的空间理解革命 Meta的FAIR团队与香港中文大学联合推出Multi-SpatialMLLM模型，显著提升多模态大语言模型的空间理解能力。该模型整合深度感知、视觉对应和动态感知三大组件，克服了单帧图像分析的局限，并在MultiSPA基准测试中平均提升36%。 来源：AI Base

4. 通义实验室、北大发布新技术ZeroSearch，LLM检索成本降低88% 通义实验室和北京大学研究团队推出ZeroSearch框架，可在不需要真实搜索的情况下激活大语言模型的检索能力，训练成本降低88%。该技术通过引入LLM作为“模拟搜索引擎”，利用其预训练知识生成检索文档，避免了真实搜索的高成本和不稳定性。 来源：AI Base

5. 谷歌放大招！LMEval开源评测框架上线，AI模型比拼从此更透明 谷歌正式发布开源框架LMEval，旨在为大语言模型和多模态模型提供标准化的评测工具。该框架兼容谷歌、OpenAI、Anthropic等多个主流AI平台，支持文本、图像和代码等多领域评估，并能识别模型“规避策略”，推动AI评测规范化与透明化。 来源：AI Base

6. Resemble AI开源TTS Chatterbox，性能直逼超越ElevenLabs Resemble AI发布开源TTS模型Chatterbox，基于0.5B LLaMA架构，训练数据超50万小时，在盲测中63.75%听众偏好其语音输出，性能直逼甚至超越ElevenLabs。Chatterbox支持零样本语音克隆和情感夸张控制，并嵌入神经水印技术确保内容可追溯。 来源：AI Base

7. 新神器LocAgent发布，代码定位准确率高达92.7%，程序员的福音！ OpenHands、耶鲁大学、南加州大学和斯坦福大学研究团队联手推出LocAgent，一个专为代码定位设计的图索引大语言模型（LLM）代理框架。其代码定位准确率高达92.7%，通过将代码库解析成图结构，并提供工具接口供LLM Agent查询，显著提升了代码检索效率。 来源：AI Base

8. 慕尼黑初创公司Spaitial：用生成AI重塑3D空间的未来 慕尼黑初创公司Spaitial正在开发空间基础模型（SFM），旨在创建和理解三维环境，让AI具备对空间的物理理解。SFM能从文本或图像生成真实和想象的3D场景，已完成1300万美元种子轮融资，应用前景包括游戏、电影、AR/VR及工业模拟。 来源：AI Base

🛠️ AI 应用与生态建设

1. OpenAI放大招！图像生成API升级：实时流式预览+多轮编辑，MCP加持创作无界限 OpenAI图像生成API（Responses API）迎来重大更新，新增流式传输功能（实时预览）、多轮编辑（高保真修改），并与Model Context Protocol (MCP) 工具及实时网络数据搜索集成。这些新特性提升了图像生成效率，并为开发者提供了更灵活的创作方式。 来源：AI Base

2. 字节发布图像Agent“小云雀AI”，打造一键爆款创作神器 字节跳动推出全新图像Agent“小云雀AI”，一款智能创作工具。用户只需一句指令，即可主动思考、智能执行，快速生成爆款视频与图片，实现“灵感即所得，创作零门槛”。目前已上线安卓客户端，iOS版本预计6月发布。 来源：AI Base

3. MotionPro炸场！AI视频生成革命来袭，40ms一帧精准控制 AI领域迎来重大技术突破——MotionPro，一款图像到视频（I2V）生成设计的精密运动控制器正式亮相。通过创新的区域轨迹和运动掩码技术，实现了对物体和镜头运动的精细化控制，每帧画面在40毫秒内生成，为视频生成带来前所未有的灵活性和精确性。 来源：AI Base

4. 40毫秒生成一个世界！Odyssey AI交互视频引爆Web4.0，免费试玩让你秒变虚拟探险家 AI初创公司Odyssey推出突破性AI交互视频技术，以每40毫秒生成并流式传输一帧的速度，实现无需传统游戏引擎的实时互动体验。用户可通过键盘等与内容互动，探索AI生成的动态场景，被誉为“交互式视频”的开创者。 来源：AI Base

5. 百度上线AI志愿助手、高考大数据等系列AI产品，助力高考考生 距离2025年高考仅剩8天，百度推出系列AI工具。包括“高考高频考点库”汇集近三年核心考点，AI志愿助手升级可根据分数生成“冲稳保”志愿表，并开设“外援团”直播间，集结2000所高校智能体提供24小时在线答疑。 来源：AI Base

6. 全球首款AI代理浏览器Opera Neon发布，智能聊天与自动化任务引领Web4.0时代 Opera公司正式推出全新AI驱动的代理浏览器Opera Neon，开放Alpha版候补名单。该浏览器集成了智能聊天（Neon Chat）、任务自动化（Neon Do）和内容创作（Neon Make）等创新特性，旨在从被动工具向主动助手角色转变，开启Web4.0时代。 来源：AI Base

7. 可灵2.1重磅上线：价格降65%，性能显著提升 AI视频生成工具可灵2.1正式上线，在性能上显著提升的同时，价格大幅降低65%。新版本推出标准版、高品质版和大师版三个质量体系，满足不同需求，用户普遍表示其效果、速度与性价比均令人惊艳。 来源：AI Base

8. 理想汽车OTA7.4更新：全新MindGPT-4o-preview模型上线，智能座舱焕然一新 理想汽车于5月28日正式推出OTA7.4版本更新，首次上线自研MindGPT-4o-preview模型。此次升级带来全新智能座舱体验，理想同学形象升级为3D毛绒形象，音色更丰富，情感表达更人性化，并新增“小同桌”和“生活助手Agent”功能。 来源：AI Base

9. 谷歌相册推出全新AI驱动的图像编辑工具，十周年献礼 谷歌公司更新谷歌相册应用，推出重新设计的人工智能驱动编辑器。新工具提供AI建议，支持结合多种效果快速编辑，并能针对图像特定部分进行定制化建议。该功能首先向安卓用户推出，庆祝谷歌相册推出十周年。 来源：Macrumors

10. OpenAI探索用ChatGPT账号登录其他应用 OpenAI正在探索让用户使用ChatGPT账户登录第三方应用的方法，已在其开源终端人工智能编码工具Codex CLI中面向开发者提供“使用ChatGPT登录”的预览体验。此举意在将ChatGPT的登录服务与众多公司整合，构建更广泛的AI生态系统。 来源：TechCrunch

11. 全栈智能体Lemon AI横空出世：一键解锁多领域复杂任务 创新型全栈通用AI Agent——Lemon AI正式亮相，以其强大的自主性和工具调用能力，实现从任务需求到成果交付的全流程自动化。它集成自然语言处理、代码生成、网页浏览、API调用等多种功能，覆盖市场调研、金融分析、代码编程等广泛应用场景。 来源：AI Base

12. 字节推出全新AI剪辑应用“剪小映”，轻松记录生活瞬间 字节跳动发布名为“剪小映”的新应用，旨在为用户提供便捷高效的视频创作体验。该应用延续剪映易用性，并深度融入AI技术，借助火山引擎豆包大模型，用户无需专业技能即可生成高质量视频作品。 来源：AI Base

13. Anthropic表示，Claude的免费用户现在可以使用联网搜索 Anthropic宣布，其AI模型Claude的免费用户现在可以访问联网搜索功能，这意味着用户可以直接在免费版本中获得基于最新网络信息的回复。 来源：Twitter @AnthropicAI

14. v0推出GitHub同步功能，助力团队高效协作 v0官方宣布推出全新GitHub同步功能，允许用户直接从v0平台推送生成的代码至GitHub仓库，并自动检测代码更改，实现实时同步。用户还可在v0平台切换分支并创建拉取请求（PR），极大提升开发效率和团队协作能力。 来源：AI Base

15. 像素蛋糕“方糖大模型”成功获批，成国内影像行业首个备案图像大模型 像素蛋糕公司自主研发的“方糖大模型”正式通过国家网信办备案，成为国内影像行业首个获得官方资质的应用级图像大模型。这一成就标志着模型在技术和合规性上均达到国家标准，为影像行业提供高质量图像生成服务。 来源：AI Base

16. Creatify获1550万美元A轮融资，AI重新定义视频广告市场 视频广告AI平台Creatify成功获得1550万美元A轮融资，总融资达2300万美元。其新产品AdMax作为端到端AI广告代理，能自动化创意灵感、生产、测试和性能优化，已吸引超150万营销人员和10000多个团队使用，显示出强大的市场需求和增长潜力。 来源：AI Base

17. 开源+低成本！Paper2Poster让学术论文秒变学术海报 Paper2Poster是一款论文转多模态海报工具，通过自动化技术将PDF学术论文转化为视觉清晰、信息高效的PowerPoint格式海报。该工具能在数分钟内完成海报生成，成本低至0.005美元，并已开源至HuggingFace平台，极大降低学术传播门槛。 来源：AI Base

🤔 行业前瞻与挑战

1. AI聊天越久越“糊涂”：微软研究揭示语言模型可靠性骤降39% 微软和Salesforce联合研究发现，即使是最先进的AI语言模型在长时间对话中也会出现严重的可靠性问题。当用户逐步表达需求时，系统性能平均下降39%。研究识别出“过早结论”、“过度依赖历史”、“信息忽略”和“过度详述”四大核心问题，对AI助手的实际应用提出重要警示。 来源：AI Base

2. 先驱心理健康聊天机器人Woebot即将关闭 曾被誉为“治疗的未来”的先驱心理健康聊天机器人Woebot即将关闭。Woebot于2017年推出，并于2021年获得FDA突破性设备称号，但最终仍未能持续运营。这凸显了AI在心理健康领域商业化和用户接受度方面的挑战。 来源：cnBeta.COM

3. 智能AI助力打击恶意软件平台DanaBot网络犯罪源自俄罗斯的恶意软件平台DanaBot被成功打击，该平台已感染超30万系统，造成逾5000万美元损失。智能AI在DanaBot的拆解过程中发挥关键作用，将调查时间从数月缩短至数周，显示出AI在网络安全领域打击复杂威胁的强大能力。来源：AI Base