2025年6月6日:AI巨头人才争夺升级,全球政策与技术应用齐头并进
今日AI领域风云变幻,人才争夺战愈演愈烈,多国加强AI技术监管与出口管制。同时,AI模型和应用迎来多项突破性进展,从智能编程到机器人具身智能,再到多模态内容创作,AI正加速赋能千行百业。
🌟 重磅消息
联邦法官考虑限制谷歌垄断,或影响AI技术
美国华盛顿联邦法院正审理一起针对谷歌的反垄断案,法官阿米特·梅赫塔(Amit Mehta)将决定是否拆分这家科技巨头,并考虑对谷歌在人工智能领域的优势施加限制。此案结果预计在8月裁决,将对互联网未来竞争格局和AI技术监管产生深远影响。 来源: AI Base

OpenAI:部分滥用行为可能源自中国
OpenAI发布最新报告称,其已挫败多起可能源自中国的、利用AI模型进行网络威胁和秘密影响力活动的企图。报告提及的10个样本案例中,有4个可能源自中国,包括使用ChatGPT生成社交媒体帖子的行为。 来源: 华尔街日报
Anthropic与OpenAI“抢人大战”升级:切断Windsurf访问
在传出OpenAI正准备以30亿美元收购AI编程助手Windsurf后,Anthropic迅速切断了Windsurf对其大模型Claude 3.5 Sonnet和Claude 3.7 Sonnet的访问权限。Anthropic联合创始人Jared Kaplan表示,将Claude出售给OpenAI使用会“显得很奇怪”,公司希望将有限的计算能力保留给长期合作伙伴。 来源: 奇客 | Techcrunch
AI人才争夺白热化:OpenAI千万美元挽留顶级研究员
据路透社报道,为阻止部分顶级研究员跳槽到Ilya Sutskever新创办的SSI公司,OpenAI开出了200万美元的留任奖金,并承诺提供2000万美元以上的股票期权。部分员工只需继续工作一年即可获得全部奖金。 来源: Twitter @小互

美国呼吁更严格执行对华出口管制
美国商务部长霍华德·卢特尼克呼吁加强对美国出口管制的执行,以防止中国窃取可能支持北京在人工智能和航空等领域雄心的关键美国技术。他强调,在AI霸权的竞争中,中国正试图通过与中央政府合作赶超美国。 来源: 彭博社
华为AI芯片遭遇挑战:过热与CUDA生态问题阻碍市场份额
多种因素导致华为昇腾910C GPU在市场上面临较大阻力。字节跳动、阿里巴巴和腾讯等中国科技巨头尚未大批量订购华为AI芯片。主要原因包括中国科技公司在CUDA生态系统中的巨额投入、华为芯片的周期性过热问题,以及美国出口管制的影响。 来源: The Information
Anysphere估值99亿美元,Cursor融资9亿美元
AI编程助手Cursor的开发商Anysphere公司成功筹集9亿美元资金,使其估值高达99亿美元。该公司年化收入(ARR)已超过5亿美元,在短短一年内实现了惊人的增长。Anysphere已开始向企业提供许可,并拒绝了OpenAI等公司的收购邀请。 来源: AI Base

🚀 AI模型与技术突破
谷歌Gemini 2.5 Pro升级预览版发布:编码性能显著提升
谷歌推出了Gemini 2.5 Pro的升级预览版,该版本在LMArena基准测试中得分跃升24分,WebDevArena提升35分,在编码能力上超越了OpenAI的o3、o3-mini,Anthropic的Claude4Opus以及xAI的Grok3Beta和DeepSeek R1等竞争对手。新版本还优化了行文风格与结构,支持思考预算功能。 来源: AI Base

智源研究院发布“悟界”系列大模型,加速物理AGI进程
第七届“北京智源大会”上,智源研究院发布“悟界”系列大模型,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体的具身大小脑协作框架RoboOS2.0和具身大脑RoboBrain2.0,以及全原子微观生命模型OpenComplex2。这些模型旨在突破虚实边界,赋能物理世界,推动物理通用人工智能(AGI)发展。 来源: AI Base | AI Base

阿里开源千问3向量模型:性能超越谷歌和OpenAI
阿里巴巴正式开源全新的千问3向量模型系列——Qwen3-Embedding。该模型在文本检索、聚类和分类等任务上性能提升超过40%,在MTEB等专业榜单中超越了谷歌Gemini Embedding和OpenAI text-embedding-3-large等模型,达到同类模型的最佳性能(SOTA)。它支持超过100种语言,包括编程语言。 来源: AI Base

ElevenLabs推出V3声音模型:70多种语言,可控情感语气
ElevenLabs正式发布全新文本转语音模型Eleven v3(Alpha版)。该模型支持70多种语言,能够处理多角色对话场景,并新增音频标签功能,允许用户通过[sad]
、[angry]
、[whispers]
等标签精确控制语音的情感表达和非语言反应。
来源: AI Base
字节跳动发布图像编辑模型SeedEdit 3.0:细节保持能力大幅提升
字节跳动Seed团队正式发布图像编辑模型SeedEdit3.0,该版本在图像主体保持、背景细节处理和指令遵循等方面取得显著进步。模型能够处理并生成4K分辨率图像,在人像编辑、背景更改、视角与光线转换等复杂场景中表现出色。 来源: AI Base

OpenAudio发布开源TTS模型S1-Mini:0.5B参数打造超自然AI语音
Fish Audio开源其全新文本转语音(TTS)模型OpenAudio S1-Mini。作为S1模型的精简版,S1-Mini仅包含0.5B参数,轻量化设计适用于资源受限环境。它基于200万小时音频数据集训练,支持14种语言及50多种情感和语调,能生成接近真人的自然发音。 来源: AI Base

🌐 AI应用与产业动态
Perplexity搜索查询量激增,新推SEC数据集成
AI搜索引擎Perplexity上个月(五月)收到了7.8亿次搜索查询,月增长率超过20%。同时,Perplexity AI宣布推出SEC(证券交易)文件访问功能,用户可直接查询财务文档并获取附带引用的自然语言答案,旨在简化复杂财务信息获取。 来源: Techcrunch | AI Base
微软与OpenAI合作持续加深,未来前景广阔
微软CEO萨提亚·纳德拉重申了微软与OpenAI的紧密合作关系,指出微软已向OpenAI投资数十亿美元,并全面整合其技术到各类产品中,从而获得收入分成。他表示,尽管OpenAI未来可能与更多伙伴合作,但与微软的长期协作关系将保持稳定。 来源: AI Base

AMD收购Brium,向英伟达发起AI硬件挑战
半导体巨头AMD宣布收购AI软件优化初创公司Brium。Brium专注于在多种硬件架构上优化AI推理能力。此次收购是AMD两年内的第四次战略收购,旨在推动其构建高性能、开放的AI软件生态系统,打破市场对英伟达硬件的过度依赖。 来源: AI Base

亚马逊加大AI投入,提升仓库自动化与同日送达效率
亚马逊正加速推进人工智能在物流和仓储系统中的应用。公司将成立专门团队研发新型“代理式人工智能”仓库机器人,能够听懂并执行自然语言指令。此外,亚马逊还将利用生成式AI为送货司机创建更先进的地图,并开发智能眼镜辅助导航。 来源: AI Base

博世携手阿里云,3D数字人助力智能座舱新体验
德国科技巨头博世与阿里云合作,共同推动通义大模型在智能座舱领域的应用。该方案利用通义大模型实时感知座舱环境,自动调整车内氛围,并实现与3D数字人的交互,支持知识问答和同声传译,旨在提供更自然、个性化的驾驶体验。 来源: AI Base
OpenAI学院首次国际落地:与印度政府启动AI教育合作
OpenAI与印度电子和信息技术部下属的人工智能任务组(IndiaAI)正式宣布启动“OpenAI学院印度分院”。该合作旨在扩大AI在印度的普及和技能培训,面向学生、开发者、教育者等多类群体,提供线上线下混合教学,并支持多语言。 来源: AI Base

英国科技职位空缺仍上涨21%,AI人才需求旺盛
尽管对AI导致裁员的担忧普遍存在,英国科技职位空缺仍同比增长21%。其中,对拥有AI技能人才的需求更是同比增长200%。伦敦占据了英国近三分之二的科技职位空缺,并满足了80%的需求。 来源: cnBeta.COM中文业界资讯站

X禁止第三方使用其数据训练AI,或开辟新收入来源
埃隆·马斯克的X(前身为Twitter)更新开发者协议,禁止第三方使用其用户内容训练AI模型。此举可能是为了保护Musk旗下的xAI公司及其Grok聊天机器人的竞争优势。X或将效仿Reddit,通过向第三方授权内容开辟新的收入来源。 来源: PCMag.com
谷歌重磅新作Portraits:与虚拟专家对话学习沟通与领导力
谷歌推出创新AI产品Portraits,允许用户与预设的虚拟专家进行实时互动,学习专业领域的知识与技能。首批虚拟专家专注于教授沟通技巧与领导力内容。该产品通过沉浸式对话学习体验,旨在提供个性化、交互式的学习方式。 来源: AI Base

Figma推出新工具,助力AI更精准地转换设计为代码
Figma发布全新开发者工具“开发模式模型上下文协议(MCP)服务器”,使AI模型能够直接访问Figma中的设计数据,从而更有效地将设计转化为完整的编码应用。这将减少LLM的使用,降低AI编码工具的工作量,提升开发效率。 来源: AI Base

AI驱动本地视频编辑工具Diffusion Studio Pro亮相
AI驱动的视频编辑工具Diffusion Studio Pro正式发布,号称“CapCut + Cursor”结合。该工具以本地优先、浏览器为基础的非线性编辑体验,集成超过16种生成式AI模型,支持智能代理侧边栏、视觉构图反馈,旨在为专业视频创作者和开发者提供强大支持。 来源: AI Base
PixVerse国内版“拍我AI”正式发布,解锁AI视频创作新玩法
备受海外追捧的AI视频生成平台PixVerse正式推出国内版本“拍我AI”,并同步上线移动端App和网页版。该产品继承了PixVerse的V4.5版本算法,允许用户通过简单的文本或图像输入快速生成高质量视频内容,支持多种风格。 来源: AI Base

Thrive Holdings投资1亿美元打造AI驱动IT服务新平台
Thrive Holdings与ZBS Partners携手投资1亿美元,打造名为Shield Technology Partners的全新平台,旨在将AI技术引入IT服务行业。该实体已收购四家IT服务公司,计划利用AI代理提升IT服务效率与服务质量。 来源: AI Base

Snap推出Lens Studio iOS和网页应用,简化AR镜头创作流程
Snap公司推出全新的Lens Studio iOS应用和网页工具,旨在让更多人轻松创建增强现实(AR)镜头。用户可以通过文本提示和简单编辑工具快速生成AI效果、添加Bitmoji形象,并浏览流行模板。 来源: AI Base

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理
Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线,允许用户通过自然语言提出数据分析问题。 来源: AI Base

Aibidia获2800万美元B轮融资,携AI税务科技进军美国市场
芬兰金融科技公司Aibidia成功获得2800万美元B轮融资,将用于扩大其面向美国市场的AI驱动税务技术平台。Aibidia平台自动化并优化全球转让定价和税务合规流程,帮助跨国公司应对国际税法的复杂性。 来源: AI Base

Alphabet CEO驳斥“AI取代人类”论,称AGI之路仍存不确定性
Alphabet首席执行官桑达尔·皮查伊在接受采访时,驳斥了AI将导致大规模裁员的担忧,强调AI将继续推动Alphabet增长,帮助工程师减少繁琐事务。他同时指出,AGI(通用人工智能)之路仍存在许多不确定性,科技发展并非线性。 来源: AI Base

宇树科技CEO王兴兴:让机器人干活才是终极目标
在第七届北京智源大会上,宇树科技CEO王兴兴表示,公司始终坚持的终极目标是让机器人“干活”,无论是在家庭场景还是工业应用中。他指出,跳舞、格斗等具身智能展示,实则是在训练和测试机器人对复杂动作的掌控力,为未来服务场景做准备。 来源: AI Base

Figure机器人展示惊人灵活性
小互分享了一段Figure机器人视频,称视频似乎是1倍速,并没有加速,展现了Figure机器人相当灵活的姿态。 来源: Twitter @小互
Claude聊天机器人升级:新检索模式助力内容管理
AI初创公司Anthropic的Claude聊天机器人即将迎来重要升级,新的“检索”模式将使其在“项目”功能中处理内容的能力提高十倍。即使超过常规内容限制,聊天机器人也能自动切换到新的检索模式,扩展其记忆存储,提升应对复杂任务的能力。 来源: AI Base
Higgsfield推出“Speak”功能:一键生成口型精准的数字人视频
AI视觉生成平台Higgsfield推出重磅功能——“Speak”。用户只需选择预设动作、上传自定义角色并输入语音文本,即可生成具备口型同步与自然动作的数字人视频。该功能支持精确口型同步技术和16种内置场景类型。 来源: AI Base