2025年6月4日:AI伦理安全获权威关注,生成式AI应用遍地开花
今日AI领域热点频出。AI教父本吉奥投身AI安全,韩国加码芯片AI投资。DeepSeek医疗模型超越巨头,语音AI效率惊人。同时,谷歌AI产品遇挫,OpenAI收购引争议,而《堡垒之夜》、华为等纷纷拥抱生成式AI。
💡 今日要闻
AI伦理安全受权威关注:LawZero组织成立
人工智能“教父”约书亚・本吉奥(Yoshua Bengio)成立非营利组织 LawZero,斥资约3000万美元旨在开发“诚信”人工智能系统,以防范AI智能体对人类的欺骗行为,并确保AI透明、可验证,同时对潜在危险特征发出警告。
韩国加大AI与芯片领域投资力度
韩国新任总统李在明宣布,未来韩国将大规模投资人工智能和半导体等高科技产业,将其视为推动经济增长、增强国际竞争力并创造就业的新引擎。
DeepSeek R1医疗AI模型评测登顶,超越Google与OpenAI
斯坦福大学发布的临床医疗AI模型评测显示,DeepSeek R1 在九个前沿大模型中以66%的胜率和0.75的宏观平均分拔得头筹,表现优于Google和OpenAI的模型。此次评测框架MedHELM由29名执业医生验证,更注重临床实际应用。

Phonely语音AI准确率高达99.2%,助力客户中心降本增效
人工智能电话支持公司 Phonely 联合 Maitai 和 Groq,推出可实时切换模型的电话AI系统,响应速度提升超70%,AI对话准确率从81.5%提升至99.2% ,超越GPT-4o的94.7%。Phonely CEO表示,超过70%的用户无法分辨是AI还是人类。此项技术已帮助一家客户裁减350位人工坐席。

OpenAI CEO奥尔特曼:企业应立即拥抱AI,不行动即出局!
OpenAI 首席执行官山姆・奥尔特曼在 Snowflake Summit 峰会上强调,在快速发展的AI领域,企业必须“立即行动”,等待技术“稳定”已不再明智。他指出,企业迭代速度是成功的关键,并表示AI模型可靠性显著提升,可以完成许多过去认为不可能的任务。

🔬 技术突破
松下“OmniFlow”多模态生成AI:实现文本、图像、音频自由转换
松下控股、美国松下研发公司及加州大学洛杉矶分校联合开发出“OmniFlow”多模态生成AI,具备“任意对任意”的生成能力,可在文本、图像和音频之间自由转换。该技术在小样本数据下也能学习高精度模型,显著降低数据采集成本,并在文本转图像和文本转音频任务中表现优异。

Komiko视频到视频功能上线:AI一键打造动漫大片
Komiko平台推出全新视频到视频(Video-to-Video)功能,允许用户上传视频并通过简单的文本指令或风格选择,将其转化为动漫、漫画、赛博朋克等多种艺术风格的动态内容,例如将真人视频转为《火影忍者》风格。该功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,极大降低了动画创作门槛。
Manus发布“文生视频”功能,直面OpenAI Sora竞争
中国团队Monica开发的通用AI Agent产品Manus,面向付费会员推出了原生的“文生视频”功能。其AI智能体能在几分钟内将文本命令转换为井然有序的视频故事,旨在与OpenAI的Sora竞争,并计划后续面向所有人开放。

Fish Audio发布OpenAudio S1:媲美专业配音演员的AI语音新标杆
Fish Audio推出新一代语音生成模型 OpenAudio S1,以其高度自然的、丰富语气控制和强大指令跟随能力,号称达到专业配音演员的表现力。该模型在TTS-Arena排行榜中荣登第一,支持50多种情绪和13种语言,并采用创新的Dual-AR架构与RLHF训练。
PlayDiffusion开源发布:实现语音“局部修改”不留痕迹
Play AI 开源推出创新语音编辑模型 PlayDiffusion,首次实现语音“局部修改”不留痕迹。用户可直接对语音中的某部分进行替换、删除或调整,无需对整段音频重生成,模型能精准识别并智能调整节奏、语调和音色,听感上几乎无法察觉拼接痕迹。
谷歌发布AI Edge Gallery:智能手机离线运行AI模型新突破
谷歌低调推出实验性应用 Google AI Edge Gallery,允许用户在智能手机上直接运行来自Hugging Face的开源AI模型,无需网络连接即可实现图像生成、文本处理、代码编辑等功能。此举标志着边缘计算和隐私优先的AI部署迈出重要一步。

OpenAI升级AI智能体开发工具:支持TypeScript、改进语音对话
OpenAI宣布对其AI智能体开发工具进行重要升级,新增对TypeScript的支持,让JavaScript和Node.js开发者也能参与智能体开发。同时推出RealtimeAgent功能,支持低延迟语音应用并引入人机回路审批机制,确保智能体行为可控。

OpenAI Codex升级:语音输入和联网功能助力编程更智能
OpenAI 编程工具 Codex 全面升级,新增语音输入和联网能力,并向 ChatGPT Plus 用户开放(每月20美元)。Codex 现可在执行任务时访问互联网、自动安装依赖、运行代码检查,并支持语音指令。

Claude Code有望向Pro用户开放,降低AI编码门槛
Anthropic开发的AI编码助手Claude Code有望向Claude Pro用户开放,此前仅限于Max订阅或API用户。此举将大幅降低使用门槛,让更多开发者体验到Claude Code强大的代码库理解能力和终端集成特性。

📈 行业动态
Windsurf遭遇挑战:Anthropic限制访问Claude AI模型
被OpenAI收购的氛围编程初创公司 Windsurf 透露,Anthropic 大幅削减了其平台对Claude 3.7 Sonnet和Claude 3.5 Sonnet模型的直接访问权限,且几乎没有提前通知。Windsurf CEO表示失望,并指出用户可能面临短期可用性问题和更高成本。此举对Windsurf的增长潜力构成威胁,尤其在激烈竞争的AI辅助编程领域。

谷歌暂停“Ask Photos”功能以解决性能问题
谷歌已暂停在 Google Photos 中推出的 AI 驱动“Ask Photos”功能,原因是其在延迟、质量和用户体验方面未达到预期。谷歌计划在两周内发布改进版本,同时将优化关键词搜索功能。

DeepSeek被疑使用Google Gemini数据训练新AI模型
DeepSeek 近期发布的 R1推理AI模型更新版因其用词、表达方式及“思维轨迹”与Google Gemini AI系列存在相似之处,引发AI研究人员对其训练数据来源的质疑。此前,DeepSeek V3模型也曾被指通过OpenAI ChatGPT的聊天记录进行训练。

纽约时报与亚马逊签署首个生成式AI内容许可协议
《纽约时报》与亚马逊达成一项重要内容许可协议,首次将其新闻编辑内容(包括NYT Cooking和The Athletic)向亚马逊的AI平台开放,用于模型训练。亚马逊将附上来源和溯源链接,此举旨在为高质量新闻内容探索新的盈利模式和知识产权保护。

IBM在纽约市推出全新AI创新中心,助力企业智能化转型
IBM 在纽约市设立 watsonx AI Labs 创新中心,旨在加速AI技术开发和大规模应用,连接AI开发者和初创企业,支持企业级智能AI系统发展。该中心将重点解决客户服务、供应链、网络安全等商业挑战,并计划在五年内支持初创企业推出AI商业解决方案。

Expensya创始人重返创业赛道,AI测试平台Thunder Code获900万美元种子轮
曾发誓不再创业的Expensya联合创始人Karim Jouini和Jihed Othmani,被生成式AI浪潮吸引,共同创立AI驱动的软件测试平台 Thunder Code,并在成立不到六个月内获得900万美元种子轮融资。Thunder Code使用AI“代理”模拟人类测试人员,解决传统手动测试缓慢问题。

🤖 应用探索
华为WATCH 5智能手表接入双大模型,运动健康体验全面升级
华为发布旗舰产品WATCH 5智能手表,将接入盘古大模型和DeepSeek大模型。新版腕上小艺功能能智能分析20多种运动、近200项健康指标,提供个性化运动建议和健康指导,并支持与其他华为智能设备及第三方健康平台互联。

《堡垒之夜》引入生成式AI,轻松定制智能NPC
Epic Games 首次展示了其《堡垒之夜》中引入的生成式AI工具,创作者只需约20行提示文本,即可定制个性化的非玩家角色(NPC),赋予其独特性格、语音和语气,带来更具互动性的游戏体验。

NotebookLM推出公共共享功能,让笔记分享更便捷
NotebookLM 宣布新增公共分享功能,用户可通过简单链接与任何人公开分享他们的笔记,无需注册或登录。观众虽不能编辑,但可与笔记互动,例如提问或浏览生成的内容(如音频概述、常见问题解答)。

蚂蚁集团“AI健康管家”服务超4000万用户,通过信通院可信评估
蚂蚁集团“AI 健康管家”成功通过信通院医疗健康行业大模型可信评估,成为首批通过产品之一。该产品自2023年推出以来,已服务超4000万用户,提供医生预约、健康评估、报告解读等智能健康服务。

🔮 未来展望
AI逐渐取代基层员工,科技公司初级招聘大幅下降
OpenAI CEO山姆・奥尔特曼指出,企业正将AI智能体视为基层员工。SignalFire报告显示,2023-2024年间,Meta、微软和Google等科技公司初级职位招聘量下降25%,原因在于AI已接管许多常规任务。麦肯锡预测到2030年AI可能取代多达3.75亿个工作岗位。

🎭 轻松一刻
OpenAI权力风暴将搬上银幕:奥特曼“下台五日”事件改编电影
亚马逊米高梅影业正开发一部名为《Artificial》(人工智能)的电影,将聚焦OpenAI联合创始人兼CEO萨姆・奥尔特曼在短短五天内被解雇又复职的戏剧性事件。影片有望由卢卡・瓜达尼诺执导,安德鲁・加菲尔德饰演奥尔特曼,西蒙・里奇执笔剧本,预计融合讽刺与黑色幽默。
