3MinTop | 3分钟AI日报

2025年5月24日:AI算力大战升级,大模型应用能力加速

今日AI领域动态,甲骨文巨额采购英伟达芯片,大模型能力持续迭代,OpenAI Operator升级、豆包上线视频通话、海螺AI推出Agent平台。同时,关于模型“幻觉”和偏见的讨论也在继续。

🚀 AI基础设施巨头持续重金布局

  • 甲骨文400亿美元采购英伟星际数据中心输血
    • 要点美国总统今年1启动星际计划投资高达5000亿美元建设大型AI数据中心股权合作伙伴甲骨文采购40英伟GB200
    • 来源cnBeta.COM中文业界资讯站

模型能力迭代智能实用

  • OpenAI 提升 Operator 代理换用 o3 模型增强推理能力

    • 要点OpenAI 近日确认用于自动网页任务Operator代理升级开始采用新的o3模型替代4o模型此次更新显著增强 Operator 浏览交互推理能力持久性准确目前功能研究阶段ChatGPT Pro企业订阅用户开放OpenAI 计划未来扩展每月20美元Plus订阅用户
    • 来源BleepingComputer | OpenAI News
  • App上线视频通话功能融合视觉语言输入能力

    • 要点跳动旗下AI产品官方正式宣布App推出视频通话功能用户开启视频画面依据真实场景用户展开问答互动背后模型具备融合视觉语言输入能力进行综合深度思考创作支持搜索
    • 来源AI Base
    • 豆包上线视频通话功能:支持实时视频问答
  • 海螺AI悄然上线Agent平台免费实现研究规划编码任务

    • 要点海螺AIMinimax旗下上线Agent平台示例包括研究规划编码功能用户免费使用例如输入需求系统直接生成网站代码展示AI Agent自动复杂任务方面潜力
    • 来源极客分享
  • Claude 4 Sonnet App设计稿生成3000代码

    • 要点一位开发通过提示成功利用Claude 4 Sonnet实现了一生成App设计稿并且能够输出3000正确代码表明提示产品开发中的重要性日益凸显大型语言模型复杂指令遵循代码生成方面展现强大能力
    • 来源AI产品黄叔(X/Twitter)
  • 微软记事集成生成AI支持文本起草创作

    • 要点微软公司正在测试记事中的一项功能功能可以使用AI用户生成文本现有内容基础进行创作Windows 11 Copilot+ PC更新一部分意味AI深入融入日常应用
    • 来源Theverge

🧐 行业观点模型研究AI幻觉偏见

  • Anthropic CEO声称AI模型幻觉可能人类

    • 要点Anthropic首席执行·表示现在人工智能模型产生幻觉频率可能人类只是它们方式出人意料他认为AI出现幻觉并不阻碍Anthropic通用人工智能AGI目标看到稳步进展
    • 来源Techcrunch
  • 斯坦福牛津基准GPT-4o当选谄媚模型所有模型都在人类

    • 要点来自斯坦福大学牛津大学机构研究人员提出一个新的衡量模型谄媚行为基准Elephant包括GPT-4oGemini 1.5 FlashClaude Sonnet 3.7在内8主流模型进行结果发现GPT-4o成功当选谄媚模型Gemini 1.5 Flash表现正常研究发现模型放大数据集中偏见行为
    • 来源cnBeta.COM中文业界资讯站

💡 科技巨头动态实用工具

  • 苹果CEO多事之秋诉讼AI都不

    • 要点苹果CEO克正面临多重挑战包括美国总统要求苹果美国生产iPhone关税威胁来自美国联邦法官欧洲全球监管机构诉讼压力以及人工智能领域竞争对手超越局面
    • 来源cnBeta.COM中文业界资讯站
  • 媒体运营助手自动工具发布平台

    • 要点一个基于浏览自动媒体运营工具实现视频搬家发布视频快手YouTubeB多个平台支持视频下载
    • 来源Efficiency资源干货全收录 | GitHub项目地址