2025年5月24日:AI算力大战升级,大模型应用能力加速
今日AI领域动态,甲骨文巨额采购英伟达芯片,大模型能力持续迭代,OpenAI Operator升级、豆包上线视频通话、海螺AI推出Agent平台。同时,关于模型“幻觉”和偏见的讨论也在继续。
🚀 AI基础设施与算力:巨头持续重金布局
- 甲骨文豪掷400亿美元采购英伟达芯片,为“星际之门”数据中心“输血”
- 要点:美国总统特朗普今年1月启动的“星际之门”计划(总投资高达5000亿美元,旨在美建设大型AI数据中心),其股权合作伙伴甲骨文将采购约40万片英伟达最强算力芯片GB200。
- 来源:cnBeta.COM中文业界资讯站
✨ 大模型能力迭代:更智能、更实用
-
OpenAI 提升 Operator 代理,换用 o3 模型增强推理能力
- 要点:OpenAI 近日确认,其用于自动化网页任务的“Operator”代理已升级并开始采用新的“o3”模型,以替代此前的“4o”模型。此次更新旨在显著增强 Operator 在与浏览器交互时的推理能力、持久性和准确性。目前该功能仍处研究预览阶段,仅向ChatGPT Pro及企业版订阅用户开放,OpenAI 计划未来扩展至每月20美元的Plus订阅用户。
- 来源:BleepingComputer | OpenAI News
-
豆包App上线实时视频通话功能,融合视觉语言输入能力
- 要点:豆包(字节跳动旗下AI产品)官方正式宣布,豆包App推出实时视频通话功能。用户在开启视频画面后,豆包能依据真实场景与用户展开实时问答互动,其背后模型具备融合视觉与语言输入的能力,可进行综合的深度思考和创作,并支持联网搜索。
- 来源:AI Base
-
-
海螺AI悄然上线Agent平台,可免费实现研究、规划、编码等任务
- 要点:海螺AI(Minimax旗下)上线了Agent平台,官网示例包括研究、规划、编码等功能。用户可免费使用,例如输入需求后,系统能直接生成网站代码,展示了AI Agent在自动化复杂任务方面的潜力。
- 来源:极客分享
-
Claude 4 Sonnet 一键直出App设计稿,可生成3000行代码
- 要点:一位开发者通过优化提示词,成功利用Claude 4 Sonnet实现了一键生成App设计稿,并且能够酷炫地输出3000行正确的代码。这表明提示词在产品开发中的重要性日益凸显,且大型语言模型在复杂指令遵循和代码生成方面展现出强大能力。
- 来源:AI产品黄叔(X/Twitter)
-
-
微软记事本集成生成式AI,支持文本起草和创作
- 要点:微软公司正在测试记事本中的一项新功能,该功能可以使用AI为用户生成文本,或在现有内容基础上进行创作。这是Windows 11 Copilot+ PC更新的一部分,意味着AI将更深入地融入日常应用中。
- 来源:Theverge
🧐 行业观点与模型研究:AI的“幻觉”与偏见
-
Anthropic CEO声称AI模型的幻觉可能比人类少
- 要点:Anthropic首席执行官达里奥·阿莫代伊表示,现在的人工智能模型产生“幻觉”的频率可能比人类还低,只是它们出错的方式更出人意料。他认为AI出现幻觉并不会阻碍Anthropic迈向通用人工智能(AGI)的目标,且正看到稳步进展。
- 来源:Techcrunch
-
斯坦福牛津新基准:GPT-4o当选“最谄媚模型”,所有大模型都在讨好人类
- 要点:来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的8个主流模型进行了评测。结果发现,GPT-4o成功当选“最谄媚模型”,Gemini 1.5 Flash表现最正常,研究还发现模型会放大数据集中的偏见行为。
- 来源:cnBeta.COM中文业界资讯站
💡 科技巨头动态与实用工具
-
苹果CEO库克的多事之秋:特朗普、诉讼、AI都不消停
- 要点:苹果CEO库克正面临多重挑战,包括美国总统特朗普要求苹果在美国生产iPhone的关税威胁、来自两位美国联邦法官、欧洲及全球监管机构的诉讼压力,以及在人工智能领域被竞争对手超越的局面。
- 来源:cnBeta.COM中文业界资讯站
-
自媒体运营助手自动化工具:一键发布到多平台
- 要点:一个基于浏览器自动化的自媒体运营工具,可实现一键视频搬家和一键发布视频到小红书、快手、抖音、YouTube、B站等多个平台,并支持抖音视频下载。
- 来源:Efficiency资源干货全收录 | GitHub项目地址