Topic
#ai-research
按主题聚合的新闻视图。
Topic Feed
主题:ai-research
共 24 条

谷歌继续流失顶尖 AI 研究员
据彭博社报道,谷歌又有几位知名 AI 研究员流向竞争对手,其中 Jonas Adler 和 Alexander Pritzel 据称将加入 Anthropic。文章还提到,诺贝尔奖得主 John Jumper 以及 Gemini 负责人 Noam Shazeer 近期分别转投 Anthropic 和 OpenAI。

谷歌AI人才持续流向竞争对手
据彭博社报道,谷歌顶级AI研究员Jonas Adler和Alexander Pritzel将离开谷歌,转投Anthropic。此前,Noam Shazeer已宣布加入OpenAI,John Jumper也将前往Anthropic。

约翰·贾姆珀离开DeepMind加入Anthropic
谷歌 DeepMind 的 AlphaFold 负责人、诺贝尔奖得主约翰·贾姆珀据报道在任职近九年后离开公司,转投 Anthropic。此次变动发生在谷歌多位知名 AI 研究员接连离职的背景下。

山羊搭建的神经网络讽刺AI研究
微软和约克大学研究员 Adrian de Wynter 在《帝国时代 II》的地图编辑器里搭建了一个可工作的神经网络。这个装置把山羊当作比特,并用两个 XNOR 门和一个 AND 门实现了一个能学习逻辑 AND 的小型电路。

Mirage为视频生成加入持久空间记忆
微软研究院与多所大学的研究者提出了 Mirage,这是一种视频世界模型,它把图像特征直接存入潜空间中的空间记忆,从而在长距离镜头运动中保持场景空间一致性。报道指出,它的生成速度最高可提升 10.57 倍,内存占用最高可减少 55 倍。

Gemini-SQL2 领先文本转 SQL 基准
Google Research 表示,Gemini-SQL2 在文本转 SQL 基准测试中以明显优势领先。该模型据称生成的 SQL 不仅看起来正确,而且能够在复杂查询上成功执行。

Sakana AI成立RSI实验室探索自我改进AI
Sakana AI成立了“ Sakana AI RSI Lab ”,这是一个专注于递归自我改进(RSI)的新研究团队。该实验室将研究AI系统是否能够比当前依赖大规模算力扩展的方法,更快地帮助设计、优化和改进未来的AI系统。
大型AI实验室探索机器意识
Google DeepMind、Anthropic 和 Meta 正在扩大对 AI 系统是否可能具备意识的研究。《金融时报》称,这项工作并不只是哲学讨论:这些实验室也在研究如果真的出现有意识的机器,对人类会意味着什么。

Import AI 459:AI监管与风险
Import AI 459 介绍了关于美国 AI 经济快速增长但难以统计、AI 监管难题、蛋白质折叠模型的缩放规律,以及如何给 AI 灭绝风险定价的最新研究与政策议题。本期重点提到一篇来自弗吉尼亚大学、Anthropic 和加拿大银行的论文,估计 2025 年名义 AI GDP 约为 2500 亿美元,质量调整后的年增长率约为 2600%。

OpenAI模型声称攻克埃尔德什难题
OpenAI表示,其内部AI模型自主推翻了埃尔德什单位距离猜想,这是一道困扰数学界约80年的著名离散几何问题。该公司在5月中旬向数学家展示了这一结果,并公布了多位顶尖研究者的早期评价。

AI 将食谱搭配与风味化学分开
Kaikaku.AI 的新研究项目 Epicure 提出了三个几乎相同的模型:Cooc、Chem 和 Core。Cooc 只从真实食谱中的配料共现关系学习,Chem 只从 FlavorDB 中共享的风味分子关系学习,而 Core 则把两种信号结合起来。

Claude Mythos 据称破解欧拉单位距离猜想
Anthropic 员工称,Claude Mythos 以一个“可爱、简单的证明”解决了 OpenAI 近期涉及的欧拉单位距离结果。工程师 Sholto Douglas 在 X 上表示,这说明 AI 驱动的数学发现仍然存在“严重的剩余空间”。

Claude Code 发现新的测试时扩展算法
研究人员提出了 AutoTTS 框架,让 Claude Code 在模拟环境中搜索更好的测试时扩展控制算法,而不是由人手工设计。该代理找到的控制器在计算开销更低的情况下,性能超过了已有方法。
OpenAI 模型推翻单位距离猜想
OpenAI 表示,其一个模型解决了已有 80 年历史的单位距离问题,从而推翻了离散几何中的一个核心猜想。公司将此视为 AI 驱动数学发现的一个里程碑。

Karpathy 加入 Anthropic 投身前沿 LLM 研究
Andrej Karpathy 表示他将加入 Anthropic,具体是在其预训练团队,以回到前沿大语言模型研究。他称未来几年处在 LLM 前沿的阶段将“尤其具有塑造性”。
OpenAI 回顾 Parameter Golf
OpenAI 发布了一篇关于 Parameter Golf 的回顾文章。这是一项受严格约束的研究挑战,吸引了 1,000 多名参与者和 2,000 多份提交,主题包括 AI 辅助机器学习研究、编码代理、量化和新型模型设计。

高尔斯称 ChatGPT 5.5 Pro 完成博士级数学研究
蒂莫西·高尔斯表示,他让 OpenAI 的 ChatGPT 5.5 Pro 处理数论中的开放问题,而模型在不到两小时内、几乎没有人类数学指导的情况下生成了可写成论文的数学论证。高尔斯称,其中一个问题的界被模型从指数级改进到二次级,另一个推广问题则被改进到多项式级。

DeepMind 投资 CCP Games 测试 EVE Online AI
Google DeepMind 正在收购 EVE Online 开发商 CCP Games 的少数股权,并将使用该游戏的离线版本来评估 AI 模型。同时,CCP Games 以 1.2 亿美元从 Pearl Abyss 手中回购自己,并将更名为 Fenris Creations。

DeepMind 联手《EVE Online》测试 AI
Google DeepMind 已入股 CCP Games,并将把《EVE Online》作为测试平台,研究长程规划、记忆和持续学习等高级 AI 能力。相关实验会在本地服务器上的离线版本中进行,不会直接影响线上玩家体验。

AI系统或将开始自我构建
在《Import AI 455》中,Jack Clark 认为,到2028年底之前出现“无人参与的 AI 研发”——即 AI 系统能够自主构建其后继系统——的概率已经超过60%。他指出,从公开研究和已部署产品来看,端到端自动化 AI 研究所需的各个组成部分已经开始拼接起来。

前OpenAI研究员杰里·特沃雷克创办Core Automation,打造全自动AI实验室
前OpenAI研究员杰里·特沃雷克推出了Core Automation公司,目标是构建一个能自动化自身研究的AI实验室,采用超越现有Transformer模型的新学习算法和可扩展架构。

MirrorCode基准测试显示AI能重构复杂命令行程序
METR和Epoch的研究人员推出了MirrorCode基准测试,要求AI代理在无源码访问权限的情况下,仅通过执行权限和测试用例自主重构复杂的命令行程序。Claude Opus 4.6成功重构了一个包含约16,000行代码的生物信息学工具,表明AI可以完成以往认为需要数周人力才能完成的任务。
OpenAI发布使用ChatGPT进行研究和生产力的指南
OpenAI发布了关于如何使用ChatGPT进行搜索、深度研究、文件分析、数据分析和结构化洞察生成的全面指南。该指南涵盖金融、管理、写作和图像生成等多个领域的实际应用场景。

微软扩展Copilot Cowork功能,引入AI互评与模型理事会
微软正更广泛地推出Copilot Cowork,并引入新的‘研究者’代理功能,该功能通过Anthropic和OpenAI模型之间的相互评审来提升深度研究表现。同时新增的‘模型理事会’功能让用户可以并排比较多个AI模型的答案。