Topic

#ai-research

按主题聚合的新闻视图。

Topic Feed

主题：ai-research

共 24 条

The Decoder·6月25日 18:04 UTC
谷歌继续流失顶尖 AI 研究员
据彭博社报道，谷歌又有几位知名 AI 研究员流向竞争对手，其中 Jonas Adler 和 Alexander Pritzel 据称将加入 Anthropic。文章还提到，诺贝尔奖得主 John Jumper 以及 Gemini 负责人 Noam Shazeer 近期分别转投 Anthropic 和 OpenAI。
#ai-research评分 7.0
TechCrunch AI·6月25日 05:42 UTC
谷歌AI人才持续流向竞争对手
据彭博社报道，谷歌顶级AI研究员Jonas Adler和Alexander Pritzel将离开谷歌，转投Anthropic。此前，Noam Shazeer已宣布加入OpenAI，John Jumper也将前往Anthropic。
#ai-research评分 8.0
The Decoder·6月20日 01:54 UTC
约翰·贾姆珀离开DeepMind加入Anthropic
谷歌 DeepMind 的 AlphaFold 负责人、诺贝尔奖得主约翰·贾姆珀据报道在任职近九年后离开公司，转投 Anthropic。此次变动发生在谷歌多位知名 AI 研究员接连离职的背景下。
#ai-research评分 8.0
The Decoder·6月18日 02:43 UTC
山羊搭建的神经网络讽刺AI研究
微软和约克大学研究员 Adrian de Wynter 在《帝国时代 II》的地图编辑器里搭建了一个可工作的神经网络。这个装置把山羊当作比特，并用两个 XNOR 门和一个 AND 门实现了一个能学习逻辑 AND 的小型电路。
#ai-research评分 6.0
The Decoder·6月14日 21:58 UTC
Mirage为视频生成加入持久空间记忆
微软研究院与多所大学的研究者提出了 Mirage，这是一种视频世界模型，它把图像特征直接存入潜空间中的空间记忆，从而在长距离镜头运动中保持场景空间一致性。报道指出，它的生成速度最高可提升 10.57 倍，内存占用最高可减少 55 倍。
#ai-research评分 8.0
The Decoder·6月13日 20:32 UTC
Gemini-SQL2 领先文本转 SQL 基准
Google Research 表示，Gemini-SQL2 在文本转 SQL 基准测试中以明显优势领先。该模型据称生成的 SQL 不仅看起来正确，而且能够在复杂查询上成功执行。
#ai-research评分 7.0
The Decoder·6月6日 21:57 UTC
Sakana AI成立RSI实验室探索自我改进AI
Sakana AI成立了“ Sakana AI RSI Lab ”，这是一个专注于递归自我改进（RSI）的新研究团队。该实验室将研究AI系统是否能够比当前依赖大规模算力扩展的方法，更快地帮助设计、优化和改进未来的AI系统。
#ai-research评分 7.0
Financial Times AI·6月2日 12:00 UTC
大型AI实验室探索机器意识
Google DeepMind、Anthropic 和 Meta 正在扩大对 AI 系统是否可能具备意识的研究。《金融时报》称，这项工作并不只是哲学讨论：这些实验室也在研究如果真的出现有意识的机器，对人类会意味着什么。
#ai-research评分 8.0
Import AI·6月1日 21:31 UTC
Import AI 459：AI监管与风险
Import AI 459 介绍了关于美国 AI 经济快速增长但难以统计、AI 监管难题、蛋白质折叠模型的缩放规律，以及如何给 AI 灭绝风险定价的最新研究与政策议题。本期重点提到一篇来自弗吉尼亚大学、Anthropic 和加拿大银行的论文，估计 2025 年名义 AI GDP 约为 2500 亿美元，质量调整后的年增长率约为 2600%。
#ai-research评分 7.0
Ars Technica AI·6月1日 19:00 UTC
OpenAI模型声称攻克埃尔德什难题
OpenAI表示，其内部AI模型自主推翻了埃尔德什单位距离猜想，这是一道困扰数学界约80年的著名离散几何问题。该公司在5月中旬向数学家展示了这一结果，并公布了多位顶尖研究者的早期评价。
#ai-research评分 10.0
The Decoder·5月31日 19:37 UTC
AI 将食谱搭配与风味化学分开
Kaikaku.AI 的新研究项目 Epicure 提出了三个几乎相同的模型：Cooc、Chem 和 Core。Cooc 只从真实食谱中的配料共现关系学习，Chem 只从 FlavorDB 中共享的风味分子关系学习，而 Core 则把两种信号结合起来。
#ai-research评分 6.0
The Decoder·5月27日 02:31 UTC
Claude Mythos 据称破解欧拉单位距离猜想
Anthropic 员工称，Claude Mythos 以一个“可爱、简单的证明”解决了 OpenAI 近期涉及的欧拉单位距离结果。工程师 Sholto Douglas 在 X 上表示，这说明 AI 驱动的数学发现仍然存在“严重的剩余空间”。
#ai-research评分 8.0
The Decoder·5月24日 16:06 UTC
Claude Code 发现新的测试时扩展算法
研究人员提出了 AutoTTS 框架，让 Claude Code 在模拟环境中搜索更好的测试时扩展控制算法，而不是由人手工设计。该代理找到的控制器在计算开销更低的情况下，性能超过了已有方法。
#ai-research评分 8.0
OpenAI News·5月20日 08:00 UTC
OpenAI 模型推翻单位距离猜想
OpenAI 表示，其一个模型解决了已有 80 年历史的单位距离问题，从而推翻了离散几何中的一个核心猜想。公司将此视为 AI 驱动数学发现的一个里程碑。
#ai-research评分 10.0
The Decoder·5月20日 02:23 UTC
Karpathy 加入 Anthropic 投身前沿 LLM 研究
Andrej Karpathy 表示他将加入 Anthropic，具体是在其预训练团队，以回到前沿大语言模型研究。他称未来几年处在 LLM 前沿的阶段将“尤其具有塑造性”。
#ai-research评分 8.0
OpenAI News·5月12日 08:00 UTC
OpenAI 回顾 Parameter Golf
OpenAI 发布了一篇关于 Parameter Golf 的回顾文章。这是一项受严格约束的研究挑战，吸引了 1,000 多名参与者和 2,000 多份提交，主题包括 AI 辅助机器学习研究、编码代理、量化和新型模型设计。
#ai-research评分 7.0
The Decoder·5月9日 22:32 UTC
高尔斯称 ChatGPT 5.5 Pro 完成博士级数学研究
蒂莫西·高尔斯表示，他让 OpenAI 的 ChatGPT 5.5 Pro 处理数论中的开放问题，而模型在不到两小时内、几乎没有人类数学指导的情况下生成了可写成论文的数学论证。高尔斯称，其中一个问题的界被模型从指数级改进到二次级，另一个推广问题则被改进到多项式级。
#ai-research评分 8.0
The Decoder·5月7日 19:15 UTC
DeepMind 投资 CCP Games 测试 EVE Online AI
Google DeepMind 正在收购 EVE Online 开发商 CCP Games 的少数股权，并将使用该游戏的离线版本来评估 AI 模型。同时，CCP Games 以 1.2 亿美元从 Pearl Abyss 手中回购自己，并将更名为 Fenris Creations。
#ai-research评分 7.0
Ars Technica AI·5月7日 00:56 UTC
DeepMind 联手《EVE Online》测试 AI
Google DeepMind 已入股 CCP Games，并将把《EVE Online》作为测试平台，研究长程规划、记忆和持续学习等高级 AI 能力。相关实验会在本地服务器上的离线版本中进行，不会直接影响线上玩家体验。
#ai-research评分 7.0
Import AI·5月4日 20:32 UTC
AI系统或将开始自我构建
在《Import AI 455》中，Jack Clark 认为，到2028年底之前出现“无人参与的 AI 研发”——即 AI 系统能够自主构建其后继系统——的概率已经超过60%。他指出，从公开研究和已部署产品来看，端到端自动化 AI 研究所需的各个组成部分已经开始拼接起来。
#ai-research评分 9.0
The Decoder·4月23日 02:44 UTC
前OpenAI研究员杰里·特沃雷克创办Core Automation，打造全自动AI实验室
前OpenAI研究员杰里·特沃雷克推出了Core Automation公司，目标是构建一个能自动化自身研究的AI实验室，采用超越现有Transformer模型的新学习算法和可扩展架构。
#ai-research评分 8.0
Import AI·4月13日 18:02 UTC
MirrorCode基准测试显示AI能重构复杂命令行程序
METR和Epoch的研究人员推出了MirrorCode基准测试，要求AI代理在无源码访问权限的情况下，仅通过执行权限和测试用例自主重构复杂的命令行程序。Claude Opus 4.6成功重构了一个包含约16,000行代码的生物信息学工具，表明AI可以完成以往认为需要数周人力才能完成的任务。
#ai-research评分 9.0
OpenAI News·4月10日 08:00 UTC
OpenAI发布使用ChatGPT进行研究和生产力的指南
OpenAI发布了关于如何使用ChatGPT进行搜索、深度研究、文件分析、数据分析和结构化洞察生成的全面指南。该指南涵盖金融、管理、写作和图像生成等多个领域的实际应用场景。
#ai-research评分 7.0
The Decoder·3月31日 00:07 UTC
微软扩展Copilot Cowork功能，引入AI互评与模型理事会
微软正更广泛地推出Copilot Cowork，并引入新的‘研究者’代理功能，该功能通过Anthropic和OpenAI模型之间的相互评审来提升深度研究表现。同时新增的‘模型理事会’功能让用户可以并排比较多个AI模型的答案。
#ai-research评分 8.0