微软扩展Copilot Cowork功能,引入AI互评与模型理事会

The Decoder··作者 Matthias Bastian

关键信息

‘批判’功能由一个模型起草、另一个模型评审,声称达到业内最佳深度研究性能,比Perplexity的Claude Opus 4.6高出7分。‘模型理事会’会对比不同模型的回答,但未包含与GPT-5深度研究模型的直接比较。

资讯摘要

微软已将Copilot Cowork功能从前沿计划扩展至更广泛的用户群体,并新增名为‘研究者’的新AI研究代理,可执行多步骤任务,包括使用工具、访问文件和日历规划。它引入了‘批判’功能,让一个AI模型起草内容,另一个模型进行审查,利用来自Anthropic和OpenAI的模型。微软声称此举提升了深度研究性能,比Perplexity当前产品高出7分。

此外,‘模型理事会’功能允许用户并排查看不同AI模型对同一问题的回答,帮助评估一致性与可靠性。这些特性属于Microsoft 365 Copilot第3波更新,标志着AI从简单助手行为向真正执行能力的转变。

微软扩展Copilot Cowork功能,引入AI互评与模型理事会

资讯正文

微软扩大推出Copilot Cowork并让AI模型相互检查工作

微软正在更广泛地推出“Copilot Cowork”功能,并发布了一个新的AI研究代理。此前宣布的功能基于Claude Cowork,使系统能够使用工具处理多步骤任务,访问和输出文件,还包含日程规划和每日简报。该功能作为Frontier计划的一部分提供。

微软的“Researcher”工具现在新增了“批判”功能,其中一个AI模型撰写初稿,另一个模型进行审查。该功能整合了Anthropic和OpenAI的模型。微软表示,新代理在深度研究性能上达到行业顶尖水平,相较于Perplexity使用Claude Opus 4.6的表现高出7个百分点。不过,微软的基准测试并未将该代理与OpenAI最新的基于GPT-5的Deep Research进行比较。

此外,还推出了新的“模型委员会”功能,用户可以并排对比不同AI模型的回答,查看它们的一致性或差异点。这些更新均作为Microsoft 365 Copilot的第三波版本发布。

无炒作的AI新闻——由人类精选

来源与参考

  1. 原始链接
  2. Microsoft rolls out Copilot Cowork more broadly and lets AI models check each other's work

收录于 2026-03-31