微软扩展Copilot Cowork功能，引入AI互评与模型理事会

The Decoder·3月31日 00:07 UTC·作者 Matthias Bastian

关键信息

‘批判’功能由一个模型起草、另一个模型评审，声称达到业内最佳深度研究性能，比Perplexity的Claude Opus 4.6高出7分。‘模型理事会’会对比不同模型的回答，但未包含与GPT-5深度研究模型的直接比较。

资讯摘要

微软已将Copilot Cowork功能从前沿计划扩展至更广泛的用户群体，并新增名为‘研究者’的新AI研究代理，可执行多步骤任务，包括使用工具、访问文件和日历规划。它引入了‘批判’功能，让一个AI模型起草内容，另一个模型进行审查，利用来自Anthropic和OpenAI的模型。微软声称此举提升了深度研究性能，比Perplexity当前产品高出7分。

此外，‘模型理事会’功能允许用户并排查看不同AI模型对同一问题的回答，帮助评估一致性与可靠性。这些特性属于Microsoft 365 Copilot第3波更新，标志着AI从简单助手行为向真正执行能力的转变。

资讯正文

微软扩大推出Copilot Cowork并让AI模型相互检查工作

微软正在更广泛地推出“Copilot Cowork”功能，并发布了一个新的AI研究代理。此前宣布的功能基于Claude Cowork，使系统能够使用工具处理多步骤任务，访问和输出文件，还包含日程规划和每日简报。该功能作为Frontier计划的一部分提供。

微软的“Researcher”工具现在新增了“批判”功能，其中一个AI模型撰写初稿，另一个模型进行审查。该功能整合了Anthropic和OpenAI的模型。微软表示，新代理在深度研究性能上达到行业顶尖水平，相较于Perplexity使用Claude Opus 4.6的表现高出7个百分点。不过，微软的基准测试并未将该代理与OpenAI最新的基于GPT-5的Deep Research进行比较。

此外，还推出了新的“模型委员会”功能，用户可以并排对比不同AI模型的回答，查看它们的一致性或差异点。这些更新均作为Microsoft 365 Copilot的第三波版本发布。

无炒作的AI新闻——由人类精选

来源与参考

收录于 2026-03-31