Topic

#ai-evaluation

按主题聚合的新闻视图。

主题:ai-evaluation

共 1 条

  1. AI基准测试已失效——我们需要什么替代方案

    MIT Technology Review AI·

    AI基准测试已失效——我们需要什么替代方案

    文章指出,当前的AI基准测试是在孤立环境中评估模型,而非它们实际部署时的协作环境。作者提出了一种名为HAIC(人机情境特定评估)的新框架,用于在人类团队和组织流程中长期评估AI表现。