OpenAI推出GeneBench-Pro

OpenAI News·6月30日 08:00 UTC·作者 OpenAI News

关键信息

该公告强调使用复杂的真实世界数据集，这表明该基准可能比简化的学术测试更具挑战性。所提供材料中没有给出独立验证、数据集列表、评分细节或性能结果。

资讯摘要

OpenAI发布了GeneBench-Pro，这是一个用于测试AI在基因组学、生物学和科学研究中的表现的新基准。根据公告，该基准使用的是复杂的真实世界数据集，而不是范围很窄或合成的测试案例。其目标是衡量AI系统在多大程度上能够处理接近真实科研工作流程的问题。此次发布也把评估质量放在了核心位置，尤其是在准确性和鲁棒性非常重要的领域。

不过，提供的帖子非常简短，没有详细说明基准的设计细节。材料中也没有给出数据集名称、评分方法，或任何具体模型的测试结果。因此，这一公告更像是一次新的评测尝试，而不是一次已经验证的性能突破。

资讯正文

推出 GeneBench-Pro，这是一个新的基准测试，用于使用复杂、真实世界的数据集评估 AI 在基因组学、生物学和科学研究中的表现。

来源与参考

收录于 2026-07-01