2026-06-17站内改写1 分钟阅读更新: 2026-06-17

引入LifeSciBench

LifeSciBench是由专家撰写并评审的基准测试，用于评估AI系统处理真实生命科学研究任务和决策的能力。

OpenAI 宣布推出 LifeSciBench，这是一个由生命科学领域专家撰写并经过严格评审的基准测试平台。该基准旨在全面评估人工智能系统在处理真实世界生命科学研究任务和决策时的表现。LifeSciBench 涵盖了一系列具有挑战性的场景，从数据分析到实验设计，确保能够反映 AI 在推动科学发现方面的实际潜力。通过提供标准化且专家认可的测试集，LifeSciBench 有望加速 AI 在生命科学领域的负责任应用。