专家与超级预测者更新AI发展时间线
根据LEAP第八轮调查,专家和超级预测者上调了对AI影响的预期,预计AGI可能在2050年前实现,AI任务执行能力快速提升,且专家对AI长期影响持乐观态度。
预测研究所(Forecasting Research Institute)于2026年6月2日发布了纵向专家AI小组(LEAP)第八轮调查结果,评估AI专家、超级预测者及公众对AI长期能力与影响的看法。这是自2025年夏季首次调查以来,首次对同一问题(AI到2040年对人类社会的影響)进行更新。
调查显示,专家和超级预测者对AI影响的预期显著上调。在技术里克特量表(TRS)上,专家平均认为AI在2040年达到8级(世纪技术,如电力)的概率为35%,9级(千年技术,如农业)为24%,10级(时代技术)为11%。超级预测者的分布几乎相同(34%对8级,23%对9级,8.5%对10级),而公众则更为保守。与九个月前相比,在同时参与第一轮和第八轮的264名专家和超级预测者中,专家平均预期TRS水平从7.86升至8.06,超级预测者从7.50升至7.89,公众仅从7.18升至7.25。74%的参与者预测变化在±1分以内,15%上调超过1分,11%下调超过1分。模态预测也发生变化:专家中将“世纪技术”作为最高概率级别的比例从38%升至53%,超级预测者中“世纪技术”取代“十年技术”成为最常见的模态选择(从38%降至43%)。
在通用人工智能(AGI)时间线上,专家预测2100年前AGI实现的概率为80%,中位年份为2050年(25%概率在2039年前,75%概率在2065年前)。超级预测者给出相似概率(80%),但中位年份更早(2047年)。AGI被定义为:在2025年基础上,能在90%的非体力工作中超越90%的人类专业人员,且推理成本不超过人类劳动力的5倍。
在任务执行能力方面,专家预测AI模型将在2030年实现8小时任务80%成功率(超级预测者预测为2028年,公众预测为2037年)。调查期间(2026年4月20日至5月11日),METR基准更新后,Anthropic的Mythos模型在3小时6分钟任务上达到80%成功率,已接近专家和超级预测者的中位数预测(3.4和3.5小时)。
最后,调查揭示了专家与公众在AI影响上的分歧。57.5%的专家和69.8%的超级预测者认为AI对美国未来20年的影响将是积极的,而公众中这一比例仅为42%。专家特别看好AI在解决问题(72.7%认为改善)和决策(58.3%认为改善)方面的作用,但一致认为AI可能削弱人际关系(68.4%的专家和66.7%的公众认为会恶化)。