AI数学“大考”:最佳模型勉强及格
“首次证明”项目对AI研究级数学能力进行严格测试。最佳模型(IMProofBench)在10道题中答对6-7道,ChatGPT-5.5 Pro答对4-5道,整体表现为“C-”。AI在文献检索和技术应用方面展现优势,但仍存在大...
2026-06-11
72
0
“首次证明”项目对AI研究级数学能力进行严格测试。最佳模型(IMProofBench)在10道题中答对6-7道,ChatGPT-5.5 Pro答对4-5道,整体表现为“C-”。AI在文献检索和技术应用方面展现优势,但仍存在大...
密歇根大学研究团队在小鼠中发现一条意想不到...
芬兰研究团队在《科学》杂志上发表了一项突破...
一项开创性研究利用人工智能(AI)分析常规视网...
一项发表于《eLife》的新研究揭示了山雀(一种社...
胰腺导管腺癌(PDAC)是最常见且最难治的胰腺癌...
AI智能编码框架正以前所未有的速度重塑理论神经...