类脑智能与AI AI数学“大考”:最佳模型勉强及格
“首次证明”项目对AI研究级数学能力进行严格测试。最佳模型(IMProofBench)在10道题中答对6-7道,ChatGPT-5.5 Pro答对4-5道,整体表现为“C-”。AI在文献检索和技术应用方面展现优势,但仍存在大...
“首次证明”项目对AI研究级数学能力进行严格测试。最佳模型(IMProofBench)在10道题中答对6-7道,ChatGPT-5.5 Pro答对4-5道,整体表现为“C-”。AI在文献检索和技术应用方面展现优势,但仍存在大...
一项发表在《PNAS Nexus》上的最新研究利用经典的“威斯康星卡片分类测试”(WCST)对当前最先进的人工智能(AI)模型进行了评估,结果发现AI在需要快速适应新规则的“认知灵活性”任务上表现远逊于人类。研究团队测试了包括GPT-4、Claude 3和Gemini在内的多种大型语言模型(LLM),发现它们在面对规则突然改变时,普遍出现“顽固性错误”,无法像人类一样从错误中学习并灵活切换策略。该研究不仅揭示了当前AI在模仿人类认知方面的根本局限,也为未来开发更具适应性的智能系统提供了重要方向。...
视频游戏控制器的 游戏结束 可能即将到来 耶鲁大学的研究人员开发了一种新型的脑机接口 BCI 让人类可以直接用大脑玩电子游戏 这项发表在 科学进展 上的研究 使用实时功能性磁共振成像 rt-fMRI 关键词:脑电图、近红外光谱...
美国东南部一项为期十年的研究揭示了野生蛇类中隐藏的疾病危机。研究人员对超过500条、29种蛇进行了七种病原体的检测,发现仅约20%的蛇未感染任何病原体。蛇类真菌病(由Ophidiomyces ophid...
人工智能公司Anthropic(Claude开发者)近日警告,AI系统可能正处于“递归式自我改进”的边缘,即AI无需大量人类干预即可设计并构建其继承者,这可能导致人类失去对技术的控制。为此,Anth...
国际空间站(ISS)因俄罗斯“星辰”号服务舱(Zvezda)的PrK转运通道漏气加剧,导致宇航员短暂撤离至停靠的SpaceX载人龙飞船避险。该漏气问题自2019年起持续存在,近期泄漏量增至每日约一磅...
剑桥大学与斯坦福大学联合团队利用人工智能设计的通用冠状病毒疫苗DIOS-CoVax,在首次人体试验中展现出前所未有的广谱保护能力。该疫苗通过AI预测所有冠状病毒共享的保守抗原表位,诱导产生针对SARS-CoV-2、MERS-CoV及多种蝙蝠冠状病毒的中和抗体。一期临床试验纳入120名志愿者,结果显示疫苗安全性良好,100%受试者产生针对至少6种冠状病毒的抗体反应,其中针对奥密克戎变种的中和抗体滴度达到康复者血清的4.2倍。研究团队采用深度学习模型AlphaFold-Multimer优化了疫苗抗原的三维结构...
美国国家科学院(NAS)主席玛西娅·麦克纳特(Marcia McNutt)在年度科学状况报告中指出,美国科学政策正经历“动荡”,面临联邦支持不确定、科学机构缩编、人才大量流失及政治干预科研拨款...
本期《大脑启发》播客中,主持人Paul Middlebrooks与哥伦比亚大学神经科学博士后哲学家Nedah Nemati展开对话。Nemati深入神经科学实验室,研究实验工具、方法乃至研究者自身经历如何影响科学产出...
发表在 医学互联网研究杂志 上的一篇新闻与观点文章 探讨了人工智能玩具对儿童福祉和发育的潜在影响 该文由 医学互联网研究杂志 通讯记者Simon Spichak撰写 警告称人工智能玩具 如Hello 关键词:COVID19、学习...
“首次证明”项目对AI研究级数学能力进行严格测...
美国东南部一项为期十年的研究揭示了野生蛇类...
人工智能公司Anthropic(Claude开发者)近日警告,...
国际空间站(ISS)因俄罗斯“星辰”号服务舱(...
近期,OpenAI的AI在几何学“单位距离问题”上取得...
神经科学研究常面临伦理挑战,如确保受试者尊...