大型语言模型在处理日常对话和信息查询时效果显著,但在面对需要多步逻辑推理的任务时,就显得力不从心。为了让AI获得真正的思维能力,研究者们开发出了"思维链"(Chain-of-Thought)技术。
科小二
2025-06-10
近日,天文时域光变基础模型AstroOne-FALCO在中国科学院国家天文台学术年会上正式发布。
浙江省科学技术协会
2025-02-12
英国牛津大学研究团队近日在国际学术期刊《自然》上发表论文,尝试解决大语言模型输出中的这种“幻觉”现象,从而提高输出的可信性。
北京科协
2024-09-11
一种概念和数学框架,将神经网络的训练动力学描述为图上的轨迹,其节点对应于与神经网络学习到的表征相对应的涌现算法。这种抽象能够让我们借助统计物理学中被充分研究的问题来描述广泛的神经网络现象。
中启行
2023-10-22
如今我们知道大模型学到了“意义空间”,“语意景观”,语言中蕴含的“世界模型”,又或是“语言结晶”,“语言丰富范畴”。这些是大模型的本质还是存在?
中启行
2023-10-24
来自清华大学、伦敦大学学院、莫纳什大学、北京邮电大学的联合团队提出用于蛋白质-RNA 结合亲和力预测的 CoPRA 模型,其在多个数据集上达到了最先进的性能。
HyperAI超神经
2025-03-13
北京邮电大学王光宇教授、北京大学第三医院宋纯理教授、三峡大学杨简教授组成的医工交叉团队,提出并验证了当前具有最大规模参数量的生物医学大语言模型 MedFound。
HyperAI超神经
2025-02-06