日前,记者从之江实验室获悉,10月30日,之江实验室联合中国科学院国家天文台共同打造的天文大语言模型AstroOne,在中国天文学会2024年学术年会上首次亮相,吸引了天文学界的广泛关注。
据介绍,AstroOne拥有700亿参数、320亿tokens文本语料,经过了1万道天文学评测数据集的测评,是当前天文知识能力最强的大语言模型,作为天文学的“新质生产力”,促进学科交叉、突破领域边界,探索未知领域中的未知问题,加速天文发现。
AstroOne在中国天文学会2024年学术年会上亮相
AstroOne也能够为天文研究提供强有力的辅助。除了快速阅读和学习专业文献外,它可以快速检测研究中的潜在错误、数据异常或逻辑矛盾,减少人为疏漏;能从海量文献中提取和核对信息,辅助验证假设和结果的可靠性。与此同时,AstroOne还能实现跨学科知识推理与整合,帮助天文科学家突破知识边界、启发创新灵感,生成富有想象力的研究假设。
国家天文台台长、党委副书记刘继峰介绍了研发AstroOne的重要背景。他表示:“传统天文研究亟需人工智能技术赋能,以突破天文数据处理困境。天文学界常说‘以天之语,解物之道’,但‘天籁之声’非常嘈杂,信息量巨大,处理每年产生的百PB量级天文数据是一个难题。”
“今天,计算、数据和模型三者规模的快速增长正在推动科学研究范式的变革。我们希望借助天文大模型AstroOne,帮助天文科学家和天文爱好者更好地解读天文观测数据、更高效地进行科学探索,做出有影响力的研究工作。”之江实验室“科学基座模型”科研任务总体部技术总师薛贵荣介绍道。
国家天文台和之江实验室合作签约
以开放创新推动科研范式变革智能时代,计算从辅助性的工具变成了重要的创新引擎,正在全面变革科技创新的模式,计算驱动的开放创新将实现平台、数据、模型、知识的全面共享,为科技合作与发展注入新的动力。
在此背景下,之江实验室积极践行开放创新理念,全力推动与国家天文台的战略合作。今年5月起,实验室和国家天文台共同举办“天文大模型培训班”(以下简称“天文班”),通过封闭式科研攻关实训,培养“AI+天文”复合型人才,真正用人工智能技术赋能天文研究。国家天文台和之江实验室合作签约天文大模型培训班开班仪式在天文班,计算背景和天文背景的学员相互协作,从0到1,成功开发出天文大语言模型AstroOne。
天文大模型培训班开班仪式
“我们的优势在于理论和观测,有很多天文数据,同时能够为计算提供天文的想法和知识,但缺乏大模型方面的经验。双方合作能够取长补短,效率更高。”天文班学员、国家天文台陈孝钿博士说道。
“以大模型班为合作载体,我们通过三个月的通力合作成功完成了第一个天文大语言模型,为双方共建人工智能赋能的天文研究生态打下了坚实的基础。国台和之江的战略合作图景日趋清晰,未来我们将以人工智能的天文应用为目标,助力我国在国际天文研究领域走在发展前沿。”国家天文台罗阿理教授说。
天文班的攻关成果不止AstroOne,双方还合作打造了一个天文图文模型和四个天文学专业领域模型——用于快速捕捉极端瞬变源的Falco、进行恒星普查的SpecClip、精确预测太阳活动的SolarGPT以及实时识别GRBs等高能瞬变源的GRBs X射线探测模型。“我们收集了900万组天文图文对,并通过大模型技术生成了20万组图像问答对,构建了目前规模最大的天文图文数据集。”天文班学员、之江实验室天文计算研究中心高级研究专员唐晓瑜介绍道。未来几个月,这些模型将陆续发布,以满足天文研究全链条需求。
“这只是一个起步,AI+天文还有很多事情要做。我们将持续深化合作,加强资源共享,推进学科交叉融合和科学数据开放共享,推动科研范式变革。”之江实验室党委副书记赵新龙表示。当下,之江实验室开放科学实践正在持续深化,除了天文领域,实验室正在打造一个为AI for Science提供算力、数据、模型、工具等资源和服务的公共平台,未来可以为各个科学领域研究效率提升和成果产出提供有力支撑。
(本文图片由之江实验室提供)
来源: 潮新闻
内容资源由项目单位提供