人类驯化植物的进程,正因AI(人工智能)技术的应用而加速。
近日,在AI的帮助下,中国棉花育种专家成功找到控制棉花纤维长度的基因,这对棉花品种改良提供了新思路,也为育种家培育“超级作物”按下加速键。·
相关论文发表在国际顶级期刊《细胞研究》(Cell Research)上,潮新闻专访了成果研发团队之一的湖畔实验室(阿里巴巴达摩院)智慧育种团队负责人顾斐。
AI为育种按下“加速键”
在传统的育种中,改良一个品种,可能需要及几年甚至几十年的时间。但现在通过AI,育种有可能将周期缩短到三年甚至更短的时间。
AI如何帮助育种?顾斐向记者介绍,基因是存在于生命体细胞核中的DNA片段,植物的高低、颜色等性状表型受到基因的调控,就像正常情况下,男女对应的性染色体分别是XY和XX 。而AI可以对基因进行分析,将基因型和表型建立关联,弄清楚每一个关键基因所控制的表型,从而将优异性状的基因聚合到一起,形成理想株型。
全流程智慧育种平台 图源:湖畔实验室
“AI做的事情就是尽量收集成对的基因组,当有足够多的数据‘喂养’,AI就能根据基因序列,直接预测种子未来可能长成什么样,数据越多准确性越高。”顾斐解释道。
如果说,过去育种家们是“看见之后再选择”,那么现在就可以通过AI“先预测再验证”。
顾斐表示,在传统育种上,种子需要靠种植出来,才能知道种子的产量、抗倒伏能力强弱等表现,这样时间周期长且田间试验涉及的人力、物力成本高。“如果AI准确率能达到90%,那么意味着,传统育种10年才能完成的,有可能一年就能完成。”顾斐说道。
AI算法解决育种需求
解码海量的遗传信息,了解每个位点的作用是育种家们一直头疼的问题。
甚至,最近育种家们发现,不仅DNA本身是重要的遗传信息,DNA甲基化的作用也不容忽视。想象一下,DNA就像一本写满生命信息的书,DNA甲基化就像是贴在某页上的标签,这些标签到底会对作物的表型和遗传产生什么作用?。
群体单碱基DNA甲基化多态性的精准鉴定、调控网络解析与预测模型构建 图源:湖畔实验室
本次研究中,联合科研团队以棉花为主要研究对象,利用AI对棉花基因进行分析,发现DNA甲基化会影响棉花产量、纤维品质等农艺性状,同时找到了这些被“贴便签”的基因的位置,并画出了“地图”——即构建了涵盖207个品种的棉花全基因组DNA甲基化图谱,鉴定2.87亿个单甲基化多态性(SMP)位点,规模为目前所有作物之最。
此前,科学界已经知道DNA甲基化对植物基因表达有影响,但无法确认植物的生长表现是如何受到DNA甲基化控制。
顾斐表示,在此次研究中,正式证明了DNA甲基化也参与控制植物的性状,并发现与DNA甲基化相关的43个有可能影响棉花纤维生长的基因,其中一个基因已经被证实有调控棉花纤维长度的作用。
顾斐告诉记者,此次研究是采用了生物大数据和AI技术的融合,团队将收集了207个品种的棉花多组学数据输入到算法模型中,从而得到棉花全基因组DNA甲基化图谱。“相比起传统方法,分析计算速度提升近100倍,有助于开展基因数据分析。”团队还自主研发了深度学习模型DeepFDML,可以自动找出更多DNA甲基化的位点。
AI让育种有更多可能
“AI的使用,是作物优良基因挖掘方法的突破,也代表未来发展的方向。”早在2021年,顾斐团队就开始大胆尝试AI育种。
在研究方面,顾斐坦承,训练深度学习模型需要大量的数据。然而在农业领域,作物的基因型和表型数据量却积累不足。在几年前,AI算法技术的成熟度也远不及现在,对于当时的团队而言,都是不小的问题。
“尽管面临着重重挑战,但哪怕只能达到60%的准确率,也能在一定程度上减轻育种家的成本负担。只要能为育种家带来实质性的帮助,我们就会坚持到底。”
顾斐所在的湖畔实验室智慧育种团队主要由人工智能、农业育种、计算分析等领域专家构成。他介绍,这是一个跨领域的科学合作组,旨在通过智慧育种加快育种速度。目前,顾斐等人已经在国际期刊上,主导发表文章十几篇,更多科学探索正在推进中。
他还表示,接下来,团队将致力于提升AI算法的精确度,并深化与其他科研机构的合作,“比如,针对棉花育种,团队将与浙江大学的专家团队紧密协作;在大豆育种领域,则将携手湘湖实验室、黑龙江农业科学院等权威机构,” 顾斐说,希望通过这些精准的对接合作,能够真正加速育种进程,推动农业科技的进步与发展。
全流程智慧育种平台主要模块 图源:湖畔实验室
从读懂生命开始,科学家们可以进一步着手去赋能人们的美好生活。今年3月,顾斐所在的湖畔实验室也与中国农业科学院合作发布了全流程智慧育种平台,这是为育种家们提供包含育种数据管理和分析、计算加速、AI预测的“中央厨房”。
也许在不遥远的未来,通过AI能够发现更多植物基因组的秘密,助力育种家们快速育种。而当下的科学家,正在为这样的梦想铺下台阶。
来源: 潮新闻
内容资源由项目单位提供