近日,从中国农业科学院基因组研究所官方微信公众号传来消息,国际权威学术期刊《自然・遗传学(Nature Genetics)》在线刊登了中国农业科学院深圳农业基因组研究所(同时也是岭南现代农业科学与技术广东省实验室深圳分中心)周永锋团队的最新研究成果。该研究团队利用人工智能技术,在葡萄育种领域取得了重大进展,有望大幅缩短葡萄育种周期,提高育种效率,并推动葡萄品种的精准设计与创新。
据悉,周永锋团队自2015年起便致力于葡萄的设计育种工作,并于2023年成功发布了首个葡萄端粒到端粒的完整参考基因组图谱,相关研究还以封面文章的形式在《园艺研究(Horticulture Research)》上发表。然而,为了实现更精准的“设计”,一个基因组数据显然是不够的。因此,该团队继续对包括野生种和栽培品种在内的9个二倍体葡萄品种进行测序与组装,得到了18个端粒到端粒的单倍型基因组,并整合已有数据,构建了首个最全面、最准确的葡萄泛基因组(Grapepan v1.0),其总长度达1.43Gb,是单个参考基因组大小的近三倍。
为了深入探究葡萄基因与性状之间的关联,周永锋团队从近万份葡萄品种中精心挑选了400多份具有代表性的品种,连续三年对29个农艺性状进行了详尽的调查,包括果穗大小、浆果中代谢物含量、浆果大小和果皮颜色等。在此基础上,团队构建了葡萄基因型图谱和性状图谱,并通过数量遗传学分析,鉴定出了148个与农艺性状显著相关的位点,其中122个位点为首次发现。研究还发现,调控不同性状的位点间存在关联性,且不同葡萄群体之间存在显著分化的区域,这些区域中存在多个与农艺性状相关的遗传位点,揭示了酿酒与鲜食葡萄分化的遗传基础。
为了实现精准育种,周永锋团队引入了机器学习技术。他们构建了预测模型,根据评分对早期个体进行预测和选择,从而指导、优化育种策略。在本研究中,团队将包含了性状和基因型的数据划分为三个子集:训练集、验证集和测试集。利用机器学习算法解析基因型与性状数据间的复杂网络关系,构建了首个葡萄全基因组选择模型。研究结果表明,结合了结构变异信息和机器学习模型的计算多基因评分预测准确率高达85%。
这一模型的应用将极大地提升葡萄育种的效率。育种家可以快速准确地评估大量育种材料的遗传潜力,从而在葡萄幼苗时期就能预测其成熟后的性状,尽早剔除不符合条件的幼苗,减少不必要的人工成本和投入。相比传统的杂交育种方法,全基因组选择育种技术能够显著提高葡萄育种效率,加速葡萄新种质的创制,为葡萄育种策略带来革新。
目前,该研究团队已申请并获批国家发明专利6项,同时申请了1项国际专利。这一研究成果不仅为葡萄育种领域带来了重大突破,也为其他多年生作物的育种提供了宝贵的参考和借鉴。