提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
在语言文字盘点中回眸与展望******
每到岁末,各类年终盘点成为人们分享的焦点,这些盘点带领我们回眸过去一年的社会点滴,也唤起每个人经历过的重要时刻、酸甜苦辣。其中,“年度汉字”“年度热词”“年度流行语”等评选,有着和“高考作文题”相似的魔力。语言文字作为社会生活的基本工具,真实记录着社会生活的方方面面,生动呈现着社会发展的脚步、人们生活的节奏。眼下,各类流行语被打上“2022”的烙印,又蕴藏着对“2023”的无限希冀。
各类语言文字盘点中,我们能深切感受到时代的发展进步,也能体味到群众生活的点点滴滴。2022年,党的二十大胜利召开,学习宣传贯彻党的二十大精神迅速掀起热潮,全面建设社会主义现代化国家新征程迈出坚实步伐。“党的二十大”“中国式现代化”“全过程人民民主”等入围流行语,镌刻了党和国家发展的重要节点,体现着新时代中国的守正创新、自信自强。“一起向未来”“我的眼睛就是尺”等热词带我们回到去年初北京的冬奥时间,中国向世界奉献了一届简约、安全、精彩的冬奥盛会,中国体育代表团创造了历史最好成绩,北京成为全球首个“双奥之城”。而“数字藏品”“沉浸式”“冰雪经济”等热词,描绘了过去一年群众生活的丰富多彩,假日约上三五好友在雪场竞技、收集数字藏品、体验多重感官享受的沉浸式媒体作品,逐渐成为2022年的新时尚。热词与流行语之间,体现着每一个“小我”与国家的紧密连接。
盘点中涌现的新词语,既反映社会新风尚,也折射出汉语的独特魅力。新奇有趣的网络流行用语总能给我们带来新的感受和惊喜,网民妙手偶得的灵光一现,成为全民广泛使用的风趣表达。比如“电子榨菜”,指吃饭时观看视频或聆听音频,这种场景下,音视频内容成为佐餐的“下饭菜”,因此被形象地称为“电子榨菜”。网络新词本质上体现的行为和事件也许并不算新奇,但透过这些流行的新鲜表述,我们能触摸当代年轻人的生活风尚,了解年轻人的心态和精神需求,也能深切感受中国语言文字的博大精深。许多网络热词甚至早已走出国门,在日本、新加坡、马来西亚等海外汉语文化圈中广泛使用,成为世界了解中国、中国连接世界的一个窗口。
(文图:赵筱尘 巫邓炎)