【中国科学报】深度学习助力提高蛋白质序列设计成功率

2022-07-22 中国科学报1版84

核心提示：中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作，开发

中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作，开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证，ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。相关成果7月21日发表于《自然—计算科学》。

近期有多项研究表明，用深度学习进行氨基酸序列设计，能在天然氨基酸残基类型恢复率等计算指标上超过能量函数方法。但目前已正式发表的工作中，对相关方法的实验验证结果远未达到能量函数方法的成功率。

据介绍，利用ABACUS-R进行序列设计的方法有两部分。第一部分是一个多任务预训练的编码—解码器网络，用于对单个氨基酸的结构和化学环境进行隐空间编码，再解码为包括中心残基氨基酸类型在内的多种真实特征；第二部分是把该编码解码网络迭代应用于目标主链的每个氨基酸残基，直到获得最大程度自洽的全序列。

在理论验证的基础上，团队尝试用实验表征了ABACUS-R对3个天然主链结构重新设计的57条序列，其中86%的序列可溶表达并能折叠为稳定单体。实验解析的5个高分辨晶体结构与目标结构高度一致。与此前报道的从头设计蛋白相似，ABACUS-R从头设计的蛋白表现出超高热稳定性，去折叠温度大多可达100℃以上。

总的来说，相较于ABACUS模型，ABACUS-R序列设计具有更高的成功率和结构精度，进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS-R还可用于序列设计以外的其他任务。（见习记者王敏）

免责声明：本网转载自其它媒体的文章，目的在于弘扬科技创新精神，传递更多科技创新信息，宣传国家科技政策，展示国家科技形象，增强国家科技软实力，参与国际科技舆论竞争，提高国际科技话语权，并不代表本网赞同其观点和对其真实性负责，在此我们谨向原作者和原媒体致以崇高敬意。如果您认为本网文章及图片侵犯了您的版权，请与我们联系，我们将第一时间删除。

更多>同类资讯

科技网
~~没有留下签名~~~~

推荐图文

正式签署！全球最大自

为区域和全球经济增长

推荐资讯

点击排行

粤公网安备 44040202001358号

• 马鞍山市举办创新主体培育政策培训会	• 马鞍山市举行“科技引领金融赋能”银企对
• 安庆市召开人工智能产业“双招双引”一季度工作	• 铜陵市以“加减乘除”厚植双创沃土
• 安庆市科技服务业固定资产投资稳步增长	• 安庆市加快发展人工智能产业锻造新质生产力
• 六安市强化数据赋能提升科技政务服务能力	• 转化中心举办专题党课报告会
• 滁州持续加大科技投入支撑科技强市建设	• 黄山市技术交易活跃度持续提升
• 芜湖高新区全力打造第三代半导体产业创新中心	• 合肥市蜀山区召开推进科技创新发展新质生产力大
• 转化中心当选安徽省分析测试协会第五届理事会理	• 亳州市持续优化创新服务环境引领产业高质量发展
• 芜湖经开区选派“科技副总”赋能企业发展	• 蚌埠市召开2024年县区科技工作会议