[文/不雅察者网专栏作家潘禺]
2016年3月,在不雅看了AlphaGo在围棋这一迂腐游戏中打败了东谈主类天下冠军李世石后,DeepMind聚拢创举东谈主德米斯·哈萨比斯回念念起了我方本科期间的资历。
他那时玩过一个名为Foldit的游戏,玩家不错在游戏中将氨基酸链折叠成卵白质结构,哪怕玩家对生物学一无所知,并不影响他们折叠卵白质。要是DeepMind能用AI来效法围棋人人的直观,难谈不行编写一个算法,用AI来效法Foldit玩家的直观吗?
模拟卵白质折叠的游戏Foldit的界面
卵白质折叠问题
卵白质折叠是一个迷东谈主的问题。
一张纸,在莫得折叠前,不外是压扁的木浆。当你折叠这张纸,就能产生各式功能。比如折成飞机,那么纸飞机就能被投掷并滑行,供孩子们文娱。而要是折成灯笼,就能在中秋节赏识,抒发团圆的好意思好寓意。
地球上已知的卵白质,是领少见亿种不同面容的分子,每一种王人践诺特定的生物学功能。血红卵白和肌红卵白在肌肉和体格中运输氧气,角卵白赋予头发、指甲和皮肤结构,胰岛素使葡萄糖插足细胞转化为能量。这些功能,时常由卵白质的面欢跃结构界说。一串氨基酸分子,在莫得自觉折叠成其固有面容之前,就莫得功能。
一个细胞将称为氨基酸的小分子串联成多肽链,这等于制造卵白质的过程。细胞怎么选拔氨基酸,取决于DNA提供的底层提示集。多肽链一朝拼装好,在极短的工夫,千分之一秒内,会抨击、再抨击,精准地折叠成卵白质的最终三维面容,随后离开分子安装线,立即去践诺它的生物学责任。
图为核糖体使用信使RNA模板制造卵白质
要是卵白质践诺这种折叠过程出了弱点,不实折叠或解缠,就可能导致毒性和细胞死字。好多疾病,如镰状细胞性贫血,等于由不实折叠的卵白质引起的。不实折叠的卵白质相聚成团,是阿尔茨海默病和帕金森病等神经退行性疾病的记号。
已知的卵白质结构不错分为四个眉目。
一级结构不错闪现为一条线性的字符串。基本构成单位是一个个的氨基酸,即一个个的字母。常见的氨基酸只须20种,是以一级结构的字符串时常只包含20种字母,不包含的6种字母是BJOUXZ。二级结构等于在一级结构的字符串的基础上,肽链进行折叠变换,造成一种局部的三维结构。三级结构等于把多个二级结构拼接到一齐,折叠成一个完满的卵白质三维结构。四级结构等于多个三级结构分子组合成一个复合物。
四个不同眉目的卵白质结构
20世纪50年代,生物化学家克里斯蒂安·安芬森的发现使他得回了诺贝尔奖。他将卵白质添加到化学溶液中,溶液的马虎导致卵白质不实折叠,但他接下来不雅察到,去除化学剂后,卵白质一经不错自觉地重新折叠,收复其自然的结构。安芬森假定,卵白质折叠成其原始结构是由卵白质的氨基酸序列自动完成的,氨基酸序列里就包含了所需的全部信息。这等于安芬森教条。
安芬森教条意味着,应该有一种身手不错从氨基酸序列料到卵白质的面容,这等于卵白质折叠问题。
分子生物学中的好多假定被称为教条(dogma),最知名的是中心划定(Thecentraldogmaofmolecularbiology),遗传信息的措施进程是DNA制造RNA,RNA制造卵白质,中心划定指出,遗传信息传到卵白质后,不会回流到核酸之中。卵白质折叠范围还有一个教条,叫莱文塔尔(Levinthal)悖论,说的是一个给定的卵白质可供选拔的可能构象的数目是天文数字,即使是一个小卵白质,也需要比天地存在的工夫还要多的工夫来探索统统可能的构象,可谓“一沙一生界,一花一天国”。
安芬森教条的例外,则是东谈主类已知的好多疾病。比如朊病毒的构象,就与应有的原生折叠状况不同。淀粉样卵白疾病,如牛海绵状脑病(疯牛病)、阿尔茨海默病和帕金森病,王人是安芬森教条的例外,原生卵白不实折叠成不同的构象,从而导致致命的淀粉样卵白堆积。
回到卵白质折叠问题,卵白质拼装的工夫这样短,到底是什么东西,将卵白质引向正确的折叠旅途呢?能否从氨基酸序列料到卵白质的结构?折叠的代码和机制是什么?