AlphaMissense可以预测突变是变有病病否会影响血红蛋白(左)或囊性纤维化跨膜电导调节因子(右)等蛋白质的功能。图片来源:“深度思维”公司
几乎每个人出生时都携带有50—100个父母没有的助确突变,这导致了个体之间巨大的定遗基因差异。对医生来说,新A型成对某个病人的功预基因组进行测序以找出病因极具挑战性,因为可能有成千上万个突变与这种疾病有关。测有传疾“阿尔法错义”应运而生,害基旨在预测这些基因突变是因突因否有害。
由于碱基置换,变有病病与某一氨基酸相对应的助确密码子变成其他氨基酸的密码子,其结果使合成的蛋白质的活性发生变化或失去活性,这样的突变称为错义突变。每人体内评价携带约9000个错义突变,但在所有可能发生的7100万个错义突变中,科学家只确定了其中0.1%的错义突变的影响。
“阿尔法错义”并非要厘清错义突变如何改变蛋白质的结构或稳定性,以及与其他蛋白质之间的相互作用。相反,它会将每种可能的突变蛋白质的序列与“阿尔法折叠”(AlphaFold)训练过的蛋白质的序列进行比较,查看它看起来是否“自然”,看起来“不自然”的蛋白质会被评为潜在有害。
在对已知突变开展测试时,“阿尔法错义”的表现优于其他方法。研究人员评论道,“阿尔法错义”在几项不同的性能测试中“表现优异”,将有助于科学家确定哪些致病突变应优先研究。不过,错义突变只是众多不同突变中的一种。DNA片段也可以被添加、删除、复制、翻转等。此外,许多致病突变不会改变蛋白质,而是出现在参与调节基因活性的序列附近,在确定病因时也需要考虑这些因素。
(责任编辑:知识)