人类基因组约包含两万个负责编码蛋白质的基因。然而,科学家近期发现,可能还存在数千种“暗蛋白质”,它们在细胞中扮演着尚未明确但至关重要的角色。这些蛋白质源自基因组中曾被视为“非编码”的区域,因此一直未被计入官方的基因组与蛋白质统计数据中。 5月6日发表于《自然》的一项研究,为这些由人类基因组编码的数千种分子赋予了正式名称——“peptideins”(肽蛋白),并将其纳入生命科学界通用的基因与蛋白质数据库。研究人员指出,这一命名有助于进一步揭示不同肽蛋白在细胞中的功能。部分肽蛋白已被发现与多种疾病(包括儿童癌症)以及基础细胞功能密切相关。 “暗蛋白质”因氨基酸含量少、长度极短,且在其他物种中缺乏进化上的同源物,长期被排除在数据库之外。不过,它们大多由与已知蛋白质编码基因非常接近甚至部分重叠的基因所编码。 由致力于推动生物医学研究与创新的“TransCODE联盟”主导的研究团队,对数千种潜在“暗蛋白质”的实验数据进行了系统分析。他们从7264个疑似编码“暗蛋白质”的DNA序列出发,最终发现仅有15个序列具备充分的实验证据,可被纳入蛋白质编码基因的官方目录。 与此同时,研究人员在细胞中还检测到数千种实验支持较弱、功能几乎未知的蛋白质片段。欧洲生物信息研究所的生物信息学家Jonathan Mudge表示:“目前尚不确定它们是否真正发挥作用,但它们确实存在于细胞中。” 据科学家介绍,此前被认为编码“暗蛋白质”的约10个序列已被移入由GENCODE维护的官方蛋白质编码基因数据库。随着研究证据的不断积累,预计将有更多肽蛋白被纳入其中,部分传统意义上的蛋白质也可能被重新归类为肽蛋白。这一过程类似于天文学家因发现数千颗围绕太阳运行的矮行星,而不得不重新定义“行星”概念的情形。 最新发表的论文还显示,有迹象表明超过50种肽蛋白对细胞的正常运作至关重要。此前研究已指出,这些如今被称为肽蛋白的分子可能是某些癌症(如一种侵袭性儿童脑癌)的关键驱动因素,同时对心脏功能也具有不可或缺的作用。
