生命从单细胞到多细胞的跃迁,可谓一次底子性的“体系进级”。无数细胞怎样周详分工、协同运作,构建出繁杂的生命体,其遗传信息时空有序睁开的物理布局基础是甚么?这平生命科学范畴的焦点谜题,如今从基因组三维布局的演化研究中,找到了要害线索。 为解开这一谜题,西安交通年夜学智能收集与收集安全教诲部重点试验室传授叶凯团队耗时多年,对于超过38亿年演化过程、涵盖1025个物种(包括细菌、真菌、植物及动物)的三维基因组数据睁开体系阐发。 近日,团队为上千物种绘制出基因组高阶布局的完备演化全景图,并初次从“体系构架”的视角,展现了基因组三维高阶布局的演化纪律,为生命繁杂性涌现找到了物理基础。研究论文发表于《细胞》上。 破解未解之谜 “布局决议功效”是生物学的基本准则,但基因组的三维布局自己怎样演化,以支撑生命从简朴到繁杂的体系跃迁,持久以来始终是未解之谜。 为回覆“何种基因组‘构架’支撑了多细胞生命的涌现”这一焦点命题,研究团队面对着巨年夜挑战,那即是怎样从海量、异质的跨物种数据中,提炼出具备普适性的演化纪律。 为此,团队自立研发了一套交融主动化科学与人工智能的原创研究要领。经由过程这套要领,团队初次明确界说并量化了两类焦点的基因组高阶“构架”,为解读生命繁杂性提供了清楚抓手。 一类是“全局折叠”,即染色体于细胞核内的总体空间排布,犹如修建的承重布局,是维持基因组体系不变的骨架。研究发明,这类“构架”的强弱与生物繁杂性无关,却遍及存于在整个生命界。值患上留意的是,植物界遍及强化了这一不变构架,这也许是植物为应答固着保存(没法挪动)所面对的繁杂情况压力,进化出的顺应性计谋。 另外一类是“棋盘格式”,反应了活跃与按捺的基因组区域于三维空间中的分开水平,犹如都会的功效区计划,负担着基因功效精准分区的作用。研究展现了一个要害纪律:“棋盘格式”的强度与生物繁杂性呈显著正相干。这象征着,生命体越繁杂,其基因组三维构造就越趋势在邃密的“分区化治理”。 叶凯于接管《中国科学报》采访时,用一个活泼的比方注释了这两类“构架”的作用:“基因组高阶构架就像是生命体内治理基因的‘公司架构’。单细胞生物比如一个草创小团队,所有员工挤于一路办公,沟通直接但分工恍惚,能处置惩罚的营业(生命勾当)相对于简朴;而繁杂的多细胞生物,就像拥有成千上万员工、需处置惩罚各种繁杂营业的年夜型集团,必需成立邃密的‘公司架构’。” 他进一步注释,“棋盘格式”就相称在把公司差别部分物理分开于差别楼层或者园区,这类“分区化治理”能让活跃的基因及缄默沉静的基因于空间上互不滋扰,从而实现细胞的高度专业化。恰是这套从“混于一路”到“分区治理”的三维构架进级,支撑了生命从简朴到繁杂的伟年夜跃迁。 生命演化共通规则 于此基础上,团队进一步阐发展现了动植物演化线路的底子差异:动物于演化中,弱化了“全局折叠”的刚性约束,从而为“棋盘格式”这一实现邃密调控的“软件构架”腾出成长空间,以支撑高度分解的细胞类型及繁杂的生命举动;而植物则偏向在加固“全局折叠”这一“硬件骨架”,其顺应性更多依靠在基因组的其他调控方式,例如线性基因簇。 这一发明从体系架构层面,清楚展现了动植物于相似繁杂性层面上,演化出的大相径庭的内部调控计谋。更使人欣喜的是,这一超过亿万年的演化纪律,于人类胚胎初期发育历程中找到了微不雅呼应。 研究显示,人类胚胎初期发育一样履历了一个从强“全局折叠”向强“棋盘格式”的构架转换,且这一转换恰与细胞从万能性向多能性、再向特异功效分解的要害期间同步。这注解,“从不变骨架到动态分区”的构架转换,多是生命体系于差别时间标准(亿年演化与数天发育)上,实现从同质化、可塑状况向异质化、特异化状况改变的共通规则。 开启研究新范式 这项研究的冲破,不仅于在展现了驱动生命繁杂性演化的三维基因组规则,更于在构建了一种前沿的交织学科研究范式——将生命体视为一个动态的、自构造的繁杂体系,应用体系建模、旌旗灯号处置惩罚及人工智能等要领,对于其焦点“构架”举行逆向解析。“这为理解生命的设计逻辑提供了全新的视角及东西。”叶凯暗示。 然而,研究的推进并不是一路顺风。团队最初面临公然数据库时,堪称喜忧各半:一方面,免费数据库为研究提供了基础数据支撑;另外一方面,现有数据质量不高、笼罩面有限,且1000多个物种横跨动物、植物、微生物,物种间特性差异巨年夜,怎样找到它们之间的相干性,一度让团队堕入困境。 于重复测验考试无果后,叶凯提出了全新思绪:再也不执着在寻觅详细的联系关系特性,而是经由过程成长交融主动化科学与人工智能的原创要领,即“序列图象化”思惟及数学底层模子,构建一套定量尺度,犹如设计一把专属“尺子”,来器量差别繁杂度物种之间的差异。 针对于演化数据中的噪声与异质性,团队结合西安交通年夜学数学与统计学院传授孟德宇团队,构建了以稀少暗示与双层优化算法为焦点的数学底层模子。该模子能将每一个物种看似混乱的三维基因组图谱,“拆解”并“重构”为少数几个素质“构架模板”的线性组合,犹如一套高精度的“降噪”与“特性提取”体系,从纷纭繁杂的数据中稳健提炼出真正的演化旌旗灯号。 回忆起研究中的要害刹时,叶凯仍难掩冲动:“其时我及论文第一作者车一卓博士正于电脑前,当看到1000多个物种的演化数据出现出阶梯状漫衍时,咱们都很高兴——这象征着咱们找到相识读生命演化的一把‘钥匙’,可以或许帮忙咱们理解整个演化历程中的基本纪律。” 始终连结科研决定信念 研究结果的发表,一样履历了一番妨害。因为团队的数据阐发方式打破了生物学研究通例,前后投稿《天然》《科学》,均被编纂退回。“虽然感应受挫,但咱们始终坚信,编纂未能充实理解咱们的研究思绪。”叶凯说,随后团队转投《细胞》,很快收到了编纂的答复,审稿人的评价赐与了他们极年夜鼓动勉励。 此中一名审稿人暗示,这项阐发极具价值,由于公家对于基因组区室的形成机制相识有限,且这种问题难以经由过程试验要领破解;而研究中纳入的人脑及鼠小脑数据,更清楚地揭示了跨物种以和胚胎发育历程中“棋盘格式”的差异水平。 谈和本次互助,孟德宇告诉《中国科学报》,他与叶凯团队的互助已经连续多年。2018年起,因为两个试验室间隔较近,交流日趋频仍,只管分属差别学科,但两边理念契合,都但愿于生命科学与人工智能的交织范畴做出冲破。 “叶凯教员擅长捕获前沿课题,此次互助中,他提出了‘序列图象化’的焦点思惟,并主导了生物学阐发;咱们团队则针对于数据噪声与异质性,构建了要害的数学底层模子。”孟德宇说,恰是这类互补协作,配合形成为了“常识-数据双驱动”的研究范式。 于叶凯看来,科研之路不免碰到挫折,连结决定信念至关主要。“不管碰到甚么坚苦,都要对于本身所做的工作有决定信念。开初的不尽如人意,于团队的不停调解及会商中,总会逐渐找到冲破标的目的。”他夸大,两个团队之间的彼此信托与支撑,也是研究可以或许顺遂推进的要害。 “咱们此刻只是不雅察到了基因组演化的阶梯状征象,但毕竟是甚么序列引起告终构的转变,还有有待咱们进一步深切研究、揭开答案。”对于在将来,叶凯及团队有着清楚的方针。 相干论文信息:https://doi.org/10.1016/j.cell.2026.03.042
基因组高阶布局演化总结图。受访者供图
叶凯(右二)团队于试验室。受访者供图