虚拟细胞(virtual cell)亦称电子细胞(e-cell)。它是应用信息科学的原理和技术,通过数学的计算和分析,对细胞的结构和功能进行分析、整合和应用,以模拟和再现细胞和生命的现象的一门新兴学科。因此,虚拟细胞亦称人工细胞或人工生命。
虚拟细胞——人工生命的模型 孙冬泳1,徐琦1,卢铭1,查红彬2,赵明生3 (1.北京大学心血管研究所;2.北京大学信息科学中心;3.清华大学电子工程系) 虚拟细胞(virtual cell)亦称电子细胞(e-cell)。它是应用信息科学的原理和技术,通过数学的计算和分析,对细胞的结构和功能进行分析、整合和应用,以模拟和再现细胞和生命的现象的一门新兴学科。因此,虚拟细胞亦称人工细胞或人工生命。 近百年来生命科学取得了突破性进展,特别是近20年来,由于基因组计划的实施,使人门对生命的本质有了更深刻的认识,积累了极为丰富的资料和数据(1, 2)。但是,人们面对酷似“天书”的分析资料和数据,仍难以揭示生命现象的本质,因此只有进行分析、整理、归纳和综合,进行复杂体系的研究,才更有意义;只有将这些数据和分析资料“回归自然”和“活化加工”,才能为人类所利用(2)。21世纪信息科学为生命科学进行复杂体系的研究奠定了理论和技术基础,虚拟细胞是信息科学和生命科学相结合的产物。因此有人提出,虚拟细胞是芯片上的生命科学(silico biology),它将开辟21世纪生命科学的新纪元(3, 19)。 虚拟细胞不仅具有重要的理论意义,亦具有极其广阔的应用前景。它不仅可以模拟人体细胞结构和功能,阐明生命活动的反应和规律,了解疾病发病的过程和机理,进行疾病的辅助诊断和治疗;而且可以用于药物设计和虚拟试验(4),还可以用于能源的开发和利用,推动仿生科学的进展,应对内外界环境的变化,改变和完善人们的生存条件,推动社会和经济的发展(5, 22)。因此,虚拟细胞和人工生命具有极其重要的研究价值。最近,美国NIH、日本以及国际上著名的大公司如IBM、COMPAQ亦投入巨资从事此项研究(6)。美国能源部还将电子细胞列入继人类基因组计划后最重要的计划之一(22)。 现在,国际上已有两个虚拟细胞问世,一个是日本的原核虚拟细胞模型,一个是美国的真核虚拟细胞模型。现将虚拟细胞的构建方式和应用前景简要介绍如下。 1. 虚拟细胞的构建 虚拟细胞的构建过程一般分为以下几个步骤: 首先 是由生物领域专家,选择建模对象,即选择细胞的种类、虚拟的功能和细胞对内外环境刺激引起的反应等。 其次 是建立相关数据库。目前认为蛋白质是细胞功能的载体,基因和蛋白质是实现细胞功能的基本原件,是实现虚拟细胞的基本单元。因此,构建任何类型的虚拟细胞,都必须以蛋白质为核心,构建相关数据库。然而,仅建立蛋白质相关数据库对于构建虚拟细胞还是远远不够的,还必须搜集大量的相关蛋白及其相互关系和生理过程的数据。在大量数据搜集的基础上,采用“面向对象”技术(一种计算机科学方法论),依据各种物质在细胞内的位置和作用进行分类,建立数据库,并根据各反应单元的静态特点(如分布、结构、同源性等)和动态特征(如功能、结合和作用部位、变异、调控等)等进行分类与组合(3, 7, 12)。 第三 设计与建模:这是构建虚拟细胞和人工生命中最关键、最核心、最复杂的一步。即依据虚拟对象——特定的细胞与功能,依据相关数据库和系统分析,通过数学计算,将生物反应过程实现数字化模拟。再应用信息科学的理论和技术,编写程序,建立虚拟细胞的模型。数学分析和模拟的方法依据细胞内反应物质和类型而有所不同,在细胞内常见的反应有合成分解反应、氧化还原反应、磷酸化和脱磷酸化、以及酶联反应等。数学分析在描述这些反应时首先把这些反应分为有酶参与的反应与没有酶参与的反应,再根据反应类型及各自的特点确定反应公式。 虚拟细胞的具体实现也有不同情况,目前美国采用J2EE实现虚拟细胞软件系统(11),而日本采用C++程序设计语言(9)。其中J2EE是一个软件开发构架,C++是一种支持面向对象方法的编程语言。虚拟细胞的数学计算一般采用“Beowulf”结构的并行计算机系统,这种计算机系统采用将多个计算机连接起来共同完成任务的工作方式,具有非常强大的计算能力(15)。 通过数字模拟和计算机编程,不仅可以使细胞的不同物质(单元)的相互作用和反应数字化,使生物信号转变成为可识别和处理的数字和电子信号,还可以对生物信号自动存储、处理、分析、整合和应用。使非生命的信号“活化”成为具有人工智能的细胞模型和虚拟生命,以存储和再现细胞功能,并可以人为进行干预,推测细胞功能、生理病理反应和药物的作用(7,14)。 第四 是组装、测试和维护:目前所构建的虚拟细胞,主要由控制界面,计算机存储、分析和控制系统,数学计算系统和反应界面四部分组成:控制界面:主要提供给用户进行实际操作、可以依据用户需要,选择对象,输入各种信号、参数,指令虚拟细胞进行分析和实验。分析和控制系统:是虚拟细胞的核心。它不仅包括各种相关的储存数据和资料库,还包括各种可供分析和计算的软件和模型,以及与输入、传出相关的正负反馈控制体系。反应界面:这是虚拟细胞或人工生命显示结果的窗口,包括不同时间,不同空间,不同单元的数据、图像、综合与分析的结论和应对措施等。虚拟细胞构建是十分复杂的,不同的细胞、不同的虚拟对象和实现的功能,其构建的形式亦不相同,需要反复验证和不断完善(9,13)。 2. 虚拟细胞的模型目前国际上已有两种虚拟细胞的模型,一个是1997年日本学者所建立的原核细胞能量代谢的模型(3, 7);另一个是1999年美国学者所建立的真核细胞钙转运的模型(12)。此外,美国国立卫生研究院(NIH)和能源部(DOE),正在筹建关于细胞信息传递和生物利用能量的虚拟细胞(4,5)。 a. 虚拟原核细胞模型——日本虚拟细胞模型(7,8,9,10): 日本的虚拟细胞以细菌(M. genitalium)糖代谢过程为主要内容,它选取了127个与糖和能量代谢过程相关的基因和蛋白质作为“元件”,以细胞内能量代谢的反应过程为虚拟对象所建立的计算机模型。这一模型主要采用面向对象方法将细胞内的物质和单元及其变化规律分为三类:“物质”、“反应”和“系统”。其中,“物质”代表了细胞参与反应的组份,包括基因、蛋白、酶等,基因表达和物质浓度的变化为物质主要的动态属性;“反应”代表了细胞中各种反应的类型,以及这些反应的动力学方程和相关参数,“反应”的功能主要是表达参与反应的物质之间的关系和数量的变化;“系统”代表了细胞反应的特定功能、结构区、反应场所和部位。应用这一细胞模型可以模拟细胞内糖、脂肪、甘油和能量代谢过程及机理。具体组建、操作和模拟过程请参见中国医学生物信息网虚拟细胞专题网页http://cmbi.bjmu.edu.cn.) b.虚拟真核细胞模型——美国虚拟细胞模型(11,13,14): 美国的虚拟细胞以真核细胞为虚拟对象,主要由客户端(用户界面)、数据库和服务器(细胞的建模)三部分组成。利用该虚拟细胞可以完成神经母细胞瘤的钙动力学、受精卵细胞的钙离子流、RNA的转运、线粒体的作用和细胞核膜的作用等一系列关于真核细胞的生物学活动和功能。在使用虚拟细胞作实验时,首先由用户通过客户端向服务器提交实验“说明书”——试验的要求和涉及的物质与反应等,服务器根据用户对实验的定义以及实验细胞的模型从后台数据库中提取数据并应用服务器上的软件和分析系统并进行分析和处理,完成虚拟试验。最终的试验结果以类似生物学实际试验结果的形式包括图象、表格返回给用户。在整个验过程中,用户可以控制实验的各种参数和实验的过程(5,8,9,10,12)。现在,这种虚拟细胞已经在网上发布,客户可以向虚拟细胞提出要求和欲虚拟的对象,虚拟细胞便可以进行网上的演算,并向客户提供虚拟细胞工作的结果,具体组建、操作和模拟过程. 3.虚拟细胞相关的学科领域 虚拟细胞是一个多学科交叉的技术领域,从广义上说,它也属于新兴的生物信息学范畴,包含了细胞内外生物信息的获取、储存、处理、分发、分析和应用等。要建立和应用虚拟细胞,除了充分利用现代细胞分子生物学、蛋白质组学和生命科学的广泛基础和庞大的实验数据与成果以外,还必须依赖于数学和信息科学的最新成果。 在数学方面,微积分和代数学是细胞建模和分析的数学基础,常用的有代数方程组,微分、差分方程或积分方程组等;统计学,主要是多元统计学,是进行虚拟细胞非线性和比对分析不可缺少的工具;概率论与随机过程理论,特别是隐马尔科夫链模型(HMM),也是细胞建模和分析的有效工具。运筹学,最优化理论和算法在细胞物质结构预测和优化中具有重要作用;函数论和拓扑学是系统模拟结构分析的常规工具;信息论和信号处理学主要用于细胞间和细胞内信号传导的建模,蛋白质结构和功能预测等;人工神经网络是一类神经计算方法,广泛应用于解决非线性、非平稳、时变、难以模型化和非参数的问题。从系统整合到动力学行为的建模分析,从分子结构的预测分析到基因、蛋白和功能的辨识;从细胞进化和遗传模拟到药物设计和疾病预警诊断及治疗方案选择等,人工神经网络都有十分重要的作用,它是解开细胞生命活动奥秘的一把钥匙(16,17,23)。此外,计算数学,组合数学,人工智能,知识推理和模糊数学也是构建虚拟细胞所必须的。在信息科学方面,计算机在虚拟细胞研究中是不可缺少的工具,是虚拟细胞可视化的图像交互和人机对话的主要方法。任何好的数学模型和计算方法,离开计算机这一工具将难以实现。网络技术为人们使用和研究虚拟细胞创造了优越的储存和分析环境,扩充了计算机的计算和服务的能力(18);数据库是构建虚拟细胞的前提和基础,只有应用数据库的技术才能对大量数据进行有效的管理和利用;最近兴起的数据仓库和数据挖掘技术在大量的生物信息数据的处理和虚拟细胞的构建上亦将发挥重要的作用(19)。虚拟细胞的研究涉及许多基础学科,它是多学科交叉的产物。虚拟细胞的研究不仅可以推动整个生命科学的发展,也将促进其他学科的发展。 4.研究虚拟细胞的意义 研究虚拟细胞是为了使人们更好掌握和利用细胞生命活动的规律及知识,服务于医疗、教育、科学研究和社会生活,提高人民生活健康水平,为社会和经济建设服务。在疾病防治方面:建立正常和病理的虚拟细胞模型,不仅可以虚拟细胞的发生、活动和调节的生理机制,而且可以了解和揭示疾病发病过程,寻找到有效致病分子和标记分子,进行疾病的预警诊断,提出防治和干预措施,设计和试验新药物,建立新的医疗保健模式-e-Doctor,发展新的生物高技术产业(7,5,12)。 在医学、生物学教育方面:虚拟细胞以其生动和可视化的表现形式可以改变传统医学生物学教学模式,可代替和辅助传统医学生物学实验和教学可以生动、直观、透彻、逼真地重现细胞生命活动的各环节。可以实现远程教育和电子教育,使医学教育社会化、个体化,极大地提高医学教学的效率和效果。 在科学研究方面:采用虚拟细胞可代替或辅助真实细胞进行各种科学研究。可实现实际实验中很难实现的条件,预测试验的结果,发现一些在真实细胞实验很难观察到的现象和规律,再加以验证。可以设定各种复杂的实验条件,进行全方面的干预、简化实验操作、节约实验材料和时间。因此,虚拟细胞亦是芯片上的生物实验室和研究所。在社会生活方面:虚拟细胞是一个多能的仿生环境。应用虚拟细胞,可以观察环境因素对人体的影响及其作用途径,提出防治措施;应用虚拟细胞可以虚拟生物对能量的摄取和利用,指导能源的有效利用和开发。通过虚拟细胞可以模拟营养、药物、毒物对细胞的作用,避免对人和生物的直接作用所产生的不良后果。可以虚拟和模拟基因和蛋白质的结构,预测基因和蛋白质的功能,加速新的物种、产品的开发等等,这一切对国民经济和社会生活都有重大的意义(22)。 虚拟细胞是生命科学技术的重大突破。既往的科学发现和重大进展主要依靠单一的人脑通过实验观察来实现的,现在以虚拟细胞为平台和工具借助于强大信息处理能力的计算机辅助人脑进行工作,应用虚拟细胞。现在应用虚拟细胞进行复杂体系的研究,不仅可以有效的利用几百年来人类所积累的丰富的生物科学成果,创造人工生命,加速生命科学和信息科学的发展,更好的为社会和经济建设服务,而且还可以改变我们生活和生存环境,其意义是难以估量的。有人预计虚拟细胞在十到十五年左右的时间将会成为医学、生物学、药学、营养学、生态、环境、农业等学科研究产业领域不可替代的工具(24)。 (责任编辑:泉水) |