大家都在搜
3.1 单细胞生物的单细胞测序
微生物生态学是最适合进行单细胞基因组测序的研究项目,因为据估计,绝大多数(99%的物种)微生物都是无法进行人工培养的。这些不能培养的微生物被科学家们形象地称作生物界的“暗物质(dark matter)”,因为我们只能根据对标志基因(marker-gene)序列的检测来间接地“观察”这些暗物质。虽然元基因组技术(metagenomic approaches)有助于我们了解这种复杂环境里的基因组成情况,但是物种与基因之间的关系还是不得而知,因此只有借助单细胞基因组技术才能够了解单细胞生物(unicellular organism)与自身基因组功能之间的关系。这也说明我们现有的基因组数据库还相当欠缺,有大量的遗传与进化多样性信息都没有被收入在内。
科学家们开展的第一个不能人工培养的单细胞生物基因组测序工作就是针对人类牙菌斑(human tooth plaque)上的细菌开展的。最近几年已经发表了十几篇有关不能人工培养的单细胞生物基因组方面的论文,随着单细胞研究技术与测序技术的进一步发展,我们相信这方面的工作会以指数扩增形式迅速发展起来。随着这些数据的不断积累,我们也会陆续发现更多新的、以前未知的微生物功能和微生物代谢产物(metabolites),发现更多与人类身体健康相关的新物种,甚至有可能彻底改变生命之树的结构,颠覆真核生物、细菌和古细菌之间传统的进化学关系。
微生物在形态学(morphology)、生理学(physiology)和基因型(genotype)方面的多样性也给单细胞分析技术带来了不小的挑战。在我们选择单细胞分析技术、试验反应和化学试剂时,需要考虑每一种样品的特殊性。比如,微生物试验经常需要非常严格的裂解条件,而且不同的微生物往往需要不同的试验条件,这就会增加试验操作的复杂程度。由于在核酸扩增之前并不一定需要进行 DNA纯化操作,所以扩增试剂就需要能够与细胞裂解试剂兼容。复杂的裂解及扩增操作流程比较适合微孔板试验和需要用到整合技术的微流体设备的试验操作,因为这些操作都可以实现自动化。有意思的是,当反应体系缩小到纳升(nanoliters)时,生化扩增仪的表现反而会更好。相对简便的操作规程比较适合反相乳液液滴系统(reverse emulsion liquid-droplet systems)试验,使用这种系统可以快速地进行数万个独立的微反应。到目前为止,几乎所有的单细胞微生物测序结果全都使用了同一个全基因组扩增反应,即多重置换扩增技术(multiple displacement amplification, MDA)。该技术是一种等温的扩增技术(isothermal amplification),使用随机引物,主要依赖的是29 DNA聚合酶的链置换功能。
3.2 人类单体型(human haplotypes)研究
人类基因组分析工作已经从确定所有人的 “平均”参考序列(reference sequence)快速进入个体基因组测序时代,看起来单细胞技术似乎也帮不上太多的忙。但是我们人类基因组中有一些部分使用传统技术进行分析还是有比较大的难度的。比如人体内的每一个细胞里都含有两套基因组,其中一套来自父亲,另外一套来自母亲,这就叫做单体型现象,而每一个单倍体基因组(haploid genome)中的变异都会对基因的表达、蛋白质的功能,以及疾病造成非常大的影响。
人白细胞抗原( human leukocyte antigen, HLA)编码基因变异就是非常典型的例子, HLA基因单体型信息是骨髓移植工作中非常重要的一项信息,不过这只适用于非常复杂的杂合突变(heterozygous mutation)——在一个基因位点上发生了两个突变。如果这两个突变都位于同一个单体(一条染色体),那么可能是无害的,但是如果分别位于两个不同的单体,那么就极有可能是有害的。现有的技术还无法在基因组的层面上进行这种单体区分(haplotype determination)。传统的、进行单体区分最精确的方法需要对一个家系( family pedigree)进行测序,主要是对父母进行测序。很明显,在临床上大规模开展这种工作是不现实的。
不过单细胞染色体分离技术(Single-cell chromosome isolation)帮了我们的大忙,这是第一种全基因组单体型测量技术(genome-wide haplotype measurement),能够对完整的染色体进行单体鉴定。该技术出现之后很快就与其它技术搭配起来,比如只需要用到少量细胞(不过对于男性精子细胞来说可能需要的细胞数量会多一些)的单细胞测序技术(single-cell sequencing approach)等。我们希望这些技术,以及确定基因组片段单体型的长读长测序技术(long-read sequencing technologies)能够得到更进一步的应用,以促进我们对人类基因组的认识和了解。HLA编码区是我们人类基因组中多态性最明显的一个区域,该区域与人类免疫系统关系密切,也与多种人类疾病有非常直接的联系,所以一直都是研究的热点。不过由于HLA的单体型太过复杂,所以迄今为止也只对少数几个人的HLA区域进行过单体型测序。
单细胞基因组研究工作涉及的另外一个领域就是对各种人的重组方式(recombination pattern)的研究。所谓重组指的是精子细胞和卵子细胞内分别遗传自父系和母系的两条染色体大片段各自断裂,然后相互再连接,形成一个全新的基因组的过程,这也是造成人类遗传多样性的最主要原因。我们知道,整个基因组内的重组几率并不是完全一样的,即存在所谓的“重组热点”,这些位置发生重组的几率要比基因组内其它区域更高。单细胞基因组分析工作的最早成果之一就是发现在不同的个体之间,这些重组热点也会有所差异,这些热点对于某些人而言的确是热点,但是对于另外一部分人来说其实也不是那么热。最近,单细胞研究技术已经被用于分析全基因组重组模式
(genome-wide recombination pattern),以及单个精子细胞的突变率等,世界上也有了第一个针对不同个体的全基因组热点行为研究(genome-wide hot-spot behavior)。我们希望未来的单个精子细胞基因组研究也能够涉及重组突变(recombination mutant),比如对携带罕见PRDM9等位基因的个体开展研究;以及针对与不孕不育疾病(sterility and infertility)相关的、可用于临床诊断的减数分裂功能紊乱(meiotic dysfunction)的研究。
3.3 体细胞突变研究
越来越的人开始慢慢认识到个体基因组测序的意义和价值,不过目前的个体基因组序列指的还是人体内所有细胞基因组的“平均”序列。科学家们在几十年之前就已经发现,人体某些(种)细胞之间是存在基因组差异的,比如属于我们人体免疫系统的B淋巴细胞就是一个很好的例子。每一种B细胞都会严格表达一种特定的抗体,这些B细胞基因组里的基因是绝对不会被重编程(reprogram)的。正如前面已经介绍过的,生殖细胞在减数分裂和遗传重组的过程中也会出现分化和差异。在细胞不断的分裂过程中,以及在可移动的遗传元件(mobile genetic elements)的转移过程中也会慢慢积累各种突变,这些突变都具有非常重要的意义,不过我们目前对此了解得还不是特别清楚。
这些不断积累的突变与衰老,尤其是与肿瘤有非常密切的关系,所以衰老和肿瘤这两个研究领域一定会是单细胞基因组分析技术大显身手的舞台。到目前为止,已经有科研人员利用单细胞研究技术对人体精子细胞和永生化细胞系细胞进行过研究,他们直接检测了这些细胞的自发突变速率(de novo mutation rate)。还有人用这些技术对造血干细胞进行检测,以确定这些造血干细胞的突变程度,判断正常的造血干细胞转化成急性髓性白血病(acute myelogenous leukemia)肿瘤细胞之后的突变程度是不是有了一个大幅度的提升,并借此了解这些白血病肿瘤细胞的演变规律,判断乳腺癌细胞的克隆结构(clonal structure)等。
在成体神经组织里也存在嵌合型突变(Mosaic variation),这些突变与阿尔茨海默病(Alzheimer's disease)等神经退行性病变有关。最近,有科研人员利用单细胞MDA等基因组分析技术在诱导性多潜能干细胞(induced pluripotent stem cell)分化的神经细胞和尸检获得的脑细胞(postmortem brain cell)中发现了大段的(达到 MB级别的)基因拷贝变异(copy number variation)。也有人利用单细胞MDA技术和以PCR为基础的全基因组扩增技术发现了 L1逆转座子(retrotransposition)是促使大脑细胞内出现体细胞嵌合突变的潜在因素,而且还用这种方法发现在不到1/3的脑细胞里存在的突变也同样能够诱发严重的疾病,比如半侧巨脑症(hemimegalencephaly)等。荧光原位杂交技术(?uorescence in situ hybridization)也被用来研究小鼠大脑中部分非整倍体(aneuploid)的神经元细胞与小鼠衰老之间的关系。这是一个让人着迷的研究领域,有各种证据表明嵌合型体细胞突变与机体发育相关,也具有一定的功能,在正常的成熟神经组织里一样能够发现这些突变。这可能就是“正常的”神经表型之间的差异能够导致神经疾病的原因,这些差异也可能与心理疾病相关,而且突变会随着年龄增长越来越多。
3.4 何时需要单细胞测序
什么时候进入单细胞基因组测序项目才合算呢?肿瘤基因组是一种高度异质性的核酸,而且突变的速度非常快,所以对肿瘤组织进行单细胞基因组测序是最合适的。虽然大批量的肿瘤组织测序并没有让科研人员们清楚地认清肿瘤组织的亚克隆组成情况,可是如果再使用单细胞基因组测序技术,我们就可以获得更详细的信息,明确基因组中核酸序列存在高度异质性情况的基因组位点。这种分阶段的技术极大地降低了测序成本,因而增加了对某个肿瘤组织进行测序时可以进行单细胞测序的细胞数目和测序次数。
虽然目前我们还不能确定,对某个肿瘤组织进行多次、大量的单细胞全基因组测序在经济上是否划算,但是对基因组中的重要部分进行分析,或者用测序深度较浅的方法(shallow sequencing)进行低分辨率测序,了解细胞里的基因拷贝数变异情况,也能够得到同样的结果。其实Bridges在80年前开展果蝇基因组研究时就是这么干的。还有一种办法可以代替这种分阶段策略,而且只需一步,那就是对多个单细胞进行全外显子组测序,这样一方面能够了解到肿瘤组织的“总体”外显子组情况,另外也可以发现肿瘤组织内部的亚克隆组成情况,而且成本要比全肿瘤测序(whole-tumor sequencing)经济得多。
3.5 植入前测序
单细胞测序有时是我们发现罕见、或独特细胞的唯一手段。胚胎植入前遗传诊断(Preimplantation genetic diagnosis, PGD)是接受体外受精(in vitro fertilization)等人工辅助生殖技术帮助的夫妻常用的一项技术,在胚胎被植入母体之前,医生们会从体外培养的胚胎中提取一个细胞,对其进行基因组分析。不过对之前开展的临床试验进行荟萃分析(meta analyses)发现,PGD并不是筛查遗传疾病的有效手段,因为在随机对照实验中发现,许多更先进的技术成功率更高,而且生出孩子的几率几乎会高出一倍。应用微阵列比较基因组杂交(array comparative genomic hybridization)等全基因组分析方法可以在胚胎植入前以更高的分辨率对胚胎的基因组进行检测。我们希望这些更高分辨率的基因组分析技术能够尽快应用到PGD临床实践工作当中,能够对胚胎进行结构异常、甚至是点突变的检测。所得的这些数据就可以帮助临床医生们进行更加精细的判断,以了解哪一些胚胎更加健康,可以生下一个健康可爱的宝宝。
3.6 单细胞技术的未来
测序的成本肯定还会不断地降下去。近十年来也诞生了很多生化DNA扩增技术,而且现在又出现了多种单细胞试验手段。然而,目前还没有哪一种核酸扩增技术是绝对的赢家,如果真的出现这样一种技术,那对所有人都会是个意外的大惊喜。但是很难说哪一种核酸扩增技术是最好的技术,因为有很多参数需要考虑。尤其是以下这几点,比如样本类型、反应方式、方便程度(恒温反应还是变温反应,一步法还是多步法)、成本(商品化的还是自制的)、可靠程度(脱靶情况、污染品扩增、扩增时的均一性和误差、扩增技术的覆盖度、错误率,以及嵌合等人工误差)以及最终的得率等。
另外,在比较这些不同的扩增技术时,一定要使用在统计学上相关样品的单细胞样品进行评价,而且一定要避免反应体积、反应方式、裂解条件、污染、样品特异性的差异和细胞间的随机差异所带来的影响。因此,只有针对这些因素做好对照才能找出最好的扩增技术。
另外,还需要开发出自动化的单细胞分离和基因组扩增技术。现有的技术能够处理数百个数量级为单位的细胞,我们可以使用商业化的细胞分选仪完成细胞分选工作,也可以用机械手完成细胞裂解和核酸扩增反应,还可以用微流体设备自动完成上面这一整套操作。自动化和小型化是未来单细胞测序仪的发展方向,这是因为只有分析足够多的样本才能够充分认识样品里的遗传多样性。我们希望芯片技术、微流体技术,以及微型零件加工制造技术(microfabricated approach)都能够有创新性的发展。这样将会极大地提高处理的通量,同时也能够大幅度降低测试成本(降低几个数量级),还可以简化反应步骤,如此便可以在一次实验中对数万个细胞进行单细胞分析。我们相信这只是个时间问题。
单细胞基因组分析技术实际上是多项技术共同发展的结果,而且涉及了生命科学领域里多个基础领域,这将有助于我们解决生命科学领域里的多个重大问题。我们希望随着核酸扩增技术和反应类型的不断发展和多样化,单细胞测序技术的影响力能够进一步扩大,应用到更多的领域,以帮助我们更好地认识和了解整个生命系统。
4. 生物学及医学开始进入单细胞转录组学研究时代
最近的技术进步使得单细胞RNA测序成为了可能。探索性研究已经让我们见识了分化的动态变化过程,细胞对各种刺激做出的反应,以及转录的随机本质。我们正在步入一个单细胞转录组学时代,该研究方向会对生物学和医学产生深刻的影响。
我们现在提到的转录组学(transcriptome)主要源于近二十年来在生物学研究工作中成为主流的群体观测工作(population-level observation)。我们一直习惯于这样一种研究思路,即对整体组织或某个条件下的基因表达倍增情况(明显的或细微的)进行比较,但是细胞之间的实际差异可能会更明显。某些细胞可能会产生非常明显的改变,可是另外一些细胞却“无动于衷”,如此一来,即便那部分发生改变的细胞的变动幅度再大,也会被“沉默的大多数”细胞给掩盖掉和稀释掉。实际上,早在60年前就已经发现,刺激单细胞会得到“全”或“无”这两种截然不同的结果,可如果对一大群细胞进行研究就会得到一个渐进的、可定量式的反应结果。
很明显,对单细胞的基因表达情况进行检测和分析非常有助于我们了解细胞的行为,以及明确都有哪些细胞参与了组织发育、成熟和病变的过程。为了达到这个目的,就需要对单个细胞进行长期的转录组学研究。但是实验技术直到最近才发展到能够对单细胞进行RNA测序的水平,科学家们才能够借助这项技术了解单细胞在基因表达方面有意义的差异。现在也出现了非常详细的实验指南,帮助科研人员构建测序文库,而且FluidigmC1等商业化的单细胞全自动制备系统也极大地降低了广大科研人员涉足这个领域的门槛。单细胞实验操作技术的广泛应用将对我们产生深远的影响,也将帮助我们加深对细胞状态、转录本质以及基因表达调控,乃至对疾病病理进程的认识。
|