大家都在搜
2.1 2013年测序技术回顾
单细胞测序技术可谓是科技发展史上的一大创举。一个细胞里的DNA或RNA仅仅处在皮克(picograms)级的水平,这么少的量远远达不到现有测序仪的最低上样需求。因此科学家们必须先对单细胞内的微量核酸分子进行扩增,而且必须保证尽可能少地出现技术误差,以便开展后续的测序及其他研究。直到最近,也还是只有少数几位专家相信能够对单细胞进行可靠的研究。
虽然早在几年前就开始有研究团体在宣传、推广单细胞基因组及转录组测序技术,但是这些技术是最近这两年才开始被大范围接受,其中就包括从事神经科学研究、肿瘤及微生物生态学研究的科研人员。据美国Fluidigm公司的联合创始人,斯坦福大学(Stanford University)的Stephen Quake介绍,几乎从PCR技术诞生的第一天开始,就不断有人尝试用PCR技术进行单细胞基因表达研究及单细胞基因组研究。但是由于种种原因,单细胞测序技术直到现在才算是刚刚起步。
DNA和RNA扩增技术的不断改进,尤其是最近这两年新出现的进步给刚刚涉足这个领域的科研人员在开展试验时提供了非常丰富的选择。工业界也提供了无数种商业化的、而且价格低廉的单细胞核酸扩增试剂盒及读取技术。Fluidigm公司就在2013年推出了世界上第一款单细胞RNA测序自动化准备系统(single-cell automated prep system for RNA-seq)。所有这些技术上的进步极大地降低了科研人员们进入单细胞研究这个领域的技术门槛。瑞典卡罗林斯卡研究院(Karolinska Institutet in Sweden)的Rickard Sandberg在谈到单细胞RNA测序时说道:“大家等这一天已经等了好几十年了。直到今天,由于技术的进步,这些试验才变得足够简单,而且成本也能够让大家接受,所以才能够走进千千万万个实验室。”
进行单细胞研究的核心问题其实是:为什么要进行单细胞研究?这主要是因为如果将成千上万个细胞混在一起进行研究,就会模糊我们对大脑、血液系统、免疫系统,及其组成这些系统的细胞之间异质性(heterogeneity)的认识。美国宾夕法尼亚大学(University of Pennsylvania)的James Eberwine就认为,当你的研究深入到单细胞层面时,你就会失去对整个系统的把控,但是如果你能够从整个系统中挑选多个不同的单细胞进行研究,则可以重建出整个系统,而且这种重建过程能够提供更多更有价值的信息。有大量很难对大块组织进行研究的科研领域也都会从这些最新的单细胞研究技术中获益。这种单细胞测序技术不仅有助于我们认识细胞之间的差异,还可以为我们提供一个新的比较层面,这也是大家期盼已久的,能够重新定义细胞类型的层面。
可与大家这种极高热情相伴的却是各种各样的技术难题,包括单细胞分离、基因组或转录组扩增,以及数据解读等各个方面。试验成本也是需要考虑的一大因素。通常来说,对细胞进行分析时所需要的细胞数量要比对组织进行分析时所需要的组织数量多很多,所以在决定是否应该进行单细胞研究时一定要谨慎,要根据实际情况做出合适的判断。“我们真的需要进行单细胞研究吗?如果答案是否定的,那就不要进行单细胞研究。单细胞研究非常贵,而且你会碰到很多的变数。”美国博大研究院(Broad Institute),同时也在麻省理工学院任职的Paul Blainey这样说道。
对体外受精卵分裂产生的极体进行基因组测序能够为临床医生们进行胚胎植入前的遗传学诊断和筛查提供非常有价值的帮助。
2.2 从少数几个RNA分子开始
对细胞的转录组进行测序,关键在于能否利用细胞内的RNA扩增出大量的cDNA。然而,捕获少量的RNA分子制备cDNA,以及大量扩增这些cDNA分子的工作很难做到平等和高效。
1990年,Norman Iscove的课题组首次证实对单细胞进行转录组分析是可行的,他们用 PCR技术实现了对cDNA分子的指数级扩增。在20世纪90年代初期,Eberwine等人发明了一种新技术,能够从单个的活神经元细胞中获得cDNA,并且再以这些cDNA为模板转录生成RNA,实现RNA的线性扩增。随着芯片时代的来临,科学家们用这些线性、和指数级扩增技术对单细胞之间的基因表达差异进行了大量的比较和研究。
2008年时出现了高通量RNA测序技术,不久之后,科研人员们就将这种技术与前面发展起来的核酸扩增技术结合起来,对单细胞转录组进行了更加精细的研究。2009年,当时在英国剑桥大学Gurdon研究所(Gurdon Institute at the University of Cambridge)M. Azim Surani实验室工作的Tang通过对单个小鼠卵裂细胞(blastomere)的研究发现,与芯片技术相比,利用单细胞转录组技术可以多发现数千个基因的表达情况(Nat. Methods 6, 377–382, 2009)。
就在同一年,美国冷泉港实验室(Cold Spring Harbor Laboratory)也召开了第一次单细胞大会,参加大会的有科研人员、技术开发人员,以及涉足单细胞研究领域的先驱们,参会者一共还不到50人。据现在在美国弗吉尼亚大学(University of Virginia)工作的Mike McConnell回忆,每一个人都试过做 RNA测序,也尝试过对测序结果进行分析,想从中找出有价值的、可重复的结论。
不过技术的发展经历了很长一段时间,现在终于有了一整套单细胞测序的操作流程和各种商业化的试剂盒产品。瑞典卡罗林斯卡研究院的Sten Linnarsson认为,纯粹技术上的发展到今年已经达到了顶点,现在是考虑如何将这些技术应用到实际工作当中。有很多课题组瞄准的可不是几百个细胞,他们想要研究上万个细胞。
比如 Kun Zhang课题组承担的、由美国国立卫生研究院公共资金(US National Institutes of Health Common Fund)资助的单细胞研究项目(Single Cell Analysis Program)就打算对取自人类大脑皮质三个不同区域里的10,000多个细胞进行全转录组分析。Zhang等人计划根据转录子对细胞类型进行分类(可能还会对细胞类型进行重新定义),并且将这些转录子重新定位到不同的大脑组织切片里。当然单细胞RNA测序这项技术本身已经不再是障碍了。据Zhang介绍,如果你有好的细胞,如果你想进行转录组研究,那么你会有很多种选择,帮助你达成目标。不过通常而言,如何在人死后提取神经元细胞,并尽可能减少RNA的降解,保持大脑组织正常的空间结构,这也都是需要解决的问题。 Zhang等人也在从事这方面的工作,正在对几种不同的技术进行比较。
2.3 基因组扩增技术
开发一项新的单细胞全基因组扩增技术是需要一定的时间的,这是因为在一个细胞内,通常都只有一至两个DNA的拷贝,所以直到2005年才出现单细胞全基因组扩增技术,这要远远落后于单细胞RNA扩增技术。当时Roger Lasken的团队成为世界上第一个成功完成单细胞DNA扩增及测序的团队,他们当时使用的是自己开发的多重置换扩增技术(multiple displacement amplification, MDA)对大肠杆菌进行试验。这项工作给微生物学家带来了极大的激励,他们利用这项技术对各种不能人工培养的微生物进行了测序研究,获得了大量的参考基因组序列(reference genome)。
MDA作为最常用的技术和策略一直沿用至今,该技术用到了Phi29等聚合酶,能够使经退火、结合到基因组上的任意随机引物不断延伸。每一种聚合酶都能够置换临近的延伸链,形成大量的、覆盖多个小片段的、长达7至10kb的大片段产物,用来进行DNA测序。
到了2011年,科研人员们将单细胞基因组扩增技术与高通量测序技术结合起来开展研究。Nicholas Navin当时就在美国冷泉港实验室的Michael Wigler课题组工作,他在取自两位乳腺癌患者的乳腺癌肿瘤细胞中发现了大段的基因组DNA缺失或重复突变,即拷贝数变异(copy-number variant, CNV),该研究的分辨率达到了50kb(Nature 472, 90–94,2011)。
在单细胞基因组测序工作中最大的困难就是某些DNA片段的扩增效率要远远高过另外一些DNA片段。Xie等人在2012年又发明了一种新的多重退火环状扩增循环技术(multiple annealing and looping-based amplification cycles, MALBAC),该技术首先需要进行5轮MDA预扩增,然后就可以使新获得的扩增产物形成闭合的环状分子(Science 338,1622–1626, 2012)。由于这些环状分子不能够被进一步扩增,所以整个扩增过程就变成了线性扩增。然后再进行常规的PCR扩增,由于此时采用的模板更加均一,所以在进行PCR扩增时就不易造成较大的差异。Xie等人用这种MALBAC技术获得的人类基因组扩增产物能够达到93%的覆盖度,同时也在单个肿瘤细胞中检出了CNV突变。
很快,科学家们就能够对单细胞的基因组进行更加深入的研究了,他们将能够发现更小的缺失和重复突变,乃至单碱基突变。虽然基因组均一扩增还是一个问题,但是专家们相信,缩小反应体积应该可以带来一定的帮助。
比如美国加州大学圣地亚哥分校(University of California, San Diego)的Zhang等人最近就介绍了一种MIDAS技术,即微孔板置换扩增系统(micro-well displacement amplification system),使用这套系统可以用纳升级的反应体系同时进行数千个MDA反应(Nat. Biotechnol., 31,1126–1132, 2013)。科研人员们可以手工、或者用机械手取出这些扩增产物,进行测序。借助这套MIDAS系统,Zhang等人课题组只进行了很少的测序工作就在人类神经元细胞中发现了单拷贝变异(single-copy-number change),分辨率达到了1至2MB。
这套MIDAS系统是一种高通量的单细胞分离、扩增及测序技术。
2.4 细胞表达差异
在美国博大研究院(Broad Institute),Aviv Regev与Joshua Levin等人在开始单细胞RNA测序工作之前,先利用质量很差、降解严重的组织样本对多种RNA测序技术进行了比较,最后她们决定采用Smart-Seq技术对骨髓来源的树突状细胞(dendritic cell)进行研究。这些树突状细胞是一种有丝分裂后的免疫细胞,能够对抗原产生非常强烈的转录反应。
Regev等人一共选择了18个细胞,耗时一周分批进行了试验。她们之前尝试了各种方法,最终都失败了。可是这一次却一次就成功了。研究发现,每一个细胞都会统一表达所谓的持家基因(‘housekeeping’genes),但是每一个细胞也都有各自独特的表达谱,与免疫调控功能相关的基因在有些细胞里的表达水平非常高,可是在有些细胞里却压根不表达。之前还从来没有在树突状细胞中发现这种两极分化的现象,因为一直以来都是对一堆细胞进行研究,细胞之间的差异全部被平均掉了。该研究成果于去年6月得以发表,该文章首次报道了一种“隐藏的”细胞类型,即非常罕见的“第一应答者细胞(first responder)”(Nature 498, 236-240, 2013)。从更广义的角度来说,这一发现有助于我们重新认识这些树突状细胞,以及它们的信号通路和功能。
单细胞RNA测序技术第一次尝试就取得了成功。
——美国博大研究所Aviv Regev
单细胞转录组测序也能够帮助科研人员研究发育早期的基因表达与调控情况,而且借助这项技术还能够以前所未有的精细程度对罕见的样品开展科学研究。比如美国加州大学洛杉矶分校(University of California, Los Angeles)的Guoping Fan与他在中国的合作者们在去年8月发表的一篇文章就对33个单细胞进行了转录组测序研究。这33个细胞全都取自处于发育不同阶段的胚胎,他们根据测序结果确定了发育初期基因的表达顺序,还发现了人类与小鼠胚胎发育过程中基因表达时限上的差异(Nature 500, 593–597, 2013)。
单细胞测序技术是一项非常强大的技术,可以帮助我们发现肿瘤细胞里的基因组变异。
——美国德克萨斯大学MD Anderson癌症中心Nicholas Navin
与此同时,Tang的课题组也在从好几个人类早期胚胎中仔细地分离细胞标本,并且对这些细胞挨个进行单细胞转录组测序。据Tang介绍,他们非常紧张,因为这些标本全都来之不易,非常珍贵。不过他们的工作也获得了回报,他们发现了2700多个新的长非编码RNA(long noncoding RNA)分子,这些分子可能都与早期基因调控作用有关(Nat. Struct. Mol. Biol. 20, 1131–1139, 2013)。据Tang介绍,在此之前,所有的单细胞RNA测序工作还都只是针对已知基因进行分析,充其量也仅仅增加了已知基因的可变剪接亚型(alternative splicing isoforms)而已。
2.5 混合的肿瘤细胞
从疾病预后判断到病情监测,肿瘤研究人员都能够从单细胞测序技术那里获得巨大的帮助。我们都知道,肿瘤细胞的突变速率非常快,而且肿瘤组织是一种高度异质性的组织。确定肿瘤组织中存在哪些细胞亚群(或者叫克隆)具备转移能力,哪些克隆对化疗药物是敏感的,这些信息对于临床工作都非常有帮助。尤其针对隐藏在人体循环系统里的循环肿瘤细胞(circulating tumor cell, CTC)进行全基因组或者转录组测序最有帮助,因为这些CTC细胞就是导致肿瘤转移的元凶,有关它们的信息对于疾病的诊断、监测和治疗都至关重要。
比如Navin于2011年在《自然》(Nature)杂志就发表过一篇文章,介绍了他们的单细胞基因组研究成果。他们发现CNV突变与肿瘤的进化模式有关,肿瘤在稳定增长之后会突然发生基因组失稳。据现在在美国得克萨斯大学MD Anderson癌症中心工作的Navin介绍,这一发现让他们非常吃惊,因为他们一直认为肿瘤细胞一直在缓慢地积累突变。这次研究工作也证实,单细胞技术非常强大,至少能够帮助他们发现人体单个肿瘤细胞里的基因拷贝数变异。Navin与他的合作者们还在继续对三阴型乳腺癌患者进行研究,主要想了解CNV方面的情况,同时也希望能够更好地了解肿瘤转移的问题。
除了Navin等人之外,还有其他几个课题组也都在利用单细胞测序技术开展与肿瘤相关的研究工作。比如前面介绍过的Xie就与中国北京大学的Fan Bai,以及美国哈佛大学的Jie Wang一起,在一种肺癌亚型(不包括其它亚型)的CTC细胞中发现了一种特定的CNV突变(Proc. Natl. Acad. Sci. USA, doi:10.1073/pnas.1320659110, 9 December 2013)。Xie认为,这些最新的进展都有助于我们开发早期诊断产品和技术。
Mike McConnell在单个人脑神经元细胞中发现了大段的DNA缺失或重复突变。
转录组上的差异也有助于我们认识肿瘤的进展情况。比如Sandberg的团队就使用他们自己开发的Smart-Seq技术对单个CTC细胞进行了RNA测序研究,并对他们的这套方法进行了验证。使用最新版的Smart-Seq2技术,他们能够以比以前更低的成本观察更多的细胞。由于观测的细胞数更多,所以让从事CTC研究的科研工作者们头痛不已的试验误差问题也能够得到更好的控制。据Sandberg介绍,他们真的希望拿出一套更加系统的解决方案,帮助大家更好地认识CTC细胞的异质性问题,帮助大家更好地认识CTC细胞进入血液循环系统时的基因表达情况。
Wolf Reik希望表观遗传学技术也能够早日达到单细胞检测水平。
比基因组和转录组研究更困难的就是以化学标志物形式附着在基因组上,并对基因的表达实施调控的表观基因组(epigenome)研究了。虽然目前的表观遗传学技术还达不到单细胞研究水平(因为传统的表观遗传学研究技术都会使DNA降解),但是科研人员们还是迫切希望看到单个肿瘤细胞的表观基因组情况。Tang的科研团队开发了一种可以对单细胞全基因组内的DNA甲基化修饰情况进行研究的新技术(Genome Res. 23, 2126–2135, 2013)。Tang认为,表观基因组研究真的也需要单细胞技术,只有这样,科研人员们才能够了解这个肿瘤细胞与它周围的肿瘤细胞有什么差别,而且这种差别是因为甲基化修饰引起的,还是因为其它机制引起的。英国Wellcome基金会Sanger研究所(Wellcome Trust Sanger Institute)的Wolf Reik团队对 50至100个细胞的甲基化组(methylome)情况进行了分析,他表示他真的很想再往前走一步。
2.6 大脑中的“禁区”
神经元细胞是最新一个被用来进行单细胞研究的对象,科学家们其实也不太清楚能够通过这些研究获得怎样的信息和结论。也是直到最近才开始有试验证据表明,神经元细胞之间也具有不同的基因组。虽然有这些研究成果,但是科学家们对神经元细胞的这种多样性也还是一头雾水。早在2001年,当时还在美国加州大学圣地亚哥分校(University of California, San Diego)工作的Jerold Chun就在小鼠的大脑中发现了染色体非整倍体现象,随后又于2005年在人类大脑细胞当中发现了同样的现象。据当时在Chun实验室读研究生的McConnell介绍,拿到这些结果之后,他们也没人知道下一步该怎么办。他们等于是发现了冰山的一角,如果细胞里存在非整倍体现象,那么一定会有很多的基因突变,或者基因组突变。
几乎就在同一时间,另外一帮科研人员发现,在人类基因组当中,平均每一个基因组里都含有80~100个具有潜在活力的L1元件(这是一种可以在整个基因组当中自我复制、自我粘贴的DNA元件),而且在大脑神经元细胞当中,这些L1元件都是有活性的。该研究,以及其它一些研究成果都证明,基因组至少是具备多样性可能的,但是这种变异的程度究竟有多大,没人说得清楚。
据美国国立精神卫生研究院( US National Institute of Mental Health)的 Thomas Insel介绍,他们还只是刚刚开始尝试去了解大脑细胞的分子多样性问题。在这个领域单细胞研究技术起到了关键性的作用,不仅仅是在确定神经元细胞和神经胶质细胞的(分类)类型方面,同时也有利于我们了解体验和发育对大脑某个区域里的基因表达有何作用。
科学家们可以用好几种方法发现单细胞基因组变异情况。美国哈佛大学医学院(Harvard Medical School)的Christopher Walsh团队就对300个取自死者大脑的神经元细胞进行了单细胞L1元件插入研究(Cell 151, 483–496, 2012)。他们只发现了几个 L1插入元件,这说明L1元件应该不是导致基因组多样性的主要原因,但至少在大脑皮质细胞和尾状核(caudate nucleus)细胞里是这样。
2013年,另外几个课题组也对单个人类神经元细胞进行了全基因组扫描研究。比如在2013年11月发表的文章就对3名健康人大脑的110个额皮质(frontal cortex)神经元细胞进行了全基因组测序研究,结果相当令人吃惊,他们发现在神经元细胞里有大量的大段CNV突变(Science 342, 632–637, 2013)。对源自健康人皮肤细胞的神经元细胞进行的研究也发现了同样的情况,而且这些神经元细胞里的CNV要比其来源的皮肤细胞更多,这说明这种源自iPS细胞的神经元细胞是一种非常好的研究材料,适合用于开展细胞多样性方面的研究工作。
实际上,虽然有了这些发现,但是神经科学家们还是很头疼,因为他们不知道这些体细胞突变意味着什么。美国弗吉尼亚大学(University of Virginia)的遗传学家Ira Hall也是去年这篇发表于《科学》上的文章的合作者之一,他认为这些研究意味着大脑对影响和干扰的抵抗力很弱,另外,遗传嵌合现象(genomic mosaicism)也能够影响人们罹患肿瘤和其它疾病的风险。为了明确大脑中哪些部位与其它部位相比更容易受到干扰,以及大脑不同区域间的差异有多大,科研人员们还得研究更多的细胞才能够找到答案。现在就在从事这方面研究的McConnell认为现在还是一无所知。
2.7 概念验证之后的工作
虽然单细胞技术已经有可能解决很多生命科学领域的重大问题,但是技术上的进步还远远没有结束。比如科研人员就必须研究如何将真正的生物学差异与试验技术本身的背景噪音区分开。瑞典KTH皇家理工学院(KTH Royal Institute of Technology in Sweden)的Joakim Lundeberg(他们实验室就曾经开发过组织RNA测序技术)就认为,单细胞RNA和DNA测序技术还远远算不上足够强大,他表示,他们还需要在一次试验中对更多的单细胞进行分析,以便解决背景噪声问题,这至少也能够加深他们对同一个组织里不同细胞之间差异的了解。
由于存在方方面面的问题,比如细胞分离、数据运算、以及用于不同领域时出现的特异性问题等等,所以Blainey希望在未来的几年里单细胞研究技术还能够有更大的进步。
对于新进入这个领域的人而言,光是选择哪一种转录组测序技术可能就够他们头疼半天的了。关于这个问题,应该视研究目的而定,比如是想对多个细胞进行分析,找出同型的转录子,还是想发现低丰度的RNA。“不过有多种方法可供选择总归是件好事。”Quake这样说道。在去年10月,Quake的课题组发现,如果将预处理时的反应体积控制在纳升级(他们使用的是Fluidigm公司提供的C1系统),那么单细胞qPCR技术和单细胞RNA测序技术的检测效果是差不多的(Nat. Methods 11,41–46,2014)。“这对于我们整个试验操作的可信度而言是一个重大的好消息。”Quake补充道。
随着商业化产品的推出,以及各个实验室经过多年实践总结出了自己的“独门秘笈”,基因组扩增技术的选择也在同步改善。不过由于每一个人使用的进行基因组扩增的技术都不一样,所以很难对不同的研究成果进行直接的比较。比如Xie就认为,他们感觉MALBAC技术要比MDA技术更好,但是这也要取决于你是如何进行MDA试验的。不过随着技术的不断进步,这两种技术都将会过时被淘汰,但我们也会继续改进这些技术,MALBAC一定会赢得最终的胜利,我们会让这项技术变得更好。
与此同时,从事肿瘤研究、脑神经科学研究、微生物研究、以及从事药物开发和其他领域研究的科研人员也都会从这些技术进步当中受益。而且这些技术进步也会吸引众多优秀的人才加入单细胞研究领域,比如已经在表观遗传学研究领域颇有建树的Reik等。Reik在去年才第一次参加单细胞学术会议,而在此之前还从来没有接触过单细胞研究,看到这么多新技术,Reik感到非常激动。他指出,最开始人们会因技术本身而激动,过不了多久,人们就会利用这些新技术去解决重要的生命科学问题,那将是更加令人激动的事情。
3. 单细胞分析技术——认识遗传多样性的利器
技术上的新进展已经让单细胞基因组测序技术(single-cell genome sequencing)逐渐成为了一项主流的检测手段,该领域的研究工作已经初步揭示出细胞之间在基因组结构(genetic architecture)与遗传变异性(genetic variability)方面的差异,这也反映出基因组并非一成不变的天然本质。
Flemming在1882年时发表的文章中绘制的单细胞基因组染色体模式图。
其实单细胞基因组分析这个项目很早就出现了,早在1882年就有人报告了昆虫唾液腺的单细胞图像,该图展示了多线染色体(polytene chromosomes)的带状结构。到了1935年,Calvin Bridges又发表了一幅类似的果蝇(Drosophila)细胞基因组图片,从这幅图中可以看出个体之间、品系之间,以及种系之间都存在大范围的基因组重排(genomic rearrangements)现象。最近研究人员也开展了大量的单细胞研究工作,使用的主要技术手段包括PCR和其它生化扩增技术。其中比较知名的工作包括在20年前开展的对单个精子细胞(single sperm cell)进行的重组热点(recombination hot-spot)研究,以及现在在人工辅助生殖工作中常规开展的胚胎植入前的胚胎单细胞遗传诊断工作(preimplantationgeneticdiagnoses)。既然单细胞检测技术已经发展了一个多世纪了,为什么现在才突然火起来呢?
我们认为这应该与最近取得突破的单细胞基因组测序工作有关。这主要包括以下三个方面:技术进步使全基因组及转录组扩增的效率大幅度提高;DNA测序技术的跨越式发展使得测序的通量更高,测序的成本更低;微流体技术(microfluidics)和荧光活化细胞分选技术(fluorescence-activated cell sorting)等不断涌现的新型单细胞试验技术。最近这5年,全世界各个实验室里出现了一大批单细胞研究论文,包括单细胞基因表达研究、单细胞基因组分析研究,以及商业化的服务等,这些工作对新技术的推广起到了非常重要的作用。单细胞基因组分析现在就是一个非常有影响力的技术,而且涉及了很多的方面,比如微生物生态学(microbial ecology)、肿瘤、产前诊断以及人类基因组结构及变异等。接下来我们将重点介绍这几个方面的最新进展,以及未来可能的发展方向。
|