您好,欢迎来到仪器批发网 | 免费注册

张衡铜像落成揭幕暨中国仪器仪表行业拜祖大典举行

来源:仪器批发网2018-07-02 09:19:31浏览:2153

  在微生物组(microbiome)研究工作中,PCR 是极为常用的一种扩增手段,不过有很多因素都 会影响 PCR 结果,目前科研人员正在想办法解决这个问题。

  假如你想要研究某个湖里都有哪些微生 物,而你手里正拿着一瓶长满了微生物的该湖 的水质样品,那么你走运了。可是接下来该怎 么做呢?这取决于你想要研究什么问题。

  按照惯例,微生物组研究人员会使用 PCR 技术扩增水质样品里的 16S RNA 编码基 因。这些基因在原核生物间具有明显的种属特 异性,所以可以被当作“指纹”来鉴别样品 (包括土壤、海水、人体大便样品)中都含有 哪些微生物。美国南加州大学(University of Southern California)的海洋微生物学家 Jed Fuhrman 表示,PCR 技术在这个研究领域占据 着非常重要的地位。使用 PCR 技术可以很好地 扩增出目标基因,从而给科学研究提供许多非 常重要的信息。

  不过,现在越来越多的实验室开始使 用一种名为“鸟枪宏基因组学(shotgun metagenomics)”的新技术。这种技术会将 样品里所有的微生物 DNA 打成碎片,然后进 行测序、组装,给我们提供更加丰富的、涵盖 整个微生物基因组的信息。联合基因组研究所 (Joint Genome Institute)的分子生物学家 Nikos Kyrpides 指出,借助宏基因组学技术, 我们可以获得更多的信息。同时他认为,再做 16S RNA 分析,已经完全没有必要了。随着 基因组测序技术成本的不断降低,即便像美国 加州大学圣地亚哥分校医学院(University of California San Diego School of Medicine)的 Rob Knight 这样的 16S 铁粉,也开始慢慢接受 宏基因组学技术了。他表示,只要样品合适, 他们已经彻底倒向了宏基因组学技术。

  不过很多人还是和 Fuhrman 一样,依然是 16S 的拥趸,他们认为 16S 仍是微生物学家的 最佳搭档。据丹麦微生物学会(Denmark’s Center for Microbial Communities)的主席 Per Nielsen 表示,16S 分析的速度要快得多, 而且可以处理的样品也要多得多。这真的是一 种简便、低成本,而且非常可靠的研究手段。

  在样品数量有限,或者被其它非微生物细胞 严重污染的情况下,更能够凸显 16S 分析的优 势。不过,即便是这帮铁粉也都表示,在样 品来源不同的情况下,16S 分析极容易产生偏 倚,所以他们也都在继续完善这种分析技术。

  序列配对的重要性

  在整个生命树中,核糖体(ribosomes) 是固定不变的。16S rRNA 的序列也是高度保 守,而且非常特异的。这其中包括 9 个高度可 变区(hypervariable region),以及两端的相 对保守序列(conserved sequence)。这种 独特的序列在进行物种鉴定时是非常好的生物 学标志物。

  大部分实验室主要都使用 Illumina 等公司 生产的短片段测序仪(short-read sequencing platforms)进行研究,但是这些设备无法覆盖 全长达到 1500bp 以上的 16S 编码基因。因此, 16S 分析主要依靠 PCR 扩增技术,以其两端的 保守区域为目标序列,进行特异性的扩增和分 析。早在 1977 年,Carl Woese 等人就首次获得 了微生物的 16S 核酸序列。上世纪九十年代之 后,以 Sanger 测序法为基础的 16S 核酸分析技 术又升级成了效率更高、灵敏度也更高的 PCR 分析平台。即便到了几十年之后的今天,这些 “古老的”技术也没有被淘汰。据 Fuhrman 介 绍,差不多所有真正好的引物,都是在近几年 才被发现的。

  不过在 16S 序列的保守区域里,也还是存 在一些变异的,只不过程度没有高度可变区那 么高。在设计 PCR 引物时,不那么严格遵循 碱基互补配对原则的兼并引物,就可以与变异 度较低的序列结合。不过这并不是分析 16S 序 列的最佳方案。美国密歇根大学(University of Michigan)的微生物学家 Pat Schloss 就 认为,当我们在提到通用引物(universal primers)时,这个通用其实是要加引号的。 很多‘通用’引物其实很容易发生错配,并不 能很好地与目标序列配对结合,因此无法得到 目标片段的扩增产物。Knight 也指出,不应该 简单地将引物和目标序列看成抽象的、其行为 高度可预测的序列。这些分子在化学反应里会 有完全不同的表现,尤其在特定条件下进行杂 交时更是如此。

  Fuhrman 等人在 2016 年时曾经做过一项 研究,他们证明引物与目标模板之间的不匹配 情况完全不可预计。据 Fuhrman 介绍,在复 杂的混合物样品里,即使在序列中部有一个错 配,就会导致十倍的预估不足。但是如果样品 比较单一,结果就非常漂亮。反应条件的不同 也会影响 PCR 的容错能力。美国明尼苏达大 学(University of Minnesota)的 Daryl Gohl 等人在对一系列 16S PCR 反应条件进行分析之 后发现,某些具有校正功能的 PCR 聚合酶可 以对引物进行“编辑(primer editing)”, 来解决序列不匹配的问题 ( s e q u e n c e incompatibilities),以避免漏检。Gohl 指 出,我们现在已经可以发现引物里的错配问 题。具有校正功能的 PCR 聚合酶可以切掉引物里不匹配的序列,并且对其进行编辑,使引物 能够与目标模板更好地配对结合。

  因为有些引物“天生”就不能与某些目 标模板很好地匹配,所以上述研究工作还可以 帮助我们挑选出合适的引物。Schloss 表示, 他们一直都根据目标检测物来挑选引物,他对 于检测肠道微生物的引物非常满意,但他也非 常清楚,如果用这些引物来检测皮肤细菌,肯 定就会有漏检的情况发生。所以需要对这些引 物进行调整,比如让它们可以扩增出痤疮丙 酸杆菌(Propionibacterium)的片段。对于 每一个不同的微生物群落,都会存在这个问 题。Kyrpides 课题组最近发现利用鸟枪测序法 获得的宏基因组数据,在传统的 16S 分析工作 中,有一些“门(phyla)”被漏掉了。这个 问题在古细菌(Archaea)这个目前科研人员 还比较陌生的领域里显得尤为突出。Kyrpides 表示,对于一个谱系(lineages)而言,即便 是最好的引物,也会有 10% 的遗漏率。甚至 在某些特定的样品里,这些被漏掉的可能性 在整个群体里的比例高达 90%。所以 Kyrpides 等人才发现了一些“新的”细菌门(bacterial phylum)。这些细菌早就隐藏在宏基因组信息 里,但是用现有的 16S PCR 引物是无法检测到 的。

  从理论上来说,我们可以设计新的 16S 引物,来揪出那些“隐藏”的目标,不过 Nielsen 和他的同事 Mads Albertsen 却想出 了另外一种办法。他们的方案就是瞄准 rRNA 分子本身,而不是编码它们的基因。他们还 使用了一种不依赖核酸序列的分子标记技术 (sequence-independent molecular-tagging approach),可以借此扩增出整个 rRNA 序 列,而不再像以前那样,只能扩增出其中的某 一两个片段。据 Nielsen 介绍,在最初的实验 过程中,他们用这套技术获得了 100 万个小亚 单位序列——这和其他人 20 年获得的全长序列 一样多。从理论上来说,我们可以用这种技术 对地球上的所有生物进行测序,获得真正完整 的生命树(tree of life)。不过,Nielsen 也指 出,他们的方法非常复杂,而且需要花费大量 的人力,所以很难取代传统的 16S PCR 分析 技术。不过,我们可以用他们的技术构建参考 序列文库,从而帮助科研人员进行 16S 序列注 释。

  什么叫群落?

  PCR 反应是整个 16S 分析工作的中心, 除此之外还存在其它影响因素。比如最开始 的 DNA 样品制备就必须非常小心,针对不同 的环境样品要有不同的制备流程。对 PCR 产物的测序也需要有所变化。英国华威大学 (University of Warwick)的生物信息学家 Christopher Quince 就指出,虽然目前广泛使 用的 Illumina 公司出品的 MiSeq 等测序仪的可 靠性已比过去提高很多(过去的测序技术更容 易出错),但结果并不一定如我们想象的一 般理想。现在测序仪的出错率与过去相比是更 低了,但是新的技术也会带来新的错误,而且 这些错误更难解决。比如样品转换(sample switching)问题,即将一个样品的测序结果与 其它样品的结果混在一起。

  为了避免这些问题的出现,很多微生物 组学研究人员都主张在研究工作中使用有效 的对照。比如直接在实验样品里加入“内掺 序列(spike-in sequences)”来作为实验 的标记,或者用更常用的方式,即用人造微 生物群(mock communities)作为实验对照 组。Schloss 表示,在测序工作中,错误率 (error rate)等指标是非常重要的,引物的偏 倚(primer bias)也同样重要。最理想的状态 是,这些引物能够从混杂在环境样品中的一大 群微生物里,准确扩增出目标物种。Schloss 对此不是很乐观,他认为,如果大家都使用了 人工微生物群对照,哪怕只是对大肠杆菌进行 测序,那我们也算幸运了,毕竟这是一个好的 开始。

  实际上,很多研究工作都没有设置这些 对照组,这也是导致很多研究失败的原因之 一。Fuhrman 认为,设置这些对照还不是一种 常规的实验操作,但我真的希望这能够成为标 准的实验流程。就像我们做化学实验,也会先 用标准品做出一条标准曲线。那么为什么大家 都“忘记”设置这些对照组了呢?可能是因为 在最开始,就没有养成这种好习惯,因为当时 每多增加一组样品,就会增加一次成本,而且 当时的研究目的是获得更多的数据,而不那么 在乎数据的质量。还有些科研人员认为,在最 开始制定实验流程时,设置这些对照是有意义 的(比如可以鉴定样品的偏倚等),但是在后 面的工作中就没什么价值了。Knight 也指出, 过度依靠人工对照不仅不会消除实验偏倚,反 而会加重它,因为这很容易让实验更偏向对照 组,或者某个生物样本。

  但是即便如此,Knight 还是建议大家都 应该设置实验对照,以便及时发现实验错误。 Fuhrman 还提到,他们最近就是因为设置了人 工对照,所以才能够解释在实验中“丢失了” 海水样品里整个微生物门的离奇事件。他表 示,幸亏设置了实验对照,才能让他们在拿到 那个奇怪的测序结果之后做出合理的解释。

  支持还是反对

  拿到数据之后,最终的任务是确定每个 基因的序列,以及明确样品中都含有哪些微 生物。但是和对 16S 研究工作存在争议一样, 人们对于整个测序工作流程也还存在一些争 议。传统的做法是,让计算机根据序列的相似 性,对每一个扩增子序列进行分类,看看都属 于哪个操作分类单元(operational taxonomic units, OTU)。通常认为相似性大于 97% 就属 于同一个 OTU。科研人员可以使用这种方法, 以较高的效率将核糖体序列组织起来,然后根据现有的参考序列数据对这些核糖体序列进行 查询、比对等,以判断整个检测样品中都含有 (或不含有)某些微生物。不过,这种分类方 法有时也会失效。据 Gohl 介绍,如果你的样 品里有好几个待测物种,它们可能都属于一个 种(genus),或者更高一级的属,也就是很 有可能都属于同一个 OTU。如果出现了这种情 况,就无法区分了。

  还有一种办法是使用“扩增子序列变异 (amplicon sequence variants, ASV)”, 这种技术可以完全不需要计算机分类,而是 科研人员自己对整个扩增子序列进行分析。 从 Fuhrman 的角度来看,这种方法可以让他 从 16S 数据中获取更多有用的信息;与 OTU 相 比,也可以进行更大范围的数据比对。我们知 道,OTU 方法比较主观,而且不同的实验室之 间,采用的分类策略也各有不同。Fuhrman 表 示,对他而言,就是要获得更多的数据。他表 示,他们可以将非常高质量的数据进行整合, 但是不可能分析质量非常差的数据。另一方 面,这种方法可能会给需要从各种错误的测序 结果中筛选出有价值的变异序列的科研人员, 以及需要对各种“奇怪”微生物基因组数据进 行注释的科研人员带来很多麻烦。据 Schloss 介绍,比如,大肠杆菌的 1 6S 基因有 7 个拷 贝,但是这些基因拷贝却不是完全一样的,所 以你极有可能将大肠杆菌分成 7 个 ASV。

  这个因素还会影响定量研究。Fuhrman 指出,在不同细菌的基因组里,16S 编码基因 的数量差异极大,少的才几个,多的有几十 个,有些真核微生物甚至可以有数千个。使用 软件可以起到一定的辅助作用,但是通常使用 PCR 扩增之后,就无法再进行定量了。不过还 是可以提供非常有价值的、相对定量的信息。 Schloss 指出,根据对健康人群和结肠癌患者 的研究结果,他们可以对受试者肠道标本进行 检测,根据微生物组检测结果来判断其是否患 有结肠癌。这依据的就是定量结果。Knight 认 为,只要弄清了偏倚的原因和表现,一致性 (consistency)才是决定一个研究是否有科 学意义的关键。如果你使用同样的方法来检测 不同的样品,那么是否有偏倚就不那么重要 了,因为你的目的只是比较不同的样品里是否 含有同样的微生物。

  偏倚的真相

  很遗憾,不同的实验室之间并没有这种 一致性,所以还是无法将不同实验室得到的数 据合并起来,或者进行比较。Gohl 表示,不 同实验室之间的确存在非常大的差异,他们获 取数据的流程也完全不同。而其中的技术噪声 (technical noise)也已经达到了生物学变异 这个程度。

  鉴于此,目前出现了多个由多家科研机 构共同参与的科研项目。旨在了解变异的来 源,并建立可靠的实验流程,以提高一致性和 可重复性,这其中就包括地球微生物组项目 (Earth Microbiome Project, EMP)和微生 物组质控项目(Microbiome Quality Control project, MBQC)等。据作为 EMP 项目咨询委 员会成员的 Fuhrman 介绍,EMP 的最大作用 就是让不同来源的数据可以进行比较。这个项 目有将近 300 位科研人员参与,大家全都用同 样的方法来分析数据。经过 8 年的工作,EMP 项目已经建立起一整套有效的、用于分析 16S rRNA 的工作流程,尽管这还不是一套适用于 所有实验的操作规范。实际上,在 EMP 项目开 展之初,要求大家不论研究哪种样品,都必须 用同样的 DNA 制备方法时,遭遇到了很大的阻 力。这种统一的要求对于制定标准化流程很有 帮助,但是在实际的科研工作当中,却往往需 要做一些调整,才能得到更好的结果。

  因此,也有人提出,从事微生物组研 究的科研人员应该共享他们的实验流程和 数据分析方法,以便形成有结构的元数据 (metadata)。大多数科研人员都有责任上传 他们的 16S 数据,比如上传到 Sequence Read Archive 等公共数据库当中,供所有人使用, 不过这还远远不够。Quince 就表示,从分享研 究工作的角度来说,上传原始序列数据(raw sequences)其实没什么用处。你只有同时上 传元数据,才可以进行荟萃分析,可惜的是, 几乎没人这么干。现在还没人知道,应该如何 使用胡萝卜和大棒,才能有效地刺激科研人员 共享这些信息,但是 Knight 等人希望科研工作 的标准化和透明化能够成为趋势和潮流。据他 介绍,已经有一些科研人员开始遵循标准化的 实验流程。这有助于我们后期将他们获得的实 验数据进行整合,同时也有利于这些数据的重 复利用。

  虽然 16S 实验策略越来越强大,越来越可 靠,但还是有一些科学问题无法用这个平台 进行研究。比如,我们一直都很难用 16S 信息 在物种层面(species-level)去鉴定一个生物 (organism),也很难通过 16S 信息获得微生 物群落的功能特征(比如有哪些活化的代谢途 径等)。对于这些问题,使用鸟枪基因组测 序平台就更加合适,当然,现在有了读长更 长的测序仪,鸟枪测序法也会慢慢被淘汰。 Nielsen 表示,随着科技的发展,用不了几 年,我们不仅可以获得微生物 16S 基因的全长 序列,还可以获得全基因组序列。这只是一个 时间早晚的问题。

  16S 分析技术还没有被取代,各个实验室 如打算转换技术平台还需要周密考虑一下。 Knight 提醒,建立鸟枪测序实验流程的过程需 要很大投入——花费了他们好几年时间和数 百万美元。因此我们需要根据研究目的来挑选 合适的实验方法,很多时候,16S 技术其实才 是最合适的方案。Schloss 也指出,每一种实 验方法都有各自的偏倚,鸟枪法也不例外。如 果你的研究目标是在微生物组样品里了解微生 物群落层面的问题,那么虽然鸟枪法有偏倚, 但是我们也没有更好的替代方案了

  在微生物组(microbiome)研究工作中,PCR 是极为常用的一种扩增手段,不过有很多因素都 会影响 PCR 结果,目前科研人员正在想办法解决这个问题。

  假如你想要研究某个湖里都有哪些微生 物,而你手里正拿着一瓶长满了微生物的该湖 的水质样品,那么你走运了。可是接下来该怎 么做呢?这取决于你想要研究什么问题。

  按照惯例,微生物组研究人员会使用 PCR 技术扩增水质样品里的 16S RNA 编码基 因。这些基因在原核生物间具有明显的种属特 异性,所以可以被当作“指纹”来鉴别样品 (包括土壤、海水、人体大便样品)中都含有 哪些微生物。美国南加州大学(University of Southern California)的海洋微生物学家 Jed Fuhrman 表示,PCR 技术在这个研究领域占据 着非常重要的地位。使用 PCR 技术可以很好地 扩增出目标基因,从而给科学研究提供许多非 常重要的信息。

  不过,现在越来越多的实验室开始使 用一种名为“鸟枪宏基因组学(shotgun metagenomics)”的新技术。这种技术会将 样品里所有的微生物 DNA 打成碎片,然后进 行测序、组装,给我们提供更加丰富的、涵盖 整个微生物基因组的信息。联合基因组研究所 (Joint Genome Institute)的分子生物学家 Nikos Kyrpides 指出,借助宏基因组学技术, 我们可以获得更多的信息。同时他认为,再做 16S RNA 分析,已经完全没有必要了。随着 基因组测序技术成本的不断降低,即便像美国 加州大学圣地亚哥分校医学院(University of California San Diego School of Medicine)的 Rob Knight 这样的 16S 铁粉,也开始慢慢接受 宏基因组学技术了。他表示,只要样品合适, 他们已经彻底倒向了宏基因组学技术。

  不过很多人还是和 Fuhrman 一样,依然是 16S 的拥趸,他们认为 16S 仍是微生物学家的 最佳搭档。据丹麦微生物学会(Denmark’s Center for Microbial Communities)的主席 Per Nielsen 表示,16S 分析的速度要快得多, 而且可以处理的样品也要多得多。这真的是一 种简便、低成本,而且非常可靠的研究手段。

  在样品数量有限,或者被其它非微生物细胞 严重污染的情况下,更能够凸显 16S 分析的优 势。不过,即便是这帮铁粉也都表示,在样 品来源不同的情况下,16S 分析极容易产生偏 倚,所以他们也都在继续完善这种分析技术。

  序列配对的重要性

  在整个生命树中,核糖体(ribosomes) 是固定不变的。16S rRNA 的序列也是高度保 守,而且非常特异的。这其中包括 9 个高度可 变区(hypervariable region),以及两端的相 对保守序列(conserved sequence)。这种 独特的序列在进行物种鉴定时是非常好的生物 学标志物。

  大部分实验室主要都使用 Illumina 等公司 生产的短片段测序仪(short-read sequencing platforms)进行研究,但是这些设备无法覆盖 全长达到 1500bp 以上的 16S 编码基因。因此, 16S 分析主要依靠 PCR 扩增技术,以其两端的 保守区域为目标序列,进行特异性的扩增和分 析。早在 1977 年,Carl Woese 等人就首次获得 了微生物的 16S 核酸序列。上世纪九十年代之 后,以 Sanger 测序法为基础的 16S 核酸分析技 术又升级成了效率更高、灵敏度也更高的 PCR 分析平台。即便到了几十年之后的今天,这些 “古老的”技术也没有被淘汰。据 Fuhrman 介 绍,差不多所有真正好的引物,都是在近几年 才被发现的。

  不过在 16S 序列的保守区域里,也还是存 在一些变异的,只不过程度没有高度可变区那 么高。在设计 PCR 引物时,不那么严格遵循 碱基互补配对原则的兼并引物,就可以与变异 度较低的序列结合。不过这并不是分析 16S 序 列的最佳方案。美国密歇根大学(University of Michigan)的微生物学家 Pat Schloss 就 认为,当我们在提到通用引物(universal primers)时,这个通用其实是要加引号的。 很多‘通用’引物其实很容易发生错配,并不 能很好地与目标序列配对结合,因此无法得到 目标片段的扩增产物。Knight 也指出,不应该 简单地将引物和目标序列看成抽象的、其行为 高度可预测的序列。这些分子在化学反应里会 有完全不同的表现,尤其在特定条件下进行杂 交时更是如此。

  Fuhrman 等人在 2016 年时曾经做过一项 研究,他们证明引物与目标模板之间的不匹配 情况完全不可预计。据 Fuhrman 介绍,在复 杂的混合物样品里,即使在序列中部有一个错 配,就会导致十倍的预估不足。但是如果样品 比较单一,结果就非常漂亮。反应条件的不同 也会影响 PCR 的容错能力。美国明尼苏达大 学(University of Minnesota)的 Daryl Gohl 等人在对一系列 16S PCR 反应条件进行分析之 后发现,某些具有校正功能的 PCR 聚合酶可 以对引物进行“编辑(primer editing)”, 来解决序列不匹配的问题 ( s e q u e n c e incompatibilities),以避免漏检。Gohl 指 出,我们现在已经可以发现引物里的错配问 题。具有校正功能的 PCR 聚合酶可以切掉引物里不匹配的序列,并且对其进行编辑,使引物 能够与目标模板更好地配对结合。

  因为有些引物“天生”就不能与某些目 标模板很好地匹配,所以上述研究工作还可以 帮助我们挑选出合适的引物。Schloss 表示, 他们一直都根据目标检测物来挑选引物,他对 于检测肠道微生物的引物非常满意,但他也非 常清楚,如果用这些引物来检测皮肤细菌,肯 定就会有漏检的情况发生。所以需要对这些引 物进行调整,比如让它们可以扩增出痤疮丙 酸杆菌(Propionibacterium)的片段。对于 每一个不同的微生物群落,都会存在这个问 题。Kyrpides 课题组最近发现利用鸟枪测序法 获得的宏基因组数据,在传统的 16S 分析工作 中,有一些“门(phyla)”被漏掉了。这个 问题在古细菌(Archaea)这个目前科研人员 还比较陌生的领域里显得尤为突出。Kyrpides 表示,对于一个谱系(lineages)而言,即便 是最好的引物,也会有 10% 的遗漏率。甚至 在某些特定的样品里,这些被漏掉的可能性 在整个群体里的比例高达 90%。所以 Kyrpides 等人才发现了一些“新的”细菌门(bacterial phylum)。这些细菌早就隐藏在宏基因组信息 里,但是用现有的 16S PCR 引物是无法检测到 的。

  从理论上来说,我们可以设计新的 16S 引物,来揪出那些“隐藏”的目标,不过 Nielsen 和他的同事 Mads Albertsen 却想出 了另外一种办法。他们的方案就是瞄准 rRNA 分子本身,而不是编码它们的基因。他们还 使用了一种不依赖核酸序列的分子标记技术 (sequence-independent molecular-tagging approach),可以借此扩增出整个 rRNA 序 列,而不再像以前那样,只能扩增出其中的某 一两个片段。据 Nielsen 介绍,在最初的实验 过程中,他们用这套技术获得了 100 万个小亚 单位序列——这和其他人 20 年获得的全长序列 一样多。从理论上来说,我们可以用这种技术 对地球上的所有生物进行测序,获得真正完整 的生命树(tree of life)。不过,Nielsen 也指 出,他们的方法非常复杂,而且需要花费大量 的人力,所以很难取代传统的 16S PCR 分析 技术。不过,我们可以用他们的技术构建参考 序列文库,从而帮助科研人员进行 16S 序列注 释。

  什么叫群落?

  PCR 反应是整个 16S 分析工作的中心, 除此之外还存在其它影响因素。比如最开始 的 DNA 样品制备就必须非常小心,针对不同 的环境样品要有不同的制备流程。对 PCR 产物的测序也需要有所变化。英国华威大学 (University of Warwick)的生物信息学家 Christopher Quince 就指出,虽然目前广泛使 用的 Illumina 公司出品的 MiSeq 等测序仪的可 靠性已比过去提高很多(过去的测序技术更容 易出错),但结果并不一定如我们想象的一 般理想。现在测序仪的出错率与过去相比是更 低了,但是新的技术也会带来新的错误,而且 这些错误更难解决。比如样品转换(sample switching)问题,即将一个样品的测序结果与 其它样品的结果混在一起。

  为了避免这些问题的出现,很多微生物 组学研究人员都主张在研究工作中使用有效 的对照。比如直接在实验样品里加入“内掺 序列(spike-in sequences)”来作为实验 的标记,或者用更常用的方式,即用人造微 生物群(mock communities)作为实验对照 组。Schloss 表示,在测序工作中,错误率 (error rate)等指标是非常重要的,引物的偏 倚(primer bias)也同样重要。最理想的状态 是,这些引物能够从混杂在环境样品中的一大 群微生物里,准确扩增出目标物种。Schloss 对此不是很乐观,他认为,如果大家都使用了 人工微生物群对照,哪怕只是对大肠杆菌进行 测序,那我们也算幸运了,毕竟这是一个好的 开始。

  实际上,很多研究工作都没有设置这些 对照组,这也是导致很多研究失败的原因之 一。Fuhrman 认为,设置这些对照还不是一种 常规的实验操作,但我真的希望这能够成为标 准的实验流程。就像我们做化学实验,也会先 用标准品做出一条标准曲线。那么为什么大家 都“忘记”设置这些对照组了呢?可能是因为 在最开始,就没有养成这种好习惯,因为当时 每多增加一组样品,就会增加一次成本,而且 当时的研究目的是获得更多的数据,而不那么 在乎数据的质量。还有些科研人员认为,在最 开始制定实验流程时,设置这些对照是有意义 的(比如可以鉴定样品的偏倚等),但是在后 面的工作中就没什么价值了。Knight 也指出, 过度依靠人工对照不仅不会消除实验偏倚,反 而会加重它,因为这很容易让实验更偏向对照 组,或者某个生物样本。

  但是即便如此,Knight 还是建议大家都 应该设置实验对照,以便及时发现实验错误。 Fuhrman 还提到,他们最近就是因为设置了人 工对照,所以才能够解释在实验中“丢失了” 海水样品里整个微生物门的离奇事件。他表 示,幸亏设置了实验对照,才能让他们在拿到 那个奇怪的测序结果之后做出合理的解释。

  支持还是反对

  拿到数据之后,最终的任务是确定每个 基因的序列,以及明确样品中都含有哪些微 生物。但是和对 16S 研究工作存在争议一样, 人们对于整个测序工作流程也还存在一些争 议。传统的做法是,让计算机根据序列的相似 性,对每一个扩增子序列进行分类,看看都属 于哪个操作分类单元(operational taxonomic units, OTU)。通常认为相似性大于 97% 就属 于同一个 OTU。科研人员可以使用这种方法, 以较高的效率将核糖体序列组织起来,然后根据现有的参考序列数据对这些核糖体序列进行 查询、比对等,以判断整个检测样品中都含有 (或不含有)某些微生物。不过,这种分类方 法有时也会失效。据 Gohl 介绍,如果你的样 品里有好几个待测物种,它们可能都属于一个 种(genus),或者更高一级的属,也就是很 有可能都属于同一个 OTU。如果出现了这种情 况,就无法区分了。

  还有一种办法是使用“扩增子序列变异 (amplicon sequence variants, ASV)”, 这种技术可以完全不需要计算机分类,而是 科研人员自己对整个扩增子序列进行分析。 从 Fuhrman 的角度来看,这种方法可以让他 从 16S 数据中获取更多有用的信息;与 OTU 相 比,也可以进行更大范围的数据比对。我们知 道,OTU 方法比较主观,而且不同的实验室之 间,采用的分类策略也各有不同。Fuhrman 表 示,对他而言,就是要获得更多的数据。他表 示,他们可以将非常高质量的数据进行整合, 但是不可能分析质量非常差的数据。另一方 面,这种方法可能会给需要从各种错误的测序 结果中筛选出有价值的变异序列的科研人员, 以及需要对各种“奇怪”微生物基因组数据进 行注释的科研人员带来很多麻烦。据 Schloss 介绍,比如,大肠杆菌的 1 6S 基因有 7 个拷 贝,但是这些基因拷贝却不是完全一样的,所 以你极有可能将大肠杆菌分成 7 个 ASV。

  这个因素还会影响定量研究。Fuhrman 指出,在不同细菌的基因组里,16S 编码基因 的数量差异极大,少的才几个,多的有几十 个,有些真核微生物甚至可以有数千个。使用 软件可以起到一定的辅助作用,但是通常使用 PCR 扩增之后,就无法再进行定量了。不过还 是可以提供非常有价值的、相对定量的信息。 Schloss 指出,根据对健康人群和结肠癌患者 的研究结果,他们可以对受试者肠道标本进行 检测,根据微生物组检测结果来判断其是否患 有结肠癌。这依据的就是定量结果。Knight 认 为,只要弄清了偏倚的原因和表现,一致性 (consistency)才是决定一个研究是否有科 学意义的关键。如果你使用同样的方法来检测 不同的样品,那么是否有偏倚就不那么重要 了,因为你的目的只是比较不同的样品里是否 含有同样的微生物。

  偏倚的真相

  很遗憾,不同的实验室之间并没有这种 一致性,所以还是无法将不同实验室得到的数 据合并起来,或者进行比较。Gohl 表示,不 同实验室之间的确存在非常大的差异,他们获 取数据的流程也完全不同。而其中的技术噪声 (technical noise)也已经达到了生物学变异 这个程度。

  鉴于此,目前出现了多个由多家科研机 构共同参与的科研项目。旨在了解变异的来 源,并建立可靠的实验流程,以提高一致性和 可重复性,这其中就包括地球微生物组项目 (Earth Microbiome Project, EMP)和微生 物组质控项目(Microbiome Quality Control project, MBQC)等。据作为 EMP 项目咨询委 员会成员的 Fuhrman 介绍,EMP 的最大作用 就是让不同来源的数据可以进行比较。这个项 目有将近 300 位科研人员参与,大家全都用同 样的方法来分析数据。经过 8 年的工作,EMP 项目已经建立起一整套有效的、用于分析 16S rRNA 的工作流程,尽管这还不是一套适用于 所有实验的操作规范。实际上,在 EMP 项目开 展之初,要求大家不论研究哪种样品,都必须 用同样的 DNA 制备方法时,遭遇到了很大的阻 力。这种统一的要求对于制定标准化流程很有 帮助,但是在实际的科研工作当中,却往往需 要做一些调整,才能得到更好的结果。

  因此,也有人提出,从事微生物组研 究的科研人员应该共享他们的实验流程和 数据分析方法,以便形成有结构的元数据 (metadata)。大多数科研人员都有责任上传 他们的 16S 数据,比如上传到 Sequence Read Archive 等公共数据库当中,供所有人使用, 不过这还远远不够。Quince 就表示,从分享研 究工作的角度来说,上传原始序列数据(raw sequences)其实没什么用处。你只有同时上 传元数据,才可以进行荟萃分析,可惜的是, 几乎没人这么干。现在还没人知道,应该如何 使用胡萝卜和大棒,才能有效地刺激科研人员 共享这些信息,但是 Knight 等人希望科研工作 的标准化和透明化能够成为趋势和潮流。据他 介绍,已经有一些科研人员开始遵循标准化的 实验流程。这有助于我们后期将他们获得的实 验数据进行整合,同时也有利于这些数据的重 复利用。

  虽然 16S 实验策略越来越强大,越来越可 靠,但还是有一些科学问题无法用这个平台 进行研究。比如,我们一直都很难用 16S 信息 在物种层面(species-level)去鉴定一个生物 (organism),也很难通过 16S 信息获得微生 物群落的功能特征(比如有哪些活化的代谢途 径等)。对于这些问题,使用鸟枪基因组测 序平台就更加合适,当然,现在有了读长更 长的测序仪,鸟枪测序法也会慢慢被淘汰。 Nielsen 表示,随着科技的发展,用不了几 年,我们不仅可以获得微生物 16S 基因的全长 序列,还可以获得全基因组序列。这只是一个 时间早晚的问题。

  16S 分析技术还没有被取代,各个实验室 如打算转换技术平台还需要周密考虑一下。 Knight 提醒,建立鸟枪测序实验流程的过程需 要很大投入——花费了他们好几年时间和数 百万美元。因此我们需要根据研究目的来挑选 合适的实验方法,很多时候,16S 技术其实才 是最合适的方案。Schloss 也指出,每一种实 验方法都有各自的偏倚,鸟枪法也不例外。如 果你的研究目标是在微生物组样品里了解微生 物群落层面的问题,那么虽然鸟枪法有偏倚, 但是我们也没有更好的替代方案了

相关文章