安捷伦科技(中国)有限公司 品牌商

10 年

手机商铺

商家活跃:
产品热度:
品牌商

安捷伦科技(中国)有限公司

入驻年限:10 年

  • 联系人:

    安捷伦

  • 所在地区:

    上海

  • 业务范围:

    实验室仪器 / 设备、技术服务、医疗器械

  • 经营模式:

    生产厂商

在线沟通

公司新闻/正文

助力儿童罕见病诊断,这项检查你一定要了解

人阅读 发布时间:2022-01-25 14:54

「患儿,女,因 1 岁多时走路不稳就诊。外婆和母亲都有矮小、O 型腿、易骨折等症状」

 

面对上述病例,相信很多医生心中都有了初步判断,那下一步该如何确诊呢?

 

近些年,随着高通量测序技术的发展,全外显子组测序(WES)在诊断遗传性罕见病中扮演着越来越重要的角色。事实上,上述病例就发生在上海儿童医学中心,经过 WES 后,发现一个基因突变,该突变可引起「低磷性佝偻病」,因为发现得早,患儿通过补充维生素 D 和磷酸盐合剂,将来完全可以避免发生骨软化症、O 型腿等骨骼畸形症状。

 

然而,面对这项新技术,摆在临床医生面前的问题是,怎样挑选 WES 产品呢?

 

为了回答这个问题,我们需要直击 WES 产品选择时的四大问题。

 

 

第 1 击:哪些性能是我们在 WES 选择时需要考量的?

 

全面覆盖数据库收录的基因区域(包含所有外显子)是 WES 产品最基本的性能。首先,WES 产品必须依托更新的数据库收录的基因信息进行设计,除了基因的覆盖也要确保外显子的覆盖。其次,对于较难捕获区域,如高 GC 区应当优化探针设计策略,提升捕获效率。比如,常染色体显性多囊肾病(ADPKD)基因外显子多达 46 个、无突变热点、基因内存在重复、部分区域 GC 含量高[1]。对于该基因就既要求外显子覆盖全,又要求兼顾优化高 GC 区域。

 

第二个性能是特异性。特异性保障了探针所捕获下来的是我们的目标片段,业界常用中靶率(on-target rate)来评价这一指标。

 

第三个性能是均一性。由于不同区域的序列特点不一,探针捕获的表现不尽相同,如果探针均一性不好就会出现文库分子捕获不均匀,有些区域出现覆盖不足的情况,影响结果分析。一般我们用 20 × / 30 × 覆盖度或 fold-80 penalty 来评估这一指标。

 

最后一个性能是外显子组的设计大小。设计大小直接关系到所需的测序数据量大小,进而影响测序成本。

 

 

第 2 击:选择 WES 产品时的常见误区有哪些?

 

误区 1. 过分追求个别指标,而忽视了指标之间的关联性。WES 测序的目的就是全面检测致病基因和发现新的基因(突变),因而「全面覆盖」是前提。为了确保覆盖的全面性,在某些指标上是允许有所牺牲的。

 

误区 2. 误将部分指标性能与实际性能划等号。市面上有些 WES 产品在设计的时候,会放弃掉探针综合评分不高的区域(通常是高 GC 的较难捕获的区域),以保证产品的某些指标性能不被拉低,比如均一性。

 

误区 3. 片面的直接比较冠以相同名称的参数。各个指标的算法在行业内没有统一的标准,且这些指标受多个相关因素的影响。以中靶率为例,怎样的 reads 可被算为中靶的 reads、以哪个靶标区域来计算中靶率,均无统一标准。只要二者之一采用不同标准,同一份测序数据就会得到不同的中靶率。

 

 

第 3 击:WES 产品选择时应该关注哪些指标?

 

以数据库覆盖全为前提,综合考量中靶率、30 x 覆盖度等参数。常见性能包括均一性、特异性。均一性的指标包括 30 × 覆盖度、Fold-80 Penalty 等;特异性的指标通常用中靶率来衡量。

 

关于不同指标的意义、指标不好的影响,以及弥补方法可参见下表。

 

 

从这张表中我们可以看出,如果产品的数据库覆盖不全,是没有弥补方法的;而其它指标均是可以通过其它方法来弥补的。通常评估测序数据质量还会用到 Q30、比对率(mapping rate)、20 × 覆盖率,以及冗余率(duplication rate)。各项指标需要综合评估,但都应该以数据库完整覆盖为前提。

 

 

第 4 击:经常看到厂家宣传很高的中靶率和 30 × 覆盖度,靠谱吗?

 

指标的叫法虽然一样,但由于缺乏行业标准,有时这些指标所呈现的数据是建立在不同标准之下的。

 

注意点 1. 30 × 覆盖度与总的测序数据量有关,测序数据量越大,覆盖度越好。比如同一产品,测 10 G 的数据量与测 5 G 的数据量的情况下,10 G 数据量下被覆盖到 30 次的位点的比例肯定更多(图 1)。因此,如果要进行客观的比较,两款产品应该在相同的测序数据量下来比较 30 × 覆盖度。

图 1 覆盖度与总的测序数据量有关,测序数据量越大,覆盖度越好。如图,假定理想的覆盖度为 n×,在没有提高测序量的情况有,有一个外显子没有达到理想覆盖度(左,0.5n);通过提高测序量后,所有外显子均达到或超过了 n×(右)。

 

注意点 2. 靶标区域的定义和中靶 reads 的计算阈值标准都会影响中靶率。

 

 

背景知识:

 

捕获探针在从片段化的基因组  DNA 上捕获外显子组序列时无法做到 100% 特异性捕获,既会捕获下目标区域,也会把一些非外显子的区域捕获下来(无效区域)(图 2)。数据分析时,软件会将 reads 进行拼接,去除无效区域,最终获得完整的全外显子组测序结果。以鱼网来形容用来捕获靶标的探针,鱼网覆盖的区域通常会比鱼大,这样才能捕到所有的靶标。鱼就是所谓的目标区域(target region);网就是所谓 design region,也就是探针的设计区域,后者比前者更大。

 

图 2 为了完整捕获外显子,探针在设计时会有部分外延(延伸出外显子区域),因此探针所覆盖的设计区域要大于靶标区域。测序数据中外延区域的数据是无效数据。

 

中靶率是指比对到目标区域的 reads 的数量点总的 reads 数量的比例。用于比对 reads 的目标区域的选择,以及 reads 入组的阈值标准直接影响中靶率的计算。

靶标区域越大,能与它匹配上的 reads 数量越多

如果拿 design region 作为区域来计算中靶的 reads 数,中靶率就更高(图 3)。但这些为了捕获靶标区域而增加的其他区域对于我们是没有价值的;因此,我们更应该将 target region 作为目标区域来计算中靶率,以更好地反映捕获效率(特异性)。

 

图 3 以不同区域来比对 Reads,获得中靶 Reads 的数量就会不同。以 Target Region 来比对 Reads,中靶 Reads 数相对较少(绿色叠加到的峰面积);以 Design Region 来比对 Reads,中靶 Reads 数相对较多(橙色叠加到的峰面积),但含有无效 Reads。

 

 

什么样的 reads 被算为中靶 reads 又可以有不同定义

 

通常用来定义 reads 是否中靶的标准是:测出的 reads 要有一半以上的碱基与外显子组的靶标区域匹配,我们将这些 reads 称为 centered reads,只有 centered reads 才会被计算在内;业内也把仅有几个碱基匹配上的 reads 算为中靶,也就是说,那些质量比较差的数据也被纳入进来,这样分子就变得更大,中靶率就显得更高(图 4)。

 

图 4 业界一般将有一半以上碱基与靶标区域匹配的 reads(centered reads)计算为中靶。

 

所以,虽然几个指标的名称、叫法都一样,但由于计算方式与标准的不同,这些参数的价值就大打折扣。

 

最后,回归到如何甄选 WES 全外产品?

总结为十二个字:「以设计为根本,参数指标为佐」,即:数据库全覆盖、参数综合考量、性能对称比较。

 

参考文献:

[1]. Rossetti S, Strmecki L, Gamble V, et al. Mutation analysis of the entire PKD1 gene: genetic and diagnostic implications. Am J Hum Genet. 2001 Jan;68(1):46-63. 

 

上一篇

序鉴全景,靶握万象丨重磅新品,安捷伦 SureSelect Cancer CGP 肿瘤全景变异分析正式上市

下一篇

聚焦生物样品质量控制,安捷伦与海尔生物医疗达成合作

更多资讯

询价列表

暂时没有已询价产品

快捷询价 发送名片
    当你希望让更多商家联系你时,可以勾选后发送询价,平台会将你的询价消息推荐给更多商家。