Procházet zdrojové kódy

add jaccard index

master
LUYAO REN před 5 roky
rodič
revize
8168daa353
4 změnil soubory, kde provedl 11 přidání a 22 odebrání
  1. +4
    -0
      README.md
  2. +1
    -19
      Report.md
  3. +3
    -0
      inputJIpiarsFileExample.tsv
  4. +3
    -3
      tasks/jaccard_index.wdl

+ 4
- 0
README.md Zobrazit soubor

@@ -2,7 +2,11 @@

###1. 中华家系1号标准物质介绍

​ 建立高通量全基因组测序的生物计量和质量控制关键技术体系,是保障测序数据跨技术平台、跨实验室可比较、相关研究结果可重复、数据可共享的重要关键共性技术。建立国家基因组标准物质和基准数据集,突破基因组学的生物计量技术,是将测序技术转化成临床应用的重要环节与必经之路,目前国际上尚属空白。中国计量科学研究院与复旦大学、复旦大学泰州健康科学研究院共同研制了人源中华家系1号基因组标准物质(**Quartet,一套4个样本,编号分别为LCL5,LCL6,LCL7,LCL8,其中LCL5和LCL6为同卵双胞胎女儿,LCL7为父亲,LCL8为母亲**),以及相应的全基因组测序序列基准数据集(“量值”),为衡量基因序列检测准确与否提供一把“标尺”,成为保障基因测序数据可靠性的国家基准。人源中华家系1号基因组标准物质来源于泰州队列同卵双生双胞胎家庭,从遗传结构上体现了我国南北交界的人群结构特征,同时家系的设计也为“量值”的确定提供了遗传学依据。

​ 中华家系1号DNA标准物质的标称值包括高置信单核苷酸变异信息、高置信短插入缺失变异信息和77.9-78.1%的高置信参考基因组区。该系列标准物质可以用于评估基因组测序的性能,包括全基因组测序、全外显子测序、靶向测序,如基因捕获测序;还可用于评估测序过程和数据分析过程中对SNV和InDel检出的真阳性、假阳性、真阴性和假阴性水平,为基因组测序技术平台、实验室、相关产品的质量控制与性能验证提供标准物质和标准数据。

​ 该Quality_control APP用于全基因组测序(whole-genome sequencing,WGS)数据的质量评估。

###2. 分析流程图


+ 1
- 19
Report.md Zobrazit soubor

@@ -128,25 +128,7 @@
- False Positive
- False Negative

### 5. 附录

**(1) 中华家系1号DNA标准物质介绍**

​ 中华家系1号全基因组DNA标准物质由中国计量科学研究院与复旦大学、复旦大学泰州健康科学研究院共同研制。候选物来自同卵双胞胎家庭的永生化B淋巴母细胞系,志愿者选自复旦大学泰州队列,泰州地处我国南北交界,代表了中国人群典型的遗传结构特征。由于同卵双生双胞胎家庭的家系设计,可以通过孟德尔遗传定律进一步排除标称值确定过程中的可能错误。同时,中华家系1号转录组、蛋白质组和代谢物组的标准物质也在逐步研制中,通过多组学数据的整合分析可为标称值的确定提供了另一层面的生物学依据。

​ 中华家系1号DNA标准物质的标称值包括高置信单核苷酸变异信息、高置信短插入缺失变异信息和77.9-78.1%的高置信参考基因组区。该系列标准物质可以用于评估基因组测序的性能,包括全基因组测序、全外显子测序、靶向测序,如基因捕获测序;还可用于评估测序过程和数据分析过程中对SNV和InDel检出的真阳性、假阳性、真阴性和假阴性水平,为基因组测序技术平台、实验室、相关产品的质量控制与性能验证提供标准物质和标准数据。

![](./pictures/Picture1.png)

**(2) 数据分析方法与流程**

​ 数据分析流程如下图所示,利用Sentieon进行数据比对、比对后校正、突变分析和过滤,利用FastQC、Qualimap、MultiQC、RTGtools、R和in-house script进行数据的质量控制和评估。采用choppy分析调度和完成报告。

![](./pictures/Screen Shot 2019-07-31 at 12.40.56 AM.png)



###6. 声明
###5. 声明

​ 本质量检测报告,仅适用于此次实验测试数据,不代表对测序公司业务水平的评估。本质量检测报告,仅用于科学项目研究,请勿用于临床或商业。任何单位或个人因使用此检测报告结果造成的任何利益或损失(包括直接和间接损失),本单位不承担任何经济和法律责任。


+ 3
- 0
inputJIpiarsFileExample.tsv Zobrazit soubor

@@ -0,0 +1,3 @@
oss://choppy-cromwell-result/test-choppy/wgs_quartettest_renluyao_0827/72f269f2-91b7-4fbe-bde7-99b2e1e3091c/call-Haplotyper/Fudan_DNA_LCL7_hc.vcf oss://choppy-cromwell-result/test-choppy/wgs_quartettest_renluyao_0827/7a72d0e6-302d-43ca-b6b0-daeaa0236d06/call-Haplotyper/Fudan_DNA_LCL5_hc.vcf LCL7_LCL5
oss://choppy-cromwell-result/test-choppy/wgs_quartettest_renluyao_0827/8885b034-593a-49ff-bd3f-e8a32a71e43c/call-Haplotyper/Fudan_DNA_LCL8_hc.vcf oss://choppy-cromwell-result/test-choppy/wgs_quartettest_renluyao_0827/7a72d0e6-302d-43ca-b6b0-daeaa0236d06/call-Haplotyper/Fudan_DNA_LCL5_hc.vcf LCL8_LCL5
oss://choppy-cromwell-result/test-choppy/wgs_quartettest_renluyao_0827/72f269f2-91b7-4fbe-bde7-99b2e1e3091c/call-Haplotyper/Fudan_DNA_LCL7_hc.vcf oss://choppy-cromwell-result/test-choppy/wgs_quartettest_renluyao_0827/8885b034-593a-49ff-bd3f-e8a32a71e43c/call-Haplotyper/Fudan_DNA_LCL8_hc.vcf LCL7_LCL8

+ 3
- 3
tasks/jaccard_index.wdl Zobrazit soubor

@@ -14,10 +14,10 @@ task JI {
set -e

/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg bgzip ${vcf_a} -c > ${name_a}.rtg.vcf.gz
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg index -f vcf ${vcf_b}.rtg.vcf.gz
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg index -f vcf ${name_a}.rtg.vcf.gz
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg bgzip ${vcf_a} -c > ${name_b}.rtg.vcf.gz
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg index -f vcf ${vcf_b}.rtg.vcf.gz
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg vcfeval -b ${vcf_a} -c ${vcf_b} -o ${dir_name} -t ${sdf}
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg index -f vcf ${name_b}.rtg.vcf.gz
/opt/rtg-tools/dist/rtg-tools-3.10.1-4d58ead/rtg vcfeval -b ${name_a}.rtg.vcf.gz -c ${name_b}.rtg.vcf.gz -o ${dir_name} -t ${sdf}

>>>


Načítá se…
Zrušit
Uložit