|
4 years ago | |
---|---|---|
tasks | 4 years ago | |
.DS_Store | 4 years ago | |
README.md | 4 years ago | |
inputs | 4 years ago | |
workflow.wdl | 4 years ago |
Author: Li Zhihui
E-mail:18210700119@fudan.edu.cn
Git:
Last Updates: 2020/07/13
# 激活choppy环境
source activate choppy
# 安装app
choppy install lizhihui/test_dataportol1
建立高通量全基因组测序的生物计量和质量控制关键技术体系,是保障测序数据跨技术平台、跨实验室可比较、相关研究结果可重复、数据可共享的重要关键共性技术。建立国家基因组标准物质和基准数据集,突破基因组学的生物计量技术,是将测序技术转化成临床应用的重要环节与必经之路,目前国际上尚属空白。中国计量科学研究院与复旦大学、复旦大学泰州健康科学研究院共同研制了人源中华家系1号基因组标准物质(Quartet,一套4个样本,编号分别为LCL5,LCL6,LCL7,LCL8,其中LCL5和LCL6为同卵双胞胎女儿,LCL7为父亲,LCL8为母亲),以及相应的全基因组测序序列基准数据集(“量值”),为衡量基因序列检测准确与否提供一把“标尺”,成为保障基因测序数据可靠性的国家基准。人源中华家系1号基因组标准物质来源于泰州队列同卵双生双胞胎家庭,从遗传结构上体现了我国南北交界的人群结构特征,同时家系的设计也为“量值”的确定提供了遗传学依据。
该Quality_control APP用于转录组测序(RNA Sequencing,RNA-Seq)数据的质量评估,包括原始数据质控、比对数据质控和基因表达数据质控。
inputSamplesFile
#read1 #read2 #sample_id #adapter_sequence #adapter_sequence_r2
read1 是阿里云上fastq read1的地址
read2 是阿里云上fastq read2的地址
sample_id 是指样本的命名
adapter_sequence 是R1端需要去除的接头
adapter_sequence_r2 是R2端需要去除的接头
所有上传的文件应有规范的命名