瀏覽代碼

上传文件至 '.'

master
yingyu 6 年之前
父節點
當前提交
6ec623df55
共有 1 個文件被更改,包括 17 次插入10 次删除
  1. +17
    -10
      报告模板.md

+ 17
- 10
报告模板.md 查看文件

@@ -16,10 +16,13 @@
### 分析内容
1. 采用fastqc、fastqscreen、qualimap对数据进行质控分析,并使用multiqc进行可视化;
2. 使用 trimmomtic + hisat2 + stringtie + ballgown 构建的分析流程对转录组数据进行分析获得表达谱;
1. 采用FastQC、FastQ Screen、QualiMap对数据进行质控分析,并使用MultiQC进行可视化;
2. 使用 Trimmomatic + HISAT2+ StringTie + ballgown 构建的分析流程对转录组数据进行分析获得表达谱;
3. 根据获得的表达谱进行表达分析、差异基因分析,并进行功能分析(GO/KEGG);
### 主要结论
1. 基于Ensembl注释,我们获得了<!--?-->个样本<!--?-->个基因的表达图谱;
@@ -34,15 +37,15 @@
### 2.1 原始数据质量
通过`fastqc`软件获得的结果可知,本次转录组测序的原始数据量范围在(22~32)M reads之间,平均值为27 M reads;其碱基质量值在35之间,表明测序质量较好;GC含量、碱基含量、数据重复率、重复序列出现比例等指标均未见异常;通过`fastqc`检测,发现所得的原始数据内包含有较多的接头未去除,因此使用了`trimmomatic`软件先对原始文件进行去接头操作,之后数据分析的结果都使用的为去接头之后的数据(**clean data**)。
通过`FastQC`软件获得的结果可知,本次转录组测序的原始数据量范围在(22~32)M reads之间,平均值为27 M reads;其碱基质量值在35之间,表明测序质量较好;GC含量、碱基含量、数据重复率、重复序列出现比例等指标均未见异常;通过`FastQC`检测,发现所得的原始数据内包含有较多的接头未去除,因此使用了`Trimmomatic`软件先对原始文件进行去接头操作,之后数据分析的结果都使用的为去接头之后的数据(**clean data**)。
(注:`fastqc`软件结果说明参照 [fatqc introduction]( http://www.bioinformatics.babraham.ac.uk/projects/fastqc/))
(注:`FastQC`软件结果说明参照 [fatqc introduction]( http://www.bioinformatics.babraham.ac.uk/projects/fastqc/))
@data-table-js(dataUrl='./data/multiqc_general_stats.csv')
`fatqc`软件所获得的结果为每个样品所得到的结果,我们使用`multiqc`将本次测序所获得的所有样本数据质控情况集合在一个报告文件中进行可视化展示。
`FastQC`软件所获得的结果为每个样品所得到的结果,我们使用`MultiQC`将本次测序所获得的所有样本数据质控情况集合在一个报告文件中进行可视化展示。
(注:`multiqc`软件结果说明参照:https://multiqc.info/docs/#fastqc)
(注:`MultiQC`软件结果说明参照:https://multiqc.info/docs/#fastqc)
@multiqc(analysisDir='./data/fastqc')
@@ -60,11 +63,11 @@
### 2.2 比对结果质量
在对原始数据进行比对之后,我们获得了比对结果(即bam文件),可以通过使用`qualimap`软件对比对后的结果进行质控,主要关注数据的 mapping 上参考基因组的比例。
在对原始数据进行比对之后,我们获得了比对结果(即bam文件),可以通过使用`QualiMap`软件对比对后的结果进行质控,主要关注数据的 mapping 上参考基因组的比例。
通过比对质控的结果可知, 比对到人基因组读段比例在<!-- 97.5%左右,比例较高-->。
(注:`qualimap`软件结果说明:[Qualimap](http://qualimap.bioinfo.cipf.es/))
(注:`QualiMap`软件结果说明:[Qualimap](http://qualimap.bioinfo.cipf.es/))
@multiqc(analysisDir='./data/qualimap')
@@ -140,9 +143,13 @@ Gene Ontology(简称GO)是一个国际标准化的基因功能分类体系
利用fgsea包根据基因的表达水平进行基因功能分析,通路如下所示:
富集的通路结果:
@data-table-js(dataUrl='./data/rnaseq_gsea_curatedgenesets.csv')
<!-- @data-table-js(dataUrl='./data/rnaseq_gsea_go.csv') -->
富集的GO功能:
@data-table-js(dataUrl='./data/rnaseq_gsea_go.csv')
@@ -166,7 +173,7 @@ GO功能:
利用 [Trimmomatic](http://www.usadellab.org/cms/index.php?page=trimmomatic)软件对测序数据进行去接头引物和修剪低质量序列,利用 [HISAT2](http://ccb.jhu.edu/software/hisat2/faq.shtml)将高质量序列比对到人的参考基因组hg38上,基于Ensembl基因模型,利用[StringTie](http://ccb.jhu.edu/software/stringtie)进行转录本重构和定量,利用Ballgown对结果进行基因水平转化。此外,我们采用 [FastQC](https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)、[Fastq_Screen](http://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/)和[MultiQC](http://www.multiqc.info)等软件对测序数据进行质量评估,利用 [QualiMap](http://qualimap.bioinfo.cipf.es)对比对数据进行质量评估。主成分分析、相关性分析、聚类分析、差异基因和功能富集分析利用R/Bioconducter进行分析。
利用 [Trimmomatic](http://www.usadellab.org/cms/index.php?page=trimmomatic)软件对测序数据进行去接头引物和修剪低质量序列,利用 [HISAT2](http://ccb.jhu.edu/software/hisat2/faq.shtml)将高质量序列比对到人的参考基因组hg38上,基于Ensembl基因模型,利用[StringTie](http://ccb.jhu.edu/software/stringtie)进行转录本重构和定量,利用Ballgown对结果进行基因水平转化。此外,我们采用 [FastQC](https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)、[FastQ_Screen](http://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/)和[MultiQC](http://www.multiqc.info)等软件对测序数据进行质量评估,利用 [QualiMap](http://qualimap.bioinfo.cipf.es)对比对数据进行质量评估。主成分分析、相关性分析、聚类分析、差异基因和功能富集分析利用R/Bioconducter进行分析。
<!-- choppy report --project-dir ~/report --templ-dir /home/pgx/Zhanggroup_13_20190502 -m server -f -e --site-name 'RNA-seq Report' --site-author PGx --dev-addr 0.0.0.0:8002 --theme pgx_mkdocs -->

Loading…
取消
儲存