RNA-seq Download QC analysis
選択できるのは25トピックまでです。 トピックは、先頭が英数字で、英数字とダッシュ('-')を使用した35文字以内のものにしてください。
yingyu f22e92b573 上传文件至 '.' 5年前
构建方法说明 上传文件至 '构建方法说明' 5年前
README.md 上传文件至 '.' 5年前
RNAseq_sexcheck.R 上传文件至 '.' 5年前
sexgenelist.txt 上传文件至 '.' 5年前

README.md

RNA-seq QC

[TOC]

RNA-seq下游数据分析-ballgown到报告。 以Rscript为主,对接PGx RNA-seq choppy现有pipeline,到生成RNA-seq分析报告所需的rds和csv文件。

整体流程图

包括一下几个文件:

  1. RNAseq_sexcheck.R:基于表达水平推测样本的性别

Quick start

  1. 准备文件:

    1. 表达谱
  2. 确认事项:

    1. 所在机器的R/bioconductot安装包已完成(请参考library节查看)

    服务器:10.157.72.53已完成包的安装

    1. 代码

      1. 代码:RNAseq_sexcheck.R
      2. 参考文件:sexgenelist.txt
  3. 运行以下命令:

   Rscript RNAseq_sexcheck.R -i geneexp_log2fpkm.txt 
  1. 将结果上传至报告系统所在服务器,并编辑{报告模板.md}的第一部分(实验目的、主要结论),完成并运行报告。

RNAseq_sexcheck.R

功能简介

基于表达水平推测样本的性别。

注意:如果数据经过低表达水平过滤,那么性别特异基因可能会被过滤掉而无法进行准确预测。

代码参数

Usage: Rscript RNAseq_sexcheck.R [options]


Options:
    -o OUT_DIR, --out_dir=OUT_DIR
        The output directory [default ./]

    -i INPUT, --input=INPUT
        The input expression files. required!

    -e TYPE_GENE_ID, --type_gene_id=TYPE_GENE_ID
        The type of gene symbol. Could be either of EnsemblID/EntrezID/GeneSymbol [default: EnsemblID]

    -b FALSE, --pre_lowexpr_filtered=FALSE
        Whether pre-filterd low expressed genes in the input file or not. [default: FALSE]
        
    -s SEX_GENES, --sex_genes=SEX_GENES
        File in tab-delimited format sex gene list with EnsemblID/EntrezID/GeneSymbol. [default: ./sexgenelist.txt ]

    -p PROJECT_CODE, --project_code=PROJECT_CODE
        Project code, which is used as prefix of output file. [default: rnaseq]

    -h, --help
        Show this help message and exit

参数解释

参数 取值类型 解释 例如
-o OUT_DIR, --out_dir=OUT_DIR character 输出路径,默认为./。可加“/”也可不加“/” ./
-i INPUT, --input=INPUT character 输入文件名,必须输入。输入表达谱必须是log scaled的tab分隔的表达谱,可以是RNAseqDownstream2report仓库RNAseq_1_ballgown.R/RNAseq_1_stringtie.R的输出文件。 example.txt
-e TYPE_GENE_ID, --type_gene_id=TYPE_GENE_ID character
-b FALSE, --pre_lowexpr_filtered=FALSE TRUE/FALSE 输入的表达谱文件是否进行过低表达值过滤。 FALSE
-s SEX_GENES, --sex_genes=SEX_GENES character 性别特异基因的文件 ./sexgenelist.txt
-p PROJECT_CODE, --project_code=PROJECT_CODE character project代号,输出文件的前缀,默认rnaseq rnaseq
-h, --help 查看帮助文档并退出 -h

各样本的各PC值,choppy report所需的scatterplot图的rds和csv文件,(其中绘图时仅需rds文件,csv文件就看看):

rnaseq_sexpredict.csv 逗号分隔的预测结果,包括两列,第一列为样本名(来自于输入文件的列名),第二列为预测的性别结果。 rnaseq_sexpredict.rds R对象

内容如下:

Sample,Sex

P1,Female

P10,Female

P11,Female

P12,Male

运行示例

#最少输入
Rscript RNAseq_sexcheck.R -i geneexp_log2fpkm.txt 
#其他输入
Rscript RNAseq_sexcheck.R -i FUSCCTNBC_RNAseqShi.Complete_log2_448x45308_V15_190209.txt -p 111 -s ./sexgenelist.txt -e GeneSymbol

choppy report

@data-table-js(dataUrl='/yourdir/data/rnaseq_sexpredict.csv')

Example data

oss://choppy-app-example-data/RNAseqQC_example/ 13例RNA-seq数据。

R library

R library used:

library(optparse) #all

​ 如果需要安装,运行

install.packages("optparse")