RNA-seq Download QC analysis
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

преди 5 години
преди 6 години
преди 6 години
преди 6 години
преди 6 години
преди 6 години
преди 6 години
преди 6 години
преди 6 години
преди 6 години
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156
  1. # RNA-seq QC
  2. [TOC]
  3. RNA-seq下游数据分析-ballgown到报告。 以Rscript为主,对接PGx RNA-seq choppy现有pipeline,到生成RNA-seq分析报告所需的rds和csv文件。
  4. ## 整体流程图
  5. 包括一下几个文件:
  6. 1. **RNAseq_sexcheck.R**:基于表达水平推测样本的性别
  7. # Quick start
  8. 1. 准备文件:
  9. 1. 表达谱
  10. 2. 确认事项:
  11. 1. 所在机器的R/bioconductot安装包已完成(请参考library节查看)
  12. 服务器:10.157.72.53已完成包的安装
  13. 2. 代码
  14. 1. 代码:RNAseq_sexcheck.R
  15. 2. 参考文件:sexgenelist.txt
  16. 3. 运行以下命令:
  17. ```shell
  18. Rscript RNAseq_sexcheck.R -i geneexp_log2fpkm.txt
  19. ```
  20. 4. 将结果上传至报告系统所在服务器,并编辑{报告模板.md}的第一部分(实验目的、主要结论),完成并运行报告。
  21. ## RNAseq_sexcheck.R
  22. ### 功能简介
  23. 基于表达水平推测样本的性别。
  24. 注意:如果数据经过低表达水平过滤,那么性别特异基因可能会被过滤掉而无法进行准确预测。
  25. ### 代码参数
  26. ```shell
  27. Usage: Rscript RNAseq_sexcheck.R [options]
  28. Options:
  29. -o OUT_DIR, --out_dir=OUT_DIR
  30. The output directory [default ./]
  31. -i INPUT, --input=INPUT
  32. The input expression files. required!
  33. -e TYPE_GENE_ID, --type_gene_id=TYPE_GENE_ID
  34. The type of gene symbol. Could be either of EnsemblID/EntrezID/GeneSymbol [default: EnsemblID]
  35. -b FALSE, --pre_lowexpr_filtered=FALSE
  36. Whether pre-filterd low expressed genes in the input file or not. [default: FALSE]
  37. -s SEX_GENES, --sex_genes=SEX_GENES
  38. File in tab-delimited format sex gene list with EnsemblID/EntrezID/GeneSymbol. [default: ./sexgenelist.txt ]
  39. -p PROJECT_CODE, --project_code=PROJECT_CODE
  40. Project code, which is used as prefix of output file. [default: rnaseq]
  41. -h, --help
  42. Show this help message and exit
  43. ```
  44. **参数解释**
  45. | 参数 | 取值类型 | 解释 | 例如 |
  46. | -------------------------------------------- | ---------- | ------------------------------------------------------------ | ----------------- |
  47. | -o OUT_DIR, --out_dir=OUT_DIR | character | 输出路径,默认为./。可加“/”也可不加“/” | ./ |
  48. | -i INPUT, --input=INPUT | character | 输入文件名,**必须输入。**输入表达谱必须是log scaled的tab分隔的表达谱,可以是[RNAseqDownstream2report](http://choppy.3steps.cn/yingyu/RNAseqDownstream2report)仓库RNAseq_1_ballgown.R/RNAseq_1_stringtie.R的输出文件。 | example.txt |
  49. | -e TYPE_GENE_ID, --type_gene_id=TYPE_GENE_ID | character | | |
  50. | -b FALSE, --pre_lowexpr_filtered=FALSE | TRUE/FALSE | 输入的表达谱文件是否进行过低表达值过滤。 | FALSE |
  51. | -s SEX_GENES, --sex_genes=SEX_GENES | character | 性别特异基因的文件 | ./sexgenelist.txt |
  52. | -p PROJECT_CODE, --project_code=PROJECT_CODE | character | project代号,输出文件的前缀,默认rnaseq | rnaseq |
  53. | -h, --help | | 查看帮助文档并退出 | -h |
  54. 各样本的各PC值,choppy report所需的scatterplot图的rds和csv文件,(其中绘图时仅需rds文件,csv文件就看看):
  55. rnaseq_sexpredict.csv 逗号分隔的预测结果,包括两列,第一列为样本名(来自于输入文件的列名),第二列为预测的性别结果。
  56. rnaseq_sexpredict.rds R对象
  57. 内容如下:
  58. > Sample,Sex
  59. >
  60. > P1,Female
  61. >
  62. > P10,Female
  63. >
  64. > P11,Female
  65. >
  66. > P12,Male
  67. ### 运行示例
  68. ```shell
  69. #最少输入
  70. Rscript RNAseq_sexcheck.R -i geneexp_log2fpkm.txt
  71. #其他输入
  72. Rscript RNAseq_sexcheck.R -i FUSCCTNBC_RNAseqShi.Complete_log2_448x45308_V15_190209.txt -p 111 -s ./sexgenelist.txt -e GeneSymbol
  73. ```
  74. ### choppy report
  75. ```
  76. @data-table-js(dataUrl='/yourdir/data/rnaseq_sexpredict.csv')
  77. ```
  78. # Example data
  79. oss://choppy-app-example-data/RNAseqQC_example/ 13例RNA-seq数据。
  80. ## R library
  81. R library used:
  82. ```R
  83. library(optparse) #all
  84. ```
  85. ​ 如果需要安装,运行
  86. ```R
  87. install.packages("optparse")
  88. ```