A tool for multi-genome mapping and quality control.
Vous ne pouvez pas sélectionner plus de 25 sujets Les noms de sujets doivent commencer par une lettre ou un nombre, peuvent contenir des tirets ('-') et peuvent comporter jusqu'à 35 caractères.

readme.md 3.2KB

il y a 3 ans
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899
  1. > Author : Zhihui Li, Qingwang Chen
  2. >
  3. > E-mail:[18210700119@fudan.edu.cn](mailto:18210700119@fudan.edu.cn), [20110700030@fudan.edu.cn](mailto:20110700030@fudan.edu.cn)
  4. >
  5. > Git: <http://choppy.3steps.cn/lizhihui/fastqscreen.git>
  6. >
  7. > Last Updates: 24/12/2021
  8. ## 简介
  9. FastQ Screen是通过定量比对到一组参考基因组上的reads比例,验证DNA样品来源的工具。它把把常见的基因组建个索引,然后逐个比对,哪个比对最高,就是哪个污染。当需要确认来源基因组时,需要针对多个基因组进行比对。它通过定量比对到一组参考基因组上的reads比例,验证DNA样品来源的工具。FastQ Screen旨在常规地用作一种质量控制措施和分析DNA来源不确定或具有多种来源的样品。针对多个基因组进行比对对检测污染或鉴定样品互换也是有用的,若不检测,可能导致错误的实验结果。`fastqscreen`是用于 [Choppy-pipe](http://choppy.3steps.cn/) 系统使用的 APP。
  10. ## 快速安装及使用
  11. #### Requirements
  12. - Choppy
  13. - Ali-Cloud
  14. - Linux
  15. 在终端中输入以下命令即可快速安装本APP。
  16. ```bash
  17. # 激活choppy环境
  18. $ source activate choppy (open-choppy-env)
  19. # 第一次安装
  20. $ choppy install chenqingwang/fastqscreen
  21. # 非第一次安装
  22. $ choppy install chenqingwang/fastqscreen -f
  23. # 查询已安装APP
  24. $ choppy apps
  25. ```
  26. #### Quick Start
  27. ```bash
  28. # 准备 samples.csv 文件
  29. $ choppy samples chenqingwang/fastqscreen-latest > samples.csv
  30. # 准备无默认参数的samples.csv 文件
  31. choppy samples --no-default chenqingwang/fastqscreen-latest > samples.csv
  32. # 提交任务
  33. $ choppy batch chenqingwang/fastqscreen-latest samples.csv -p Your_project_name -l Your_label
  34. # 查询任务运行状况
  35. $ choppy query -L Your_label | grep "status"
  36. # 查询失败任务
  37. $ choppy search -s Failed -p Your_project_name -u chenqingwang --short-format
  38. # 结果文件地址
  39. $ oss://choppy-cromwell-result/test-choppy/Your_project_name/
  40. ```
  41. ### 任务输出
  42. 任务成功结束后,便可以在阿里云相应的OSS端生成相应的结果文件。包括测序原始数据对多个基因组进行比对产生的包含来源基因组信息的`html`、`png`、`txt`文件。
  43. ## APP流程概述
  44. ​ FastQ Screen把常见的基因组建个索引,然后逐个比对,哪个比对最高,就是哪个污染。是高通量测序分析中常见的工具,用于评估样品是否被其他物种污染,常见的有支原体污染,接头污染等,一般会整合到分析流程中,作为质控的一部分。
  45. ## 输出文件说明
  46. 运行APP后,
  47. 每个sample对应一个文件夹,内部结构如下:
  48. - call-fastq_screen
  49. - <sample_id>_screen.html
  50. - <sample_id>_screen.png
  51. - <sample_id>_screen.txt
  52. ## 软件版本及参数
  53. ### 软件版本
  54. fastqscreen: 0.12.0
  55. ### 使用参数
  56. 1. disk_size: 300
  57. 2. fastq_screen_reference: oss://pgx-reference-data/fastq_screen_reference/
  58. 3. cluster_config: OnDemand bcs.a2.large img-ubuntu-vpc
  59. ## 参考文献
  60. [1] Wingett SW and Andrews S. FastQ Screen: A tool for multi-genome mapping and quality control [version 2; peer review: 4 approved]. F1000Research 2018, 7:1338 (https://doi.org/10.12688/f1000research.15931.2)