Nie możesz wybrać więcej, niż 25 tematów Tematy muszą się zaczynać od litery lub cyfry, mogą zawierać myślniki ('-') i mogą mieć do 35 znaków.

README.md 1.2KB

5 lat temu
5 lat temu
5 lat temu
5 lat temu
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970
  1. ### APP简介
  2. 本app用于从FASTQ文件中随机抽取N条read,生成down-sample后的FASTQ文件。
  3. app仅接受以***.fastq.gz***或***.fq.gz***为结尾的文件,输出文件为GZIP压缩后的FASTQ文件(后缀名为.fastq.gz)
  4. > 注意:
  5. >
  6. > 本app使用***seqkit sample***进行downsample,根据官方文件说明,downsample后的FASTQ文件的read数不一定严格等于down_to的目标。如:down_to=1000 时,可能最终获得的fastq中仅有991条read。
  7. >
  8. > 对此不能接受者,请不要使用本app。
  9. ### 安装指南
  10. ```
  11. # 激活choppy环境
  12. source activate choppy-pipe-0.3.8.dev0
  13. # 安装 app
  14. choppy install chenziyin/downsample
  15. ```
  16. ### 快速使用
  17. ##### 准备样本描述文件:samples.csv
  18. 需要包括3列:
  19. - sample_id:每个样本唯一的ID
  20. - fastq:原始fastq地址
  21. - down_to:downsample后目标read数
  22. 样表如下:
  23. | sample_id | fastq | down_to |
  24. | -------- | -------- | -------- |
  25. | test | oss://choppy-app-example-data/miRNAseq/test_10k_NEXTflex.fastq.gz | 1000 |
  26. ##### 批量提交任务
  27. ```bash
  28. choppy batch chenziyin/downsample-latest <SAMPLES_CSV> --project-name <PROJECT_NAME>
  29. ```
  30. ### 使用的软件及版本:
  31. - Seqkit: 0.12.0