本app用于从FASTQ文件中随机抽取N条read,生成down-sample后的FASTQ文件。
app仅接受以.fastq.gz或.fq.gz为结尾的文件,输出文件为GZIP压缩后的FASTQ文件(后缀名为.fastq.gz)
注意:
本app使用seqkit sample进行downsample,根据官方文件说明,downsample后的FASTQ文件的read数不一定严格等于down_to的目标。如:down_to=1000 时,可能最终获得的fastq中仅有991条read。
对此不能接受者,请不要使用本app。
# 激活choppy环境
source activate choppy-pipe-0.3.8.dev0
# 安装 app
choppy install chenziyin/downsample
需要包括3列:
样表如下:
sample_id | fastq | down_to |
---|---|---|
test | oss://choppy-app-example-data/miRNAseq/test_10k_NEXTflex.fastq.gz | 1000 |
choppy batch chenziyin/downsample-latest <SAMPLES_CSV> --project-name <PROJECT_NAME>