Bläddra i källkod

修改了README

master
huangyechao 6 år sedan
förälder
incheckning
18a02bc374
1 ändrade filer med 1 tillägg och 17 borttagningar
  1. +1
    -17
      README.md

+ 1
- 17
README.md Visa fil

@@ -48,7 +48,7 @@
nt=$(nproc)
${SENTIEON_INSTALL_DIR}/bin/bwa mem -M -R "@RG\tID:${group}\tSM:${sample}\tPL:${pl}" -t $nt ${ref_dir}/${fasta} ${fastq_1} ${fastq_2} | ${SENTIEON_INSTALL_DIR}/bin/sentieon util sort -o ${sample}.sorted.bam -t $nt --sam2bam -i -
>>>
runtime {
dockerTag:docker
cluster: cluster_config
@@ -60,13 +60,8 @@
File sorted_bam_index = "${sample}.sorted.bam.bai"
}
}
```


2. `workflow.wdl` 是定义了每一个步骤的输入文件以及各个步骤之间的以来关系的文件:

```bash
import "./tasks/mapping.wdl" as mapping
import "./tasks/Metrics.wdl" as Metrics
@@ -130,11 +125,8 @@
}
```

其中文件最上面的 `import` 代表了所要使用的task文件,中间部分`File/String xxx` 表明了任务所传递出需要定义变量及其类型,`call`部分声明了流程的各个步骤及其依赖关系。(文档的具体说明详见[WDL](https://software.broadinstitute.org/wdl/documentation/spec#alternative-heredoc-syntax))

3. `input` 文件为整个 **APP** 运行时所要输入的参数,对于可以固定的参数可以直接在`input`文件中给出,对于需要改变的参数用`{{}}`进行引用,将会使得参数在 `samples` 文件中出现;其中`project_name`为所运行的任务的名称,需要在提交任务是进行定义

```bash
{
"{{ project_name }}.fasta": "GRCh38.d1.vd1.fa",
@@ -153,27 +145,19 @@
"{{ project_name }}.fastq_2": "{{ read2 }}"
}
```

> `{{ cluster if cluster != '' else 'OnDemand ecs.sn2ne.2xlarge img-ubuntu-vpc' }}`表示当没有指定`cluster` 的配置信息时,则默认使用 **ecs.sn2ne.2xlarge**

4. `sample.csv` 文件为提交任务时使用的输入文件,其内容是根据`input`文件中定义的信息对应生成的,也可使用 `Choppy` 的 `samples` 功能生成:

```bash
choppy samples target-germline --output samples.csv
```

```bash
#### samples.csv
read1,read2,regions,sample_name,cluster,disk_size,sample_id
```

其中`sample_id`对应于所分析样本的索引号,用于生成当前样本提交时的任务信息,应注意不要包含`_`,否则会出现报错。

5. 提交任务

```bash
choppy batch target-germline samples.csv --project-name your_project
```

(更多使用信息,详见[Choppy使用说明](http://docs.3steps.cn))


Laddar…
Avbryt
Spara