Ви не можете вибрати більше 25 тем Теми мають розпочинатися з літери або цифри, можуть містити дефіси (-) і не повинні перевищувати 35 символів.

71 lines
2.0KB

  1. task arriba{
  2. String sample_id
  3. File fastq1
  4. File fastq2
  5. File STAR_INDEX_DIR
  6. File ASSEMBLY_FA
  7. File ANNOTATION_GTF
  8. String disk_size
  9. String docker
  10. String cluster
  11. command <<<
  12. set -o pipefail
  13. set -e
  14. mkdir ./output/
  15. STAR \
  16. --runThreadN 16 \
  17. --genomeDir ${STAR_INDEX_DIR} \
  18. --genomeLoad NoSharedMemory \
  19. --readFilesIn ${fastq1} ${fastq2} \
  20. --readFilesCommand zcat \
  21. --outSAMtype BAM Unsorted \
  22. --outSAMunmapped Within \
  23. --outBAMcompression 0 \
  24. --outFilterMultimapNmax 50 \
  25. --peOverlapNbasesMin 10 \
  26. --alignSplicedMateMapLminOverLmate 0.5 \
  27. --alignSJstitchMismatchNmax 5 -1 5 5 \
  28. --chimSegmentMin 10 \
  29. --chimOutType WithinBAM HardClip \
  30. --chimJunctionOverhangMin 10 \
  31. --chimScoreDropMax 30 \
  32. --chimScoreJunctionNonGTAG 0 \
  33. --chimScoreSeparation 1 \
  34. --chimSegmentReadGapMax 3 \
  35. --chimMultimapNmax 50 \
  36. --outFileNamePrefix ./output/${sample_id}.
  37. /arriba_v2.1.0/arriba \
  38. -x ./output/${sample_id}.Aligned.out.bam \
  39. -o ./output/${sample_id}_fusions.tsv -O ./output/${sample_id}_fusions.discarded.tsv \
  40. -a ${ASSEMBLY_FA} \
  41. -g ${ANNOTATION_GTF} \
  42. -b /arriba_v2.1.0/database/blacklist_hg38_GRCh38_v2.1.0.tsv.gz \
  43. -k /arriba_v2.1.0/database/known_fusions_hg38_GRCh38_v2.1.0.tsv.gz \
  44. -t /arriba_v2.1.0/database/known_fusions_hg38_GRCh38_v2.1.0.tsv.gz \
  45. -p /arriba_v2.1.0/database/protein_domains_hg38_GRCh38_v2.1.0.gff3
  46. >>>
  47. runtime {
  48. docker: docker
  49. cluster: cluster
  50. systemDisk: "cloud_ssd 40"
  51. dataDisk: "cloud_ssd " + disk_size + " /cromwell_root/"
  52. }
  53. output {
  54. Array[File] arriba_result=glob("./output/*.tsv")
  55. Array[File] arriba_bam=glob("./output/*.bam")
  56. }
  57. }