Germline & Somatic short variant discovery (SNVs + Indels) for WGS & WES.
Вы не можете выбрать более 25 тем Темы должны начинаться с буквы или цифры, могут содержать дефисы(-) и должны содержать не более 35 символов.

3 лет назад
4 лет назад
3 лет назад
4 лет назад
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970
  1. task VEP {
  2. File vcf
  3. String sample_id
  4. String basename = basename(vcf,".vcf")
  5. String tumor_id
  6. String normal_id
  7. File ref_dir
  8. String fasta
  9. String vep_path
  10. File cache
  11. String hg
  12. String species
  13. Boolean only_pass
  14. String vcf2maf_path
  15. String docker
  16. String cluster_config
  17. String disk_size
  18. command <<<
  19. set -o pipefail
  20. set -e
  21. nt=$(nproc)
  22. # Define ncbi_build
  23. if [ hg == "hg19" ]; then
  24. ncbi_build="GRCh37"
  25. elif [ hg == "hg38" ]; then
  26. ncbi_build="GRCh38"
  27. fi
  28. # Extract the BND variants from VCF
  29. awk -F'\t' '{if(($1~"^#")||($8!~".*SVTYPE=BND.*")){print $0}}' ${vcf} > ${sample_id}.INPUT.vcf2maf.vcf
  30. awk -F'\t' '{if(($1~"^#")||($8~".*SVTYPE=BND.*")){print $0}}' ${vcf} > ${sample_id}.INPUT.VEP.vcf
  31. # vcf2maf
  32. perl ${vcf2maf_path}/vcf2maf.pl \
  33. --input-vcf ${sample_id}.INPUT.vcf2maf.vcf --output-maf ${basename}.maf \
  34. --tumor-id ${tumor_id} --normal-id ${normal_id} \
  35. --ref-fasta ${ref_dir}/${fasta} \
  36. --vep-path ${vep_path} \
  37. --vep-data ${cache} \
  38. --ncbi-build $ncbi_build \
  39. --species ${species} \
  40. --vep-fork $nt
  41. # vep: only annotate the BND
  42. perl ${vep_path}/vep \
  43. --input_file ${sample_id}.INPUT.VEP.vcf --output_file ${basename}.BND.VEP.txt \
  44. --fasta ${ref_dir}/${fasta} \
  45. --dir ${cache} \
  46. --assembly $ncbi_build \
  47. --species ${species} \
  48. --fork $nt \
  49. --no_progress --no_stats --buffer_size 5000 --sift b --ccds --uniprot --hgvs --symbol --numbers --domains --gene_phenotype --canonical --protein --biotype --uniprot --tsl --variant_class --shift_hgvs 1 --check_existing --total_length --allele_number --no_escape --xref_refseq --failed 1 --tab --flag_pick_allele --pick_order canonical,tsl,biotype,rank,ccds,length --format vcf --force_overwrite --offline --pubmed --regulatory
  50. >>>
  51. runtime {
  52. docker: docker
  53. cluster: cluster_config
  54. systemDisk: "cloud_ssd 40"
  55. dataDisk: "cloud_ssd " + disk_size + " /cromwell_root/"
  56. }
  57. output {
  58. File maf = "${basename}.${hg}.maf"
  59. File bnd_vep = "${basename}.BND.VEP.txt"
  60. }
  61. }