chenziyin пре 6 година
родитељ
комит
ce951574db
1 измењених фајлова са 30 додато и 33 уклоњено
  1. +30
    -33
      README.md

+ 30
- 33
README.md Прегледај датотеку

@@ -80,28 +80,28 @@ choppy install chenziyin/miRNAseq

每个sample对应一个文件夹,内部结构如下:
- call-Fastqc
- \*._fasqtc.html
- \*._fastqc.zip
- fastqc.html
- fastqc.zip
- call-TrimAdapt
- <sample_id>.trimAdapt.fastq.gz
- <sample_id>.trimAdapt.log
- <sample_id>.trimAdapt.lengthDistribute
call-ReadFilter
<sample_id>.trimAdapt.filter.fastq.gz
<sample_id>.filter.log
call-Align2miRNA
<sample_id>.align2miRNA.log
<sample_id>.align2miRNA.sam
<sample_id>.miRNAUnaligned.fastq.gz
call-Align2PreMiRNA
<sample_id>.align2PreMiRNA.log
<sample_id>.align2PreMiRNA.sam
<sample_id>.PreMiRNAUnaligned.fastq.gz
- call-ReadFilter
- <sample_id>.trimAdapt.filter.fastq.gz
- <sample_id>.filter.log
- call-Align2miRNA
- <sample_id>.align2miRNA.log
- <sample_id>.align2miRNA.sam
- <sample_id>.miRNAUnaligned.fastq.gz
- call-Align2PreMiRNA
- <sample_id>.align2PreMiRNA.log
- <sample_id>.align2PreMiRNA.sam
- <sample_id>.PreMiRNAUnaligned.fastq.gz
- call-Align2piRNA
- <sample_id>.align2piRNA.log
- <sample_id>.align2piRNA.sam
- <sample_id>.piRNAUnaligned.fastq.gz
- call-Align2tRNA
- call-Align2tRNA
- <sample_id>.align2tRNA.log
- <sample_id>.align2tRNA.sam
- <sample_id>.tRNAUnaligned.fastq.gz
@@ -109,7 +109,7 @@ choppy install chenziyin/miRNAseq
- <sample_id>.align2RNA.log
- <sample_id>.align2RNA.sam
- <sample_id>.RNAUnaligned.fastq.gz
- call-Align2Hg38
- call-Align2Hg38
- <sample_id>.align2Hg38.log
- <sample_id>.align2Hg38.sam
- <sample_id>.Hg38Unaligned.fastq.gz
@@ -278,32 +278,29 @@ GCF_000001405.38_GRCh38.p12_genomic.fna.gz]

### B. FAQ


**Q1 结果中没有检测到miRNA / miRNA检出率过低 **

**A1.**

首先需要确认是否切接头成功。方法为打开~/Call-TrimAdapt/trimAdapt.log日志文件,查看Filtering result*项目下的:

***reads with adpater trimmed***:该项为接头切除成功的read数,数值过低说明接头识别失败,需要检查提供的接头序列(```adapter_seq```)是否正确。

之后打开~/call-ReadStats/<sample_ID>.readStats文件查看文库中片段组成:

(1)***Adapter dimer***较高提示建库过程中连接效率低,文库产物被大量的引物二聚体所占据

(2)***Low quality***较高提示此次测序质量较差,可以用于比对的片段占比较低
首先需要确认是否切接头成功。

(3)***Too short***:较高提示抽提/建库过程存在问题或者样本质量较差,导致文库中插入大量的短(16bp一下)片段
1. 打开~/Call-TrimAdapt/trimAdapt.log日志文件
2. 查看Filtering result*项目下的***reads with adpater trimmed***:
- 该项为接头切除成功的read数
- 数值过低说明接头识别失败,需要检查提供的接头序列(```adapter_seq```)是否正确。
3. 查看Filtering result*项目下的***reads failed due to too long***
- 如果***reads with adapter trimmed***与***reads failed due to too long***两项之和不等于总read数,检查samples.csv文件中提供的***sequencing_length***是否填写正确
4. 如果建库中使用4N接头,查看日志文件中是否进行了随机碱基切除(Trim 4 random base from both sides)
- 如果app没有进行该步骤,检查samples.csv中的```randomBase_in_adapter```一列是否填写正确

(4)若***For align***: 项数值正常,而检测到的miRNA数量低,考虑

​ a. 如果建库时使用了4N引物,

​ 查看samples.csv中,```randomBase_in_adapter```是否设置正确。
之后打开~/call-ReadStats/<sample_ID>.readStats文件查看文库中片段组成:

​ 查看~/call-TrimAdapt/**<sample_ID>.trimAdapt.log**日志文件,若其中没有trim 4 random base相关记录,则可能是```randomBase_in_adapter```设置不正确
(1)***adapter dimer***(>20%)较高提示建库过程中连接效率低,文库产物被大量的引物二聚体所占据

​ 打开~ /call-LengthStats/**<sample_ID>.trimAdapt.lengthDistribute**,若片段主要分布在32bp附近,则很可能是4N碱基未切除成功
(2)***low quality***较高(>10%)提示此次测序质量较差,可以用于比对的片段占比较低,可以结合fastqc.html结果查看原因

​ b. 如果建库时未使用4N引物
(3)***too short***:较高提示文库中存在大量短(16bp一下)片段,可能是抽提/建库过程存在问题或者样本质量较差,具体可结合 <sample_id>.trimAdapt.lengthDistribute 查看序列分布情况

​ 打开~ /call-LengthStats/**<sample_ID>.trimAdapt.lengthDistribute**,查看片段长度分布
(4)***Not from human genome***较高(>30%)时,建议手动查看原始序列,并将序列去接头后使用NCBI Blast判断可能的片段来源

Loading…
Откажи
Сачувај