bowtie2 是bowtie的升级版,index不能混用。具体不同点,请参考这里。
1. 建立索引 bowtie2-build -f hg38.fa ./bowtie2_index/hg38# -f 可以省略,默认是fasta格式# 从索引导出序列bowtie2-inspect bowtie2-inedx > ref.fa# 查看参看基因组名称bowtie2-inspect -n bowtie2-inedx
注:时间很长,macbook(i5,16G)上运行四个多小时。生成.bt2 结尾的六个文件,某些基因组的index文件可以从这里下载。
2. 比对单端(single end,PE)测序数据
用法:bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | –interleaved <i> | -b <bam>} [-S <sam>]
# 利用参数 -Sbowtie2 -p 10 -x hg38 -U test_read.fq.gz -S bt_se_test.sam# 重定向bowtie2 -x hg38 -U test_read.fq.gz > bt_se_test.sam# 管道连接samtoolsbowtie2 -p 10 -x hg38 -U test_read.fq.gz|samtools view -bS|samtools sort > test_sorted.bam
参数解释:
-p 线程
-x 基因组索引文件前缀,不写路径表示当前路径下
-S <sam> File for SAM output (default: stdout)
–end-to-end entire read must align; no clipping (可以省略,默认开启)
–phred33 qualities are Phred+33 (可以省略,默认开启)
3. 比对双端测序(pair end,PE)数据 bowtie2 -x hg38 -1 test_read1.fq.gz -2 test_read2.fq.gz -S bt_test_pe.sam 4. 局部比对 bowtie2 -x hg38 –local -U test_read.fq.gz -S bt_local_se_test.sambowtie2 -x hg38 –local -1 test_read1.fq.gz -2 test_read2.fq.gz -S bt_local_test_pe.sam
–local 局部比对,read两头的序列不参与比对打分,相当于soft clipping。
参考
Bowtie 2: Manual