什么是bam文件(bam格式用什么软件处理)
什么是bam文件(bam格式用什么软件处理),本文通过数据整理汇集了什么是bam文件(bam格式用什么软件处理)相关信息,下面一起看看。
Sam文件是短序列比对生成的文件,是二代测序中的核心文件。在RNAseq分析、突变检测等方面。第一个老师需要sam文件格式。Bam文件是sam格式的二进制格式。转换成二进制后,可以减少文件的存储量。掌握sam/bam文件的操作是处理二代测序数据中非常重要的内容,如sam与bam之间的转换、排序、索引、读取计数等。
1生成sam文件
可以生成sam格式的软件有很多,比如bwa,bowie2,tophat2,subread,minimap2等等。输入数据为fasta格式,用作比对参考序列;TQ格式的测序数据,如illumina测序的pairend数据等。也就是将测序数据与参考序列进行比较。可以简单理解为sam=fasta fastq。
#bwa建立索引bwaendex-aisref.fna # bwamem比较BWA mem-T4-r ' @ rg tid:a1 TPL:illumina TSM:a1 ' ref . fnaa 1 _ 1 . fastq . gza 1 _ 2 . fastq . gza 1 . sambwame-。TPL:illumina TSM:a2 ' ref . fnaa 2 _ 1 . fastq . gza 2 _ 2 . fastq . gza 2 . Sam 2 Sam文件格式介绍
Sam格式是文本格式,可以直接查看。总共有11列,每列的内容如下:
第一列:读取ID,第二列:标志标记的总和,第三列:与参考序列匹配的染色体数目。第4列:参考序列上的位置第5列:比较的质量值,MAPQ第6列:代表比较结果的雪茄串第7列:配对匹配的染色体数,如果没有配对,则为*第8列:参考序列上的第一个碱基位置,第9列:模板长度,第10列:序列读取,第11列:ASCII码格式的序列质量;
3标志标识符的含义
sam的第二列是标志标识符,是比较模式,比如单端比较,双端比较,或者不匹配。这些数字是二进制的和。下面的内容可以充分说明这一点。标志解析:/picard/explain-flags.html
4 Sam标识符的含义
在sam文件的每一行的末尾,都有许多标识符。这些标识符是比较的具体细节,可以查看相应的文档进行解读。然而,这些标识符是用于下游软件处理的,不需要人工解释。Sam标识符解释:https://github.com/samtools/hts-specs
XT:A:UNM:I:0SM:I:37AM:I:37x 0:I:1X1:I:0XM:I:0XO:I:0XT:A:UNM:I:2SM:I:37AM:I:37x 0:I:1x 1:I:0XM:I:2XO:I:0XT:A:UNM:I:0SM:I:37AM:I:37x 0:1x 1:I:0XM:I:0XO:I:0
-结束-
这个网站是个人知识管理的网络存储空间。所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请一键举报。
更多什么是bam文件(bam格式用什么软件处理)相关信息请关注本站,本文仅仅做为展示!