因为要分析sam文件中序列的情况,因此要对reads进行细分,所以之前想用数据库将sam文件信息存储,然后用sql语句进行分类。后来发现很麻烦,pysam就是一个高效读取存储在SAM / BAM / CRAM格式文件中的映射短读序列数据信息的python模块,可以轻松地对reads进行操作。

1.安装Pysam

$ pip install pysam

2.检查是否安装成功

import pysam   		# 注意,此步是进入python交互环境

3.读取bam文件

import pysam
samfile = pysam.AlignmentFile("ex1.bam", "rb")

提取指定区域reads

for read in samfile.fetch('chr1', 100, 120):
     print read

samfile.close()

结果如下:

EAS56_57:6:190:289:82       0       99      <<<7<<<;<<<<<<<<8;;<7;4<;<;;;;;94<;     69      CTCAAGGTTGTTGCAAGGGGGTCTATGTGAACAAA     0       192     1
EAS56_57:6:190:289:82       0       99      <<<<<<;<<<<<<<<<<;<<;<<<<;8<6;9;;2;     137     AGGGGTGCAGAGCCGAGTCACGGGGTTGCCAGCAC     73      64      1
EAS51_64:3:190:727:308      0       102     <<<<<<<<<<<<<<<<<<<<<<<<<<<::<<<844     99      GGTGCAGAGCCGAGTCACGGGGTTGCCAGCACAGG     99      18      1
...

参考资料

pysam API

相关文章:

  • 2022-12-23
  • 2021-07-03
  • 2021-12-29
  • 2022-12-23
  • 2022-12-23
  • 2021-12-16
  • 2022-12-23
  • 2021-12-12
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-10-19
  • 2022-12-23
  • 2022-12-23
  • 2021-09-20
  • 2022-12-23
相关资源
相似解决方案