【问题标题】:Conversion of GenBank format file to FASTA format将 GenBank 格式文件转换为 FASTA 格式
【发布时间】:2012-08-31 11:46:39
【问题描述】:

我是 Java 新手,想构建一个可以将 GenBank 文本文件转换为 FASTA 格式的程序。基本上会有两个 texbox:一个是我上传 GenBank 格式文件的地方,另一个是显示转换后的 FASTA 格式文件的地方。

这是一个 GenBank 格式文件:

LOCUS       AB000263                 368 bp    mRNA    linear   PRI 05-FEB-1999
DEFINITION  Homo sapiens mRNA for prepro cortistatin like peptide, complete
            cds.
ACCESSION   AB000263
ORIGIN      
        1 acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg
       61 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg
      121 caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc
      181 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag
      241 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga
      301 agaccttctc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca
      361 gacctgaa
//

其对应的FASTA格式文件为:

>AB000263 |acc=AB000263|descr=Homo sapiens mRNA for prepro cortistatin like peptide, complete cds.|len=368
ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCACCGCTGCCCTGCC
CCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAATAAGGAAAAGCAGC
CTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCCCCTCATAGGAGAGG
AAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCCGGGACAGAATGCC
CTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATGAATGCTCACGCAAG
TTTAATTACAGACCTGAA

任何人都可以帮助我提供有关如何修剪 GenBank 文件并通过单击按钮将其显示在第二个文本框中的方法或代码的建议。

我使用的是 Netbeans 6.9。

【问题讨论】:

  • 你有没有尝试过?比如google如何用Java实现一个gui。
  • gui 的实现是好的,但无法弄清楚如何修剪数据并提取我需要的数据并以正确的顺序重新排列
  • Google says 选择一个converter

标签: java netbeans-6.9 fasta biojava genbank


【解决方案1】:

我没用过,但The BioJava Project 包含read a GenBank 文件的代码,该文件可能包含多个序列。有关显示,请参阅How Do I Print A Sequence in Fasta Format

【讨论】:

  • 哇...似乎没有什么你不知道的 :-) 点赞和 +1!
  • 我现在才开始明白我知道的有多么少。 :-)
猜你喜欢
  • 2016-01-14
  • 2020-12-18
  • 2015-07-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-12-05
  • 1970-01-01
  • 2021-10-15
相关资源
最近更新 更多