【发布时间】:2021-09-05 23:03:51
【问题描述】:
我有96个氨基酸序列,我用MAFFT比对并手动修剪(FASTA格式),用ProtTest选择氨基酸替换模型(LG+I+G模型),用MEGAX做了系统发育重建(ML方法, bootstrap 测试 1000 次重复,Newick 格式的树)和使用 PAML 的祖先重建,总共 664 个最终氨基酸位置。但是,我的对齐有插入缺失。我用字母 (A 到 T) 命名每个插入缺失,并且各自的酰胺酸位置范围:A:89-92, B:66-67, C:181-186, D:208-208, E:214-219 , F:244-250, G:237-296, H:278-280, I:295-295, J:329-334, K:345-349, L:371-375, M:390-425, N :432-433,O:440-443,P:480-480,Q:500-500,R:541-544,S:600-600。序列的首尾部分变化很大,因此从位置 0 到 34(首字母)和 600 到 664(最终),每个氨基酸位置可能代表一个插入缺失。
我想知道,在每个祖先节点上,每个 indel 出现在祖先序列中的概率是多少。有人告诉我,包“ape - 系统发育和进化分析”上的 R-studio“ace”功能可以执行此任务。我已经安装了“ape”和“ggtree”。我检查了这个网页https://www.rdocumentation.org/packages/ape/versions/3.0-1/topics/ace,但是,我不知道如何构建脚本。我是一名生物学家,也是 R. 的新手。
有人可以帮忙吗?将不胜感激,谢谢。
【问题讨论】: