【发布时间】:2020-05-05 11:22:31
【问题描述】:
我是 R 的超级新手,很抱歉用这么简单的问题打扰您。
我有一个包含肽谱库信息的大型数据框(完整的有 25 列和数百万行)。
我通过将它们的缩写 (UniMod:XXX) 写入肽序列 (PeptideSequence) 来将修改引入基础库。我剩下的就是根据我的修饰和电荷 (PrecursorCharge) 的发生来更新肽质量 (PrecursorMz)。因此,对于每个“(UniMod:259)”部分字符串,我必须将相应的质量增加8(对于(UniMod:267)为10,除以电荷(电荷并不总是3,抱歉)。例如修改后的第一行应该考虑到序列中的修改后读取 714.64876。
PrecursorMz PeptideSequence PrecursorCharge
709.31543 AAAEK(UniMod:259)LFGNMEGDCPSDWK(UniMod:259) 3
709.31543 AAAEKLFGNMEGDCPSDWK(UniMod:259) 3
529.58044 AK(UniMod:259)LWCSTTADYDR(UniMod:267) 3
非常感谢您,并将提供您可能需要的其他信息。
【问题讨论】:
-
如果
PeptideSequence包含UniMod:259和UniMod:267怎么办(如第3 行)?在这种情况下应该怎么做?你只有这两个值吗?你能显示给定数据的预期输出吗? -
在这种情况下,PrecursorMz 应该增加 (8 + 10)/3。对于这个库,我只有这两个值新值。库中还有一些其他 UniMod:XXX 字符串,但由于它们很常见,因此已将其考虑在内。