【发布时间】:2017-07-13 05:24:32
【问题描述】:
我有如下熊猫数据:
MA1 MA2 MA3 Sp3 Sp4 Sp6 F1_x F1_y
TgT,TgT TgT,TgT TgT,TgT,TgT TgT,TgC TgT,CgC TgT,TgC,CgT,CgC CgC TgT
CgT CgT,CgT,CgT CgT,CgT CgT,CgC,GgT,GgC CgT,GgC GgT,GgC,CgT GgC CgT
TgC TgG,TgC TgC TgC,CgG CgG,CgG TgG,TgC CgG TgC
问题 01:
- 我将读取 F1_x 和 F1_y 中的字符串值并想计算 其他列中有多少 F1_x 和 y?
- F1_x 的计数将首先写入,用竖线 (|) 分隔。
输出:第一行是
MA1 MA2 MA3 Sp3 Sp4 Sp6 F1_x F1_y
0|2 0|2 0|3 0|1 1|1 1|1 CgC TgT
问题 02: 此外,我想创建另一个数据框,其中对 M 型与 S 型列进行计数。
输出:第一行是
like_M like_S
x y x y
0|7 1|3
或者,
like_M like_S F1_x F1_y
0|7 1|3 CgC TgT
我尝试了一种使用 for 循环的方法,该方法非常广泛,因为我的数据很大。我试图采用@piRSquared 在这个问题中给出的这种方法:How to read two lines from a file and create dynamics keys in a for-loop using python? 但是,无法解决。
【问题讨论】:
标签: python string pandas dataframe count