【发布时间】:2020-09-19 05:39:32
【问题描述】:
我有使用 pandas 的这些数据:
SNP = pd.read_csv("C:/Users/sia/Desktop/SNP.txt",delimiter=r"\s+",header=0)
ID Chr Position p
M1 1 4762 0.40
M2 1 77143 0.62
M3 1 130756 0.22
M4 1 227358 0.50
M5 1 265131 0.60
M6 1 568128 0.64
M7 2 2000 0.32
M8 2 18000 0.36
M9 2 60300 0.64
M10 2 71118 0.50
M11 2 71595 0.28
M12 2 200000 0.10
在 python 中,如何根据新数据框中每个 Chr 的位置列中的滑动窗口 (100000) 和步长 (50000) 得到 p 值的总和,如下所示:
Chr start end sum.p.slide
1 0 100000 1.02
1 50000 150000 0.84
1 100000 200000 0.22
1 150000 250000 0.50
1 200000 300000 1.10
1 250000 350000 0.60
1 300000 400000 Na
1 350000 450000 Na
1 400000 500000 Na
1 450000 550000 Na
1 500000 600000 0.64
2 0 100000 2.1
2 50000 150000 Na
2 100000 200000 0.1
【问题讨论】:
-
请格式化您的数据,它没有对齐。如果您发布一些起始代码,您也会很高兴。这看起来像是一个非常不费力的帖子,你可以做得更好。来自review。
-
感谢您的评论!抱歉,这是我的第一个问题。
标签: python python-3.x pandas python-2.7 numpy