【发布时间】:2018-12-19 18:16:51
【问题描述】:
大家好,我有一个数据框,其中的列是这样的。 列:
- WhiteRating(int)
- BlackRating(int)
- NewGameNinePtLead(str, 确定位置是否为“missedMate”、“lostBigLead”、“无用”)
- 平均评分
- Rating_Group:X 分组评级
- length_of_checkmate(将棋的移动量,int):这是我的y值
在此数据框内,每一行都是具有所有这些列属性的单个观察值。 我的任务是计算变量 P,然后对 x 回归 p,对 y 回归 p,最后对 (x 和 y) 回归 p P=(具有 y 值并丢失的移动数)/(具有 y 值的移动总数)
我的问题是为我的小组寻找 P。我不确定如何以 Python 的方式处理这个问题,我可以手动循环并计算所有内容,但即便如此我也不确定如何处理它,而且我的数据框的大小可能需要很长时间
WhiteR,BlackR,EMV,MovePlayedValue,NewGame,NinePtLead,AverageRating,Rating_Group,length_of_checkmate
1880.0,1865.0,27.0,27.0,1,useless,1875,1800,0
1880.0,1865.0,22.0,21.0,1,useless,1875,1800,0
1865.0,1880.0,25.0,25.0,1,useless,1875,1800,0
1880.0,1865.0,24.0,19.0,1,useless,1875,1800,0
1865.0,1880.0,22.0,22.0,1,useless,1875,1800,0
1880.0,1865.0,27.0,27.0,1,bigLeadLost,1875,1800,2
【问题讨论】:
-
您能否包含一个数据框的小样本?
df.head(10) -
刚添加进去,谢谢提醒!
-
多行最好...
-
如何定义“值为 y 的移动”?
-
这是根据length_of_checkmate列确定的,它的int值都引用了多少步将checkmate
标签: python python-3.x pandas