【发布时间】:2015-09-18 23:53:07
【问题描述】:
假设我有一个 DataFrame,其中一列(我们将其称为“power”)保存从 1 到 10000 的整数值。我想生成一个 numpy 数组,该数组对于每一行都有一个值表示DataFrame对应行的'power'列是否有大于9000的值。
我可以这样做:
def categorize(frame):
return np.array(frame['power']>9000)
这会给我一个布尔数组,可以用 True 和 False 进行测试。但是,假设我希望数组的内容为 1 和 -1,而不是 True 和 False。如何在不必遍历框架中的每一行的情况下完成此操作?
作为背景,该应用程序正在使用 scikit-learn 通过机器学习为二进制分类准备数据。
【问题讨论】:
标签: python arrays numpy pandas scikit-learn