【发布时间】:2022-01-13 13:49:40
【问题描述】:
所以我目前正在制作一个神经网络 MLP (Multi-layer-Perceptron) 以秒为单位对海滩到大海之间的海龟速度进行分组分类,看起来有点像这样。
现在在我的 Jupyter Notebook 上输入以下内容
data = pd.read_csv("SeaTurtles.csv")
data
显示数据框中的数据
我想要做的是将这两组分开,即 A 组用于“培训”数据,B 组用于“测试”数据。我想将数据框转换为 NumPy 数组,以便我更容易将它们分类到 SpeciesCode 中。 所以我输入:
newdf=data.drop(['Group1','Group 2'], axis = 1)
newdf
我需要把它分成两个测试组 A 和 B 所以我输入了
groupA=newdf.loc[newdf['Test*'] == 'A']
groupB=newdf.loc[newdf['Test*'] == 'B']
我所做的是使用 .to_numpy() 将这些转换为 numpy 数组
groupA = groupA.to_numpy()
groupA
它返回“AttributeError:'numpy.ndarray'对象没有属性'to_numpy' "
我的问题是我做错了什么还是有另一种方法可以将此数据帧转换为 numpy 数组以便我可以开始训练数据?提前谢谢你。
【问题讨论】:
-
根据错误信息它已经是一个numpy数组
-
numpy 数组只能填充一种数据类型(它们的
dtype)。您的数据框包含多种不同的数据类型。 (浮点数和字符串)。 -
您是否有机会连续两次评估
groupA = groupA.to_numpy()?您使用与输入和输出相同的变量名称。 -
请打印
type(groupA) -
表示groupA 已经是numpy 数组․你不需要将它转换成np.array
标签: python arrays pandas numpy