如何将数据框转换为 numpy 数组？答案

【问题标题】：How to convert dataframe into numpy array?如何将数据框转换为 numpy 数组？
【发布时间】：2022-01-13 13:49:40
【问题描述】：

所以我目前正在制作一个神经网络 MLP (Multi-layer-Perceptron) 以秒为单位对海滩到大海之间的海龟速度进行分组分类，看起来有点像这样。

现在在我的 Jupyter Notebook 上输入以下内容

data = pd.read_csv("SeaTurtles.csv")
data

显示数据框中的数据

我想要做的是将这两组分开，即 A 组用于“培训”数据，B 组用于“测试”数据。我想将数据框转换为 NumPy 数组，以便我更容易将它们分类到 SpeciesCode 中。所以我输入：

newdf=data.drop(['Group1','Group 2'], axis = 1)
newdf

我需要把它分成两个测试组 A 和 B 所以我输入了

groupA=newdf.loc[newdf['Test*'] == 'A']
groupB=newdf.loc[newdf['Test*'] == 'B']

B 组

我所做的是使用 .to_numpy() 将这些转换为 numpy 数组

groupA = groupA.to_numpy()
groupA

它返回“AttributeError：'numpy.ndarray'对象没有属性'to_numpy' "

我的问题是我做错了什么还是有另一种方法可以将此数据帧转换为 numpy 数组以便我可以开始训练数据？提前谢谢你。

【问题讨论】：

【解决方案1】：

Pandas 数据框是一种二维数据结构，用于以行和列格式存储和检索数据。

您可以使用 df.to_numpy() 方法将 pandas 数据帧转换为 numpy 数组。

您可以使用以下代码 sn-p 将 pandas 数据帧转换为 numpy 数组。

numpy_array = df.to_numpy()
print(type(numpy_array))

输出：

<class 'numpy.ndarray'>

【讨论】：