【问题标题】:How to convert dataframe into numpy array?如何将数据框转换为 numpy 数组?
【发布时间】:2022-01-13 13:49:40
【问题描述】:

所以我目前正在制作一个神经网络 MLP (Multi-layer-Perceptron) 以秒为单位对海滩到大海之间的海龟速度进行分组分类,看起来有点像这样。

现在在我的 Jupyter Notebook 上输入以下内容

data = pd.read_csv("SeaTurtles.csv")
data

显示数据框中的数据

我想要做的是将这两组分开,即 A 组用于“培训”数据,B 组用于“测试”数据。我想将数据框转换为 NumPy 数组,以便我更容易将它们分类到 SpeciesCode 中。 所以我输入:

newdf=data.drop(['Group1','Group 2'], axis = 1)
newdf

我需要把它分成两个测试组 A 和 B 所以我输入了

groupA=newdf.loc[newdf['Test*'] == 'A']
groupB=newdf.loc[newdf['Test*'] == 'B']

B 组

我所做的是使用 .to_numpy() 将这些转换为 numpy 数组

groupA = groupA.to_numpy()
groupA

它返回“AttributeError:'numpy.ndarray'对象没有属性'to_numpy' "

我的问题是我做错了什么还是有另一种方法可以将此数据帧转换为 numpy 数组以便我可以开始训练数据?提前谢谢你。

【问题讨论】:

  • 根据错误信息它已经是一个numpy数组
  • numpy 数组只能填充一种数据类型(它们的dtype)。您的数据框包含多种不同的数据类型。 (浮点数和字符串)。
  • 您是否有机会连续两次评估groupA = groupA.to_numpy()?您使用与输入和输出相同的变量名称。
  • 请打印type(groupA)
  • 表示groupA 已经是numpy 数组․你不需要将它转换成np.array

标签: python arrays pandas numpy


【解决方案1】:

Pandas 数据框是一种二维数据结构,用于以行和列格式存储和检索数据。

您可以使用 df.to_numpy() 方法将 pandas 数据帧转换为 numpy 数组。

您可以使用以下代码 sn-p 将 pandas 数据帧转换为 numpy 数组。

numpy_array = df.to_numpy()
print(type(numpy_array))

输出:

<class 'numpy.ndarray'>

【讨论】:

  • 再次阅读问题。这不是他问题的答案!
猜你喜欢
  • 2021-02-10
  • 2014-03-23
  • 2017-06-05
  • 1970-01-01
  • 1970-01-01
  • 2017-11-09
  • 2020-06-20
相关资源
最近更新 更多