【发布时间】:2016-07-04 13:27:55
【问题描述】:
我正在使用 Pandas 生成一些信息和功能。我将使用该数据库作为 sklearn 的输入。目前,我正在使用.as_matrix() 将数据帧转换为数组。以下是输出:
array([[0.4437294900417328, 0.13434134423732758, 0.474, 0.482,
array([0, 0, 0, 0, 0, 0, 1, 0, 0, 0])],
[0.09896088391542435, 0.10105254501104355, 0.474, 0.526,
array([0, 0, 0, 0, 0, 1, 0, 0, 0, 0])],
[0.026971107348799706, 0.08766224980354309, 0.474, 0.581,
array([0, 0, 0, 0, 0, 0, 1, 0, 0, 0])],
...,
我想将这个内部数组分解为父二维数组。结果应该是这样的。
array([[0.4437294900417328, 0.13434134423732758, 0.474, 0.482,
0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
[0.09896088391542435, 0.10105254501104355, 0.474, 0.526,
0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
[0.026971107348799706, 0.08766224980354309, 0.474, 0.581,
0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
...,
TIA
【问题讨论】:
-
它应该已经输出了一个二维数组,除非你的数据有什么奇怪的地方。
as_matrix()之前的数据框是什么样的? -
外部数组是 dtype 对象。如果子数组的大小相同,则 ravel 后跟 concatenate 可能会起作用。
-
你需要告诉我们主数组的
shape和dtype。有几个嵌套级别很难从打印输出中破译。它是列表数组还是二维数组?看起来内部列表或维度由一堆浮点数和一个数组组成。我们需要知道这一点才能重新创建数组(不是确切的数字,只是结构)并在交互式 shell 中使用它。 -
我在
dataframe中添加了附加array。这导致了这个看起来很奇怪的数据。我通过不这样做解决了我的问题。后来我发现np.c_这就是我正在寻找的答案。
标签: python arrays numpy pandas scikit-learn