【发布时间】:2023-04-02 00:35:01
【问题描述】:
我想训练给定df X and Y 的数据; X 是特征,Y 是目标变量。
先将df转为数组
X = X1.values
Y = Y1.values
print(type(X))
<class 'numpy.ndarray'>
print(type(Y))
<class 'numpy.ndarray'>
这是前两行的 X 和 Y:
print(X)
[[1 100.0 10 -8.465 0 0.332 0.0565 0.47100000000000003 0.696 0.521 292987
4.0 0.302 0.0 [1, 2] [1] [1, 1, 1, 1] [0, 0, 1, 1, 0, 1, 0, 0]]
[1 175.483 6 -8.205 0 0.364 0.128 0.564 0.504 0.705 239320 4.0 0.0752 0.0
[1, 2] [1] [1, 1, 1, 1] [0, 1, 0, 0, 0, 0, 0, 1]]
print(Y)
[1 0]
但是,当我尝试训练数据时:clf.fit(X,Y)
像这样的错误:
ValueError: setting an array element with a sequence.
我认为问题来自 X 内部的向量;我能解决什么? 谢谢!
================================================ == 或者我认为问题是: 如何处理包含浮点数和向量的数据帧以便进行数据训练?
Col_A Col_B Col_C
0 0.0 [1, 2] [1]
1 0.0 [1, 2] [1]
【问题讨论】:
-
X 和 Y 的奇怪格式是什么?混合数组和浮点数?
-
是的,这看起来不对。为什么你的 X 中有嵌套数组?
-
大家好,请看我的编辑!基本上我的问题是我的数据框同时包含浮点数和向量。我应该怎么做才能处理这个数据训练?
标签: python arrays numpy vectorization