【发布时间】:2019-08-14 14:56:02
【问题描述】:
我正在将 CSV 文件加载到机器学习项目的 Pandas 数据框中。我有 16 列。 “标签”或“目标”是最后一列。其余的都是变量。我需要将前 15 列定义为特征,将第 16 列定义为目标。
我发现的所有示例似乎都在已经定义了这些示例的集合上演示了机器学习。我该如何定义自己的“目标”?
import pandas as pd
import numpy as np
import sklearn
from sklearn.model_selection import train_test_split
lymph = pd.read_csv("D:\\dataset_10_lymph.csv", encoding="utf-8", header = 0)
array = lymph.values
data = array[:,0:-1]
target = array[:,-1]
X_train, X_test, y_train, y_test = train_test_split(lymph.data, lymph.target, stratify=lymph.target, random_state=66)
但是当我尝试测试我的目标数组是否正确生成时,我得到了一个回溯。
AttributeError: 'DataFrame' 对象没有属性 'data'
除非他们使用练习 sklearn 数据集,否则这似乎是一个微不足道的步骤。任何帮助,将不胜感激。谢谢。
【问题讨论】:
标签: python pandas scikit-learn supervised-learning