【发布时间】:2020-03-13 22:21:29
【问题描述】:
我正在使用 sklearn 导入数据:
from sklearn import datasets
dataset = datasets.fetch_openml('credit-g', version = 'active')
sklearn 即时将分类数据转换为数字。
现在我想将此数据集转换为 Pandas DataFrame:
data = pd.DataFrame(dataset.data, columns = dataset.feature_names)
data['class'] = pd.Series(dataset.target)
但此命令会删除所有分类数据 - 它们现在是数字。
我想要的是转换原始文本标签代替数字后的数据框。因此,从 sklearn 数据帧转换为 pandas 数据帧后,数据看起来应该与我只是使用命令下载此数据一样:
pd.read_csv("https://www.openml.org/data/get_csv/31/dataset_31_credit-g.arff")
有可能吗?
【问题讨论】:
标签: python pandas dataframe scikit-learn