【发布时间】:2017-04-05 23:14:43
【问题描述】:
我有一个这样的数据框:
import pandas as pd
test = pd.DataFrame({'type': ['a', 'b', 'a', 'c', 'b'], 'model': ['bab', 'ba', 'ba', 'ce', 'bw']})
如何使用sklearn FeatureHasher
有吗?
我试过了:
from sklearn.feature_extraction import FeatureHasher
FH = FeatureHasher()
train = FH.transform(test.type)
但它不喜欢它?它似乎想要一个字符串或一个列表,所以我尝试
FH.transform(test.to_dict(orient='list'))
但这也不起作用? 我明白了:
AttributeError: 'str' object has no attribute 'items'
谢谢
【问题讨论】:
-
FH.transform(test['type'].tolist())工作吗? -
使用
FH.transform(test.to_dict(orient='records'))代替FH.transform(test.to_dict(orient='list'))。orient='records'会将数据帧转换为字典列表,然后由FeatureHasher处理。
标签: python pandas scikit-learn