【发布时间】:2022-01-20 00:31:09
【问题描述】:
我使用 Python 构建、训练并保存了一个 RF 算法模型,具有以下特性:
- 已删除文件数(整数)。
- 路径(字符串)
- 严重性(整数)
考虑到 sk-learn 不处理字符串,我已经使用 CountVectorizer 转换了数据。如何获取用户输入路径(字符串)并将其转换为与保存模型相同的格式以进行严重性预测?请注意,使用字符串print(clf.predict([[5, '/some/path']])) 的预测会导致错误:
ValueError: Iterable over raw text documents expected, string object received.
【问题讨论】:
-
否,两种解决方案都会产生另一个错误“TypeError: float() argument must be a string or a number, not 'CountVectorizer'”
-
那么请用完整的minimal reproducible example 开一个新问题,解释这些解决方案不起作用(并在此处链接)。
标签: python python-3.x machine-learning scikit-learn random-forest