【发布时间】:2021-08-21 00:58:55
【问题描述】:
用于Pycaret的预处理函数setup() 请告诉我推荐的参数。
取决于输入数据的类型 如何参数 我应该改变它吗?
例如通过分类、回归、聚类 我应该更改参数吗? 还是会在不同的基础上改变?
谢谢。
【问题讨论】:
-
要获得更好的响应,请尝试展示您尝试过的内容、有效的方法和无效的方法。这将使社区能够更好地衡量所需答案的类型。
用于Pycaret的预处理函数setup() 请告诉我推荐的参数。
取决于输入数据的类型 如何参数 我应该改变它吗?
例如通过分类、回归、聚类 我应该更改参数吗? 还是会在不同的基础上改变?
谢谢。
【问题讨论】:
在 Pycaret 设置中有几个选项,如何预处理您的数据。已经定义了几个默认选项。例如分类变量的 One Hot Encoding,normalise=True 默认使用“zscore”来规范化数据等。
没有适当的默认方法来预处理您的数据,因为所有数据集都是独一无二的,并且每个数据集都需要单独受到威胁。从 EDA 中您可以了解,您需要以哪种方式预处理数据或简单的跟踪错误实验也会有所帮助(至少可以建立基线)。对于某些算法,有一些注意事项。
这里是分类任务的设置解释:https://pycaret.readthedocs.io/en/latest/api/classification.html
【讨论】: