【发布时间】:2020-08-05 13:51:07
【问题描述】:
我有 2 个函数来标准化我的数据,例如:
def standartChanger(dataFrame):
stdSc = preprocessing.StandardScaler()
cols = dataFrame.columns
dfscaled = stdSc.fit_transform(dataFrame)
dfscaled = pd.DataFrame(dfscaled, columns=cols)
return dfscaled, stdSc
def standartChangerwithMeanVar(dataFrame,stdSc):
cols = dataFrame.columns
dataFrame = stdSc.transform(dataFrame)
dfscaled = pd.DataFrame(dataFrame, columns=cols)
return dfscaled
一个用于标准化训练,另一个用于测试。我的数据框中有一些我不想标准化的虚拟变量。 现在我需要修改这些函数以不触及 0-1 的虚拟变量。我该怎么做?
此外,在线性回归中,我有一个问题,即我的虚拟变量的系数太大,这会在预测中产生毫无意义的点。你对此有什么想法吗?
【问题讨论】:
-
我提供了一些信息,但是如果您已经下定决心使用带有虚拟变量的 StandarScaler,这里有一个涵盖该问题的问题:stackoverflow.com/questions/37685412/…
标签: python function dataframe standardization