【发布时间】:2023-03-13 23:30:01
【问题描述】:
我已将日期转换为数值,但我被困在下一步如何准备数据以进行预测,如何在 python 代码中使用日期进行预测?如何计算 eventhappen 属性请指导我并在没有任何意义的地方改进我的代码。下面是我的代码
#Here is Dataset
date Eventhappen
2016-01-14 A
2016-01-15 C
2016-01-16 B
2016-01-17 A
2016-01-18 C
2016-02-18 B
#Converting Date into Numerical Value
df['Dispatch_Date_Time'] = pd.to_datetime(df['Dispatch_Date_Time'])
df.set_index('Dispatch_Date_Time', inplace=True)
df.sort_index(inplace=True)
df['month'] = df.index.month
df['year'] = df.index.year
df['day'] = df.index.day
df['eventhappen'] = 1
#Preparing the data
X = df[['year']]
y = df['eventhappen']
#Trainng the Algorithm
regressor = LinearRegression()
regressor.fit(X_train, y_train)
#Making the Predictions
y_pred = regressor.predict(X_test)
#Plotting the Least Square Line
sns.pairplot(df, x_vars=['year'], y_vars='eventhappen', size=7, aspect=0.7, kind='reg')
【问题讨论】:
-
你想在这里建模什么?由此看来,您似乎要将一列 1 与日期列的年份进行回归,尽管因为
X_train和y_train没有在任何地方定义,所以甚至没有。 -
我建议将日期转换为“自 2016 年 1 月 14 日以来的天数”,因为这会给模型提供数字数据。
-
ALollz 抱歉,这里缺少培训代码,请留在这里,请关注我的问题
标签: python pandas machine-learning linear-regression data-science