【发布时间】:2020-12-10 19:52:23
【问题描述】:
我想用数字连续数据创建如下模型:
revenue~variable+variable2+variable3
我的数据有大约 1000 个观察值,共有 5 个变量,即上述因变量和 3 个自变量,以及日期。每行代表一天。我想建立模型,使自变量不仅影响因变量(收入),而且影响前几天的自变量。我希望前几天的效果随着时间的推移而减少。因此,例如,昨天的自变量对今天的收入的影响会比前一天更大,等等......一直到前 100 天。
为了更清楚起见,这是一个广告模型,研究个人看到一种广告(自变量是电视广告的类型)如何影响收入,距离越远的广告不太可能引起行动和购买。
换句话说,可能会在模型中添加衰减项。
【问题讨论】:
-
考虑对变量使用adstock 转换来捕捉广告影响的减弱,而不是引入大量变量。这种转换比尝试强制执行 n 个约束要容易。
-
这个问题在交叉验证stats.stackexchange.com 上会更好,因为它是关于创建/选择要使用的算法,而不是如何让你的代码工作。
-
根据您期望的衰减率,使用每日数据,我会使用 7 天移动总计(需要在分解时进行适当计算)来消除星期几的影响。然后对滚动数据进行滞后和衰减转换。如果是展示广告,那么没问题(预计衰减率会很短),但如果广告是品牌电视广告,您的客户预计会看到一些持续 2/3 周的残留效果。当确切的滞后开始时,每日数据也很难确定,你必须这样做 Y = b1*X1 + 0.5*X1_lag1 + 0.2*X1_lag2。涵盖了滞后和衰减,接下来是收益递减或 R&F 的因素
标签: r regression linear-regression