【发布时间】:2021-12-09 10:48:37
【问题描述】:
我有一个跨越 5 年的数据框,其中包含约 500 家公司和几个基本统计数据(例如销售额、#员工数、ROA)。这是一个看起来如何的示例。请注意,所有数字都是完全随机选择的,显然年份除外。
| Name | Year | Sales | Size | ROA |
|---|---|---|---|---|
| Firm A | 2020 | 857 | 12000 | 0.45 |
| Firm B | 2020 | 112 | 3500 | 0.32 |
| Firm C | 2020 | 666 | 7000 | 0.44 |
| Firm A | 2019 | 860 | 12000 | 0.47 |
| Firm B | 2019 | 150 | 3000 | 0.31 |
| Firm C | 2019 | 700 | 6000 | 0.44 |
| ... | ... | ... | ... | ... |
| Firm A | 2015 | 560 | 10000 | 0.47 |
| Firm B | 2015 | 100 | 2000 | 0.31 |
| Firm C | 2015 | 300 | 4000 | 0.44 |
您建议我如何尝试预测每家公司的 2021 年 ROA,并考虑 5 年(2015 年 - 2020 年)的跨度?我试着玩弄forecast 包。但是,我还没有找到对所有公司进行批量操作的方法。我希望最终得到这样的结果:
| Name | Year | predicted ROA |
|---|---|---|
| Firm A | 2021 | 0.50 |
| Firm B | 2021 | 0.35 |
| Firm C | 2021 | 0.43 |
我会非常感谢任何线索!
【问题讨论】:
-
使用 fable 包。 fable.tidyverts.org
-
嗨@RobHyndman 我看过它,但似乎无法弄清楚如何为多家公司执行此操作。给出的示例仅适用于一个特定的公司(或时间序列)。在这里,我有多个时间序列。知道如何解决这个问题吗?
标签: r time-series tibble forecast