【发布时间】:2018-04-12 22:59:32
【问题描述】:
我正在处理公司帐户数据的大数据集,以便在公司破产与否时解决分类问题。
数据集包含一个变量liquid,它表示清算开始的年份。鉴于公司实际上开始清算,这个变量在每年的观察中无处不在。否则为零。通常,liquid 大于观察的最后一年。因此,没有观察到公司开始清算当年的公司数据。有时,间隔甚至更长。例如,一家公司在 2005 年开始清算,但最后一次观察财务比率是在 2002 年。
数据样本可能如下所示:
现在,我想创建一个名为 bankruptcy 的新虚拟对象。如果这是开始清算的公司的最后一次观察(带有财务数据),则该值应为 1。您可以在上表中看到bankruptcy 的外观。我该如何进行?
【问题讨论】:
标签: r classification svm dummy-variable