【发布时间】:2018-05-02 06:09:51
【问题描述】:
我有一个数据集,其中包含我想要操作的“价值(以百万美元计)”列。条目是不同格式的字符串 - 带有一个美元符号,后跟一个 M,例如“130 万美元”或后面跟着一个 K,例如“$450K”,或者我已经转换成正确的数字条目(例如 40 表示 4000 万美元)。
我想:去掉 $ 并只提取每行的数值,以百万为单位。
可能会根据包含 M 或 K 的值查看某种列拆分器,其“ifelse”类似于: ifelse(PL$'VALUE (M)' contains M, extract.numeric from PL$'VALUE ( M)', PL$'值 (M)' * 10^-3).
虽然还没有完全弄清楚在 R 上执行此操作的最简单方法。帮助将不胜感激!
【问题讨论】:
-
使用正则表达式提取数字部分,stackoverflow.com/questions/15451251/…
标签: r string if-statement dataset alphanumeric