【发布时间】:2019-01-24 11:29:22
【问题描述】:
我正在尝试从这样的数据框中提取数值:
ID Secc col1 col2 col3
1 Sección 0805601006 1400 1300 85*
2 Sección 0805601007 1475 1365 5.0
3 Sección 0805601005 760 760 0.0
4 Sección 0805601003 1335 1335 0.0
5 Sección 0805601002 655 655 0.0
6 Sección 0805601004 900 815 85*
要获得一个“干净”的数据框,只包含这样的数字字符:
ID Secc col1 col2 col3
1 0805601006 1400 1300 85
2 0805601007 1475 1365 5.0
3 0805601005 760 760 0.0
4 0805601003 1335 1335 0.0
5 0805601002 655 655 0.0
6 0805601004 900 815 85
我一直在尝试extract_numeric, st_replace, gsub 等许多功能,但无法获得我想要的结果。
有人知道如何清理我的数据吗?
【问题讨论】:
-
as.numeric(substr(df$Secc, 8, length(df$Secc)))? -
显示您期望得到的结果会很有帮助...
标签: r extract data-science data-cleaning