【发布时间】:2016-10-02 23:29:18
【问题描述】:
我有如下所示的相当长的字符串(~50k 个字符)
https://gist.github.com/anonymous/9de31de2e6fc9888f3debeda4698b739
我想提取始终介于“'>”和“
例如:
><td class='td-val ball-8'>13</td><td class='td-val ball-8'>9</td>
会输出一个向量,[13,9]
当我尝试在表单中输入字符串时,我什至无法让我将字符串输入 r。
mystring <- "text here"
当我尝试按 Enter 键时,它只会在命令行旁边有一个 +。所以我认为文本中的一些符号搞砸了。
【问题讨论】:
-
我认为缺少一些上下文。您是否正在使用特定的环境或编程语言?
-
我的帖子上有 R 标签,所以我认为这已经足够好了,也许应该在帖子中提到。只要我之后可以将 csv 输出放入 R 中,我不介意,但这就是我(在 R 中)的所有编程经验
-
抱歉我错过了
标签: r parsing html-parsing