【发布时间】:2021-09-28 05:59:10
【问题描述】:
我有一个很长的 word 文档,其中列出了这样的项目:
- 项目 1
- entry1
- 条目2
- 条目3
- 项目 2
- entry1
- 条目2
- 条目3
- (等等...)
item是物种名称,entry是对应的位置和日期信息,不过现在已经不重要了。
我正在尝试将这个极长的文档放入 R 中的一个合理的 table/tibble 对象中,我的想法是使用它:
library (stringr)
data <- readLines("data.txt")
test_data <- str_sub(data, 1, 3)
然后用“数据”的每个元素的“项目”身份分配另一个向量(即每个日期+位置对应的物种)。我试图为此使用for循环并测试每行是否以“”开头,但我被卡住了。
results <- vector (length = length(data))
for (i in 1:length(data)) {
if (test_data[i] != " ") {
results[i] = data[i]
} else {
while #here I am stuck
谢谢
【问题讨论】:
-
嗨 :) 你总是每件作品有 3 个条目吗?
-
嗨!不,条目的数量变化很大。
-
格式是否总是像,对于项目,(整数).Item 和对于条目,(空格或制表符)条目?
-
是的,每个项目都直接以字母开头(二项式物种名称,例如智人)。然后每个条目以十二个空格“”开头,然后是单词(位置名称,然后是同一行中的日期信息)。
-
请提供足够的代码,以便其他人更好地理解或重现问题。
标签: r text data-wrangling