【发布时间】:2021-02-18 19:54:51
【问题描述】:
我有一个这样的df:
df <- data.frame(
id = c("A", "A", "B", NA, "A", "B", "B", "B"),
speech = c("hi", "how are you [Larry]?", "[uh]", "(0.123)", "I'm fine [you 'n Mary] how's it [goin]?", "[erm]", "(0.4)", "well")
)
我想过滤掉那些行 (1) 其中speech 完全由一个表达式组成跟随[...] 构成整个speech 的行。我知道如何用[...] 过滤掉行:
df %>%
group_by(grp = rleid(id)) %>%
filter(grepl("^\\[.*?\\]$", speech))
但我不知道如何过滤掉[...] 行之后的相同-ID 行。 想要的输出是这样的:
df
id speech
1 B [uh]
2 B [erm]
3 B (0.4)
4 B well
【问题讨论】:
-
'hi' 不在
[...]中,并且不来自同一个-IDspeech,其第一个元素是[...]