在R中提取字符串中的最后一个单词答案

【问题标题】：Extract last word in string in R在R中提取字符串中的最后一个单词
【发布时间】：2013-07-15 15:41:33
【问题描述】：

提取句子字符串中最后一个单词的最优雅的方法是什么？

句子不以“.”结尾单词之间用空格隔开。

sentence <- "The quick brown fox"
TheFunction(sentence)

应该返回：“狐狸”

如果一个简单的解决方案是可能的，我不想使用一个包。如果存在基于包的简单解决方案，也可以。

【问题讨论】：

标签： r

【解决方案1】：

仅出于完整性考虑：库 stringr 包含一个用于解决此问题的函数。

library(stringr)

sentence <- "The quick brown fox"
word(sentence,-1)
[1] "fox"

【讨论】：

【解决方案2】：

tail(strsplit('this is a sentence',split=" ")[[1]],1)

基本上按照@Señor O 的建议。

【讨论】：

【解决方案3】：

x <- 'The quick brown fox'
sub('^.* ([[:alnum:]]+)$', '\\1', x)

这将捕获字符串末尾之前的最后一个数字和字符字符串。

您也可以使用regexec 和regmatches 函数，但我发现sub 更干净：

m <- regexec('^.* ([[:alnum:]]+)$', x)
regmatches(x, m)

请参阅?regex 和?sub 了解更多信息。

【讨论】：

【解决方案4】：

另一个打包选项是来自stringi 包的stri_extract_last_words()

library(stringi)

stri_extract_last_words("The quick brown fox")
# [1] "fox"

该功能还会删除可能位于句子末尾的任何标点符号。

stri_extract_last_words("The quick brown fox? ...")
# [1] "fox"

【讨论】：

【解决方案5】：

往包的方向走，这是我能想到的最简单的答案：

library(stringr)

x <- 'The quick brown fox'
str_extract(x, '\\w+$')
#[1] "fox"

【讨论】：