【发布时间】:2019-08-02 08:39:19
【问题描述】:
我有以下数据。
Company
1 Progressive Corp.
2 Travelers Companies Inc.
3 Progressive Finance Corp.
4 Zurich Insurance Group (3)
5 Zurich Financial Services Ltd
6 Zurich Ltd
7 Berkshire Hathaway Inc.
8 Auto-Owners Insurance Co.
9 Berkshire Finance Inc.
10 AmTrust Financial Services
例如:我需要将所有包含“Zurich”(4,5,6) 的字符串替换为“Zurich [some word]”
【问题讨论】:
-
我注意到您的示例数据似乎不包含我们应该替换的任何字符串。
-
您的样本数据和预期输出不是很具体;通常,有不同的方法可以解决您的问题,但是由于您没有提供足够的信息,因此很难说这些方法中的任何一种能在多大程度上推广到您的更大数据集。例如,您是否总是将
"[some word][space][more words]"替换为"[some word] US"?这里的关键是提供最少但有代表性的样本数据并提供匹配的预期输出。 -
对于您给出的示例
gsub将起作用。gsub(pattern, replacement, string)。但是,如果您要进行多项不同的更改,则必须尝试其他方法。 -
我有以上数据,我需要将“[some word][space][more words]”替换为“[some word]”。
-
所以
"Zurich Insurance Group (3)”应该变成”Zurich”和"Berkshire Finance Inc.”应该变成“Berkshire”?
标签: r web-scraping replace substring