【发布时间】:2021-10-18 07:50:08
【问题描述】:
我想对主题标签进行分词。我想在标签中拆分单词。这是我的尝试,但显然没有成功。
我想做什么
- 输入:#sometrendingtopic
- 输出:一些热门话题
我的尝试:
s<- "#sometrendingtopic"
tokenize_character_shingles(s)
tokenize_words(s)
tokenize_characters(s)
我得到了一些信息,但它适用于 python https://stackoverflow.com/.../r-split-string-by-symbol 感谢您对未来的想法和指导
【问题讨论】:
-
gsub('#','','#sometrendingtopic')将从“#sometrendingtopic”中删除主题标签,然后您可以继续使用无主题标签的字符对象。 -
@SametSökel 谢谢,我会试试这个