【发布时间】:2016-06-12 00:04:19
【问题描述】:
我正在从事一个涉及推文中表情符号的 NLP 项目。
此处给出了推文示例:"sometimes i wish i wa an octopus so i could slap 8 people at once????"
我的问题是 once???? 被认为是一个词,所以我想把这个唯一的词分成两个,这样我的推文看起来像这样:"sometimes i wish i wa an octopus so i could slap 8 people at once ????"
请注意,我已经编译了包含每个表情符号的正则表达式!
我正在寻找一种有效的方法,因为我有数十万条推文,但我不知道从哪里开始。
谢谢
【问题讨论】:
标签: python regex python-3.x unicode