【发布时间】:2012-11-05 02:20:56
【问题描述】:
我有一个解析问题。 我有存储为字符串的句子。我想抓取每个句子中的每个单词,但是我想过滤我抓取的单词。例如说我有这样一个句子:
Hell0 3v3ryb0dy @ stackoverflow $people \implies queen$ 等于 ~queen --> ~people。 /#逻辑
我会做以下事情:
- 抓住'H3ll0'
- 抢 3v3ryb0dy
- 扔掉@
- 从 '$people' 中获取 'people'
- 从 '\implies' 中获取 'implies'
- 从 'queen$' 中获取 'queen'
- 抓住'等于'
- 从'~queen'中获取'queen'
- 扔掉 -->
- 从“~people”中获取“people”
- 从“/#logic”中获取“逻辑”
基本上我只想要字母数字字符,每当我在单词之前或之后有一些其他字符(例如 \)时,我都想忽略这个其他字符。
目前我在做:sentence.split(" ")
这会从句子中获取单个单词,但它会抓取 '$people' 和 '~people' 并在我希望它们被同等对待时以不同方式对待它们。
- 我怎样才能做到这一点?
- 正则表达式能帮到我吗?
【问题讨论】:
标签: java regex string parsing split