【发布时间】:2014-07-22 21:30:53
【问题描述】:
我正在尝试提取一些用户的所有推文用于我的研究。 但是特殊字符被替换为“?”象征。我该如何克服这个问题?
例子:
如果推文是,
“如果ωe给ɑ一点爱,也许ωe可以改变ωorld。”
它被存储为
“如果?e给予?一点爱,也许?e可以改变?orld。”
知道如何解决这个问题吗?
更新:
我处理错了。所以我改变了代码来处理 UTF-8 格式。
PrintStream out = new PrintStream(System.out, true, "UTF-8");
out.println(rl_tweets);
现在它打印为
“如果ωe给É'一点爱,也许ωe可以改变ωorld。”
【问题讨论】:
-
看来你想用编码玩ɑround。
-
这是希腊字母 omega (Ω) 的小写版本。 This may help.