【发布时间】:2014-03-16 18:01:36
【问题描述】:
在我的应用程序中,用户通过表单的 textarea 提交文本,该文本被传递到应用程序,然后由 jsesc 库处理,该库会转义 javascript 字符串。
问题是当我输入俄语文本时,例如
нам #интересны наши #идеи
我得到的是
'\u043D\u0430\u043C #\u0438\u043D\u0442\u0435\u0440\u0435\u0441\u043D\u044B \u043D\u0430\u0448\u0438 #\u0438\u0434\u0435\u0438'
然后我需要通过FlowDock 传递这些数据以提取主题标签,而 FlockDock 只是无法识别它。
谁能告诉我
1) 将其转换为该表示的需要是什么;
2) 如果将其转换回 FlowDock 和数据库的西里尔编码是有意义的,还是应该将其保留为 Unicode 并尝试让 FlowDock 使用它?
谢谢!
更新
完整的脚本是:
result = getField(req, field);
result = S(result).trim().collapseWhitespace().s;
// at this point result = "нам #интересны наши #идеи"
result = jsesc(result, {
'quotes': 'double'
});
// now i end up with Unicode as above above (\u....)
var hashtags = FlowdockText.extractHashtags(result);
FlowDock 收到result
\u043D\u0430\u043C #\u0438\u043D\u0442\u0435\u0440\u0435\u0441\u043D\u044B \u043D\u0430\u0448\u0438 #\u0438\u0434\u0435\u0438
并且不会从中提取主题标签...
【问题讨论】:
标签: javascript node.js unicode encoding cyrillic