【发布时间】:2012-10-16 20:29:13
【问题描述】:
我有一份草草撰写的文档。这是一个包含西里尔字符的字典。大多数字典都是可以管理的,但我遇到了一件我需要帮助的事情。单词中有重音字母,它们大多被正确格式化为带有 unicode 重音的字母(因此形成一个字母)。然而,有一些非常特殊的字母看起来类似于:a;´(其中“a”是任意西里尔字母)。你会期望 á 代替它。但是,如果只有这个东西可以导出到,比如说 HTML 并在文本编辑器中操作,它本身就不是问题。问题是 Word 将这个“事物”视为单个字符/实体,并且
- 导出时完全省略
- 复制时只能粘贴到记事本中(将其翻译成三个单独的字符),粘贴到写字板时根本不会出现。
- 在 Word 中运行搜索时,将找不到字母,既找不到实际字符,也找不到完全复制/粘贴的组合。
- 在任何其他软件(例如 Libre Office)中打开文档时,该字母会消失
此时我正在尝试:
- 了解这个组合到底是什么
- 运行搜索/替换操作以查找并清除所有这些错误
Here's 一个示例 Word 文件。
以下是相关单词/字母的截图:
正确输入时应显示为“скре́пка”。
【问题讨论】:
-
Avast!声称问题中链接的资源已被 URL:Mal 感染。
-
Ken,技术上不是,但我的最终目的是。我需要将文档分解成小部分,并通过导出和运行正则表达式搜索/替换查询将其放入数据库中。所以目的(至少)是编程。
-
乔:好的。所以如果我问一个关于我应该买什么样的电脑的问题,如果有一天我打算用它来写代码,这就是话题吗?抱歉——我不这么认为。 :-)
标签: ms-word diacritics fieldcodes