【发布时间】:2017-06-14 13:35:31
【问题描述】:
我遇到了 solr 的编码问题。我们在两台不同的服务器上有“相同”的设置,但其中一台能够在没有 ??? 的情况下对文档进行索引字符,但测试服务器遇到了问题。
Solr 结果示例:
产品服务器:
effet sur l’acquisition des connaissances »\n\n#12;#12;EFFET D’UNE SÉQUENCE
测试服务器:
effet sur l’acquisition des connaissances »\n\n��EFFET D’UNE SÉQUENCE D’ENSEIGNEMENTS
我在两台服务器上运行相同版本的 java:
java version "1.7.0_80"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)
两者都有相同的 Java 选项:
JAVA_OPTS=" -Dfile.encoding=UTF-8 "
两个 solr 具有相同的 Java 属性(在 UI 中)。
#12; 是什么意思?什么意思?
问题可能出在哪里?
操作系统:
- Ubuntu 14.04
软件:
- Tomcat 8.0.43
- 空间 6.0
- Solr 4.10.4
编辑: 两台服务器上的语言环境输出:
LANG=en_CA.utf8
LANGUAGE=en_CA:en
LC_CTYPE="en_CA.utf8"
LC_NUMERIC="en_CA.utf8"
LC_TIME="en_CA.utf8"
LC_COLLATE="en_CA.utf8"
LC_MONETARY="en_CA.utf8"
LC_MESSAGES="en_CA.utf8"
LC_PAPER="en_CA.utf8"
LC_NAME="en_CA.utf8"
LC_ADDRESS="en_CA.utf8"
LC_TELEPHONE="en_CA.utf8"
LC_MEASUREMENT="en_CA.utf8"
LC_IDENTIFICATION="en_CA.utf8"
LC_ALL=
谢谢!
【问题讨论】:
-
两台服务器上“locale”命令的输出是什么?
-
我忘了说,我刚刚加到帖子里了
标签: java tomcat encoding solr dspace