【发布时间】:2018-04-27 13:13:09
【问题描述】:
我的 Java webapp 有问题。
这是 index.jsp 中的代码:
<%@page contentType="text/html" pageEncoding="UTF-8" %>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<% request.setCharacterEncoding("UTF-8");
response.setCharacterEncoding("UTF-8");
%>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>JSP Page</title>
</head>
<body>
<h1>Hello World!</h1>
<form action="index.jsp" method="get">
<input type="text" name="q"/>
</form>
Res: <%= request.getParameter("q") %>
</body>
</html>
当我对请求进行wireshark 时,我的浏览器会发送此标头:
GET /kjd/index.jsp?q=%C3%A9 HTTP/1.1\r\n
...
Accept-Charset: UTF-8,*\r\n
Tomcat 服务器返回给我这个:
Content-Type: text/html;charset=UTF-8\r\n
但如果我在表单中发送“é”(UTF-8 中的 %C3%A9),则会显示“é”。
我的理解是浏览器发送一个用 UTF-8 编码的“é”(%C3%A9)。
但服务器将此解释为 ISO-8859-1。所以 %C3 被解码为 Ã,%A9 被解码为 ©,然后发回以 UTF-8 编码的响应。
在代码中,请求应该使用 UTF-8 解码:
request.setCharacterEncoding("UTF-8");
但是,如果我发送这个网址:
http://localhost:8080/kjd/index.jsp?q=%E9
“%E9”使用 ISO-8859-1 解码并显示“é”。
为什么这不起作用?为什么使用 ISO-8859-1 对请求进行解码?
我已经在 Tomcat 6 和 7 以及 Windows 和 Ubuntu 上尝试过。
【问题讨论】:
-
This apache wiki page 可以帮助你;运行它以查看是否可以进行任何更改。
标签: java jsp tomcat servlets character-encoding