检查字符串是否包含“pålogget” - unicode 错误

【问题标题】：Check if a string contains "pålogget" - unicode error检查字符串是否包含“pålogget” - unicode 错误
【发布时间】：2012-08-15 06:51:51
【问题描述】：

我正在挪威网站上使用 BeautifulSoup 进行屏幕截图。我需要检查一个字符串是否包含单词 "Pålogget"（表示已登录）。

if "Pålogget" in status:

我收到以下错误

文件“scrape.py”，第 23 行 SyntaxError：第 23 行的文件 scrape.py 中的非 ASCII 字符“\xc3”，但未声明编码；详情见http://www.python.org/peps/pep-0263.html

我该怎么做？

【问题讨论】：

【解决方案1】：

添加

# -*- coding: utf-8 -*-

到文件的开头。

【讨论】：

用u"Pålogget" 明确地将字符串标记为Unicode 会更好，不是吗？
Tommyka 应该两者兼得。编码行会告诉编译器使用 UTF-8 编码来解释文件（文明的编辑器会自动得到，但是 YMMV）并且“u”前缀会让编译器知道后面的不是字节序列，而是一个Unicode 字符串。仅使用前缀或仅使用编码可能会导致意外结果。
您还应该提及以 UTF-8 格式保存文件。
它就像一个魅力！我之前用 u"Pålogget" 试过，但需要文件编码。