【问题标题】:Check if a string contains "pålogget" - unicode error检查字符串是否包含“pålogget” - unicode 错误
【发布时间】:2012-08-15 06:51:51
【问题描述】:

我正在挪威网站上使用 BeautifulSoup 进行屏幕截图。我需要检查一个字符串是否包含单词 "Pålogget"(表示已登录)。

if "Pålogget" in status:

我收到以下错误

文件“scrape.py”,第 23 行 SyntaxError:第 23 行的文件 scrape.py 中的非 ASCII 字符“\xc3”,但未声明编码;详情见http://www.python.org/peps/pep-0263.html

我该怎么做?

【问题讨论】:

标签: unicode python-2.7 beautifulsoup


【解决方案1】:

添加

# -*- coding: utf-8 -*-

到文件的开头。

【讨论】:

  • u"Pålogget" 明确地将字符串标记为Unicode 会更好,不是吗?
  • Tommyka 应该两者兼得。编码行会告诉编译器使用 UTF-8 编码来解释文件(文明的编辑器会自动得到,但是 YMMV)并且“u”前缀会让编译器知道后面的不是字节序列,而是一个Unicode 字符串。仅使用前缀或仅使用编码可能会导致意外结果。
  • 您还应该提及以 UTF-8 格式保存文件。
  • 它就像一个魅力!我之前用 u"Pålogget" 试过,但需要文件编码。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2018-01-06
  • 1970-01-01
  • 1970-01-01
  • 2011-03-31
  • 2016-09-20
  • 2011-11-09
  • 2013-05-18
相关资源
最近更新 更多