【问题标题】:Python unicode encoding issuePython unicode 编码问题
【发布时间】:2013-09-10 20:37:38
【问题描述】:

使用 python 2.7.5。所有的数据库和表都是

我的代码是这样的:

import MySQLdb as mdb
import urllib2
import sys
import logging
logging.basicConfig(level=logging.INFO)

from bs4 import BeautifulSoup as BS
con = mdb.connect('loclhost', 'root', '', 'mydb');
cur = con.cursor()
cur.execute('SET NAMES utf8;')
cur.execute('SET CHARACTER SET utf8;')
cur.execute('SET character_set_connection=utf8;')
with con:
...
        sql_insert = """INSERT INTO Teams (name, category, countryId) VALUES (%s, 1, %s)"""
        cursor = con.cursor()
        try:
            affected_count = cursor.execute(sql_insert, (name, id))  <<< this line
            con.commit()
        except mdb.IntegrityError:
            logging.warn("failed to insert values %s, %s", name, id)
        finally:
           cursor.close()
...

con.close()

收到错误信息:

"UnicodeEncodeError: 'latin-1' codec can't encode character u'\u015f' 在位置 2:序数不在范围内(256)“

上面标记的行。我做错了什么?

【问题讨论】:

  • 你在使用数据库代理吗?
  • @akellehe 没有直接连接

标签: python mysql database utf-8 character-encoding


【解决方案1】:

试试:

con = mdb.connect('loclhost', 'root', '', 'mydb', 
                  use_unicode=True, charset='utf8')

这是一个证明它有效的演示:

如果您在以下设置中不使用use_unicode=True,则会收到 UnicodeEncodeError:

import MySQLdb
import config

def setup_charset(cursor, typ='latin1'):
    sql = 'DROP TABLE IF EXISTS foo'
    cursor.execute(sql)
    sql = '''\
        CREATE TABLE `foo` (
          `fooid` int(11) NOT NULL AUTO_INCREMENT,
          `bar` varchar(30),
          `baz` varchar(30),
          PRIMARY KEY (`fooid`)) DEFAULT CHARSET={t}
        '''.format(t=typ)
    cursor.execute(sql)
    sql = 'INSERT INTO foo (bar,baz) VALUES (%s,%s)'

connection = MySQLdb.connect(
    host=config.HOST, user=config.USER,
    passwd=config.PASS, db='test')

cursor = connection.cursor()
setup_charset(cursor, typ='utf8')
sql = u'INSERT INTO foo (bar,baz) VALUES (%s,%s)'
try:
    cursor.execute(sql, [u'José Beiträge', u'∞'])
except UnicodeEncodeError as err:
    # You get this error if you don't use
    # (use_unicode=True, charset='utf8') see below.
    print(err)

引发异常:

'latin-1' codec can't encode character u'\u221e' in position 0: ordinal not in range(256)

如果你确实使用use_unicode=True,你可以插入unicode而不会出错:

connection = MySQLdb.connect(
    host=config.HOST, user=config.USER,
    passwd=config.PASS, db='test',
    use_unicode=True,
    charset='utf8')
cursor = connection.cursor()
cursor.execute(sql, ['José Beiträge', '∞'])
cursor.execute('SELECT * from foo')
for row in cursor:
    print(u'{} {}'.format(*row[1:]))

打印

José Beiträge ∞

【讨论】:

  • 如果还是不行怎么办?我基本上与 OP 有相同的设置,但仍然得到UnicodeEncodeError: 'ascii' codec can't encode […]
  • @maryisdead:创建一个 minimal working example 来演示问题。然后发布一个新问题。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2016-07-07
  • 1970-01-01
  • 2016-04-01
  • 2019-10-30
  • 2013-09-13
  • 2014-04-08
  • 2011-07-14
相关资源
最近更新 更多