【问题标题】:UTF-8 encoding converts strings to bytes with strange charactersUTF-8 编码将字符串转换为带有奇怪字符的字节
【发布时间】:2019-12-29 22:25:04
【问题描述】:

我正在使用 UTF-8 编码将我的文本数据写入 CSV 文件。但是 csv 文档包含一些非常奇怪的字符,例如,

\n\n#\xd9\x83\xd8\xb4\xd9\x85\xd9\x8a\xd8\xb1_\xd8\xaa\xd8\xb0\xd8\xa8\xd8\xad_\xd9\x88\xd9\x83\xd8\xaa\xd8\xa7\xd8\xb1\xd8\xa7_\xd8\xaa\xd8\xad\xd8\xaa\xd9\x81\xd9\x84 \n.

我该如何解决这个问题?

我变了

pd.read_csv('filename.csv')

pd.read_csv('filename.csv', encoding='utf-8').

它没有用。

我当前的代码:

for tweet in tweepy.Cursor(api.search, q="#pewdiepie-filter:retweets",count=5000, lang="en",tweet_mode="extended").items():
    print (tweet.created_at, tweet.full_text)
    csvWriter.writerow([tweet.created_at, tweet.full_text])

谢谢,塞缪尔·杜拉维尔

【问题讨论】:

    标签: python csv utf-8 encode


    【解决方案1】:

    这是一个注释字符串。

    用途:

    pd.read_csv('filename.csv', encoding='utf-8', comment="#")
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-08-16
      • 1970-01-01
      • 1970-01-01
      • 2014-03-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-12-08
      相关资源
      最近更新 更多