UTF-8 编码将字符串转换为带有奇怪字符的字节答案

【问题标题】：UTF-8 encoding converts strings to bytes with strange charactersUTF-8 编码将字符串转换为带有奇怪字符的字节
【发布时间】：2019-12-29 22:25:04
【问题描述】：

我正在使用 UTF-8 编码将我的文本数据写入 CSV 文件。但是 csv 文档包含一些非常奇怪的字符，例如，

\n\n#\xd9\x83\xd8\xb4\xd9\x85\xd9\x8a\xd8\xb1_\xd8\xaa\xd8\xb0\xd8\xa8\xd8\xad_\xd9\x88\xd9\x83\xd8\xaa\xd8\xa7\xd8\xb1\xd8\xa7_\xd8\xaa\xd8\xad\xd8\xaa\xd9\x81\xd9\x84 \n.

我该如何解决这个问题？

我变了

pd.read_csv('filename.csv')

到

pd.read_csv('filename.csv', encoding='utf-8').

它没有用。

我当前的代码：

for tweet in tweepy.Cursor(api.search, q="#pewdiepie-filter:retweets",count=5000, lang="en",tweet_mode="extended").items():
    print (tweet.created_at, tweet.full_text)
    csvWriter.writerow([tweet.created_at, tweet.full_text])

谢谢，塞缪尔·杜拉维尔

【问题讨论】：

标签： python csv utf-8 encode

【解决方案1】：

这是一个注释字符串。

用途：

pd.read_csv('filename.csv', encoding='utf-8', comment="#")

【讨论】：