【发布时间】:2017-02-14 04:37:01
【问题描述】:
不知道为什么,但是当我将 json 文件中的推文加载到 pandas 时,我得到了很多奇怪的字符。
for file_name in files:
if '.json' in file_name:
file_path = WORKING_DIR + '/data/' + file_name
# Reading the json as a dict
with open(file_path) as json_d:
data = json.load(json_d, encoding='utf8')
json_df = pd.DataFrame.from_dict(data)
dfs.append(json_df)
【问题讨论】:
-
u'�' 表示使用
'utf-8'编码解码字符失败。如果你应用严格解码,你会得到错误而不是 u'�'。文件是否采用其他编码?