【问题标题】:read_csv reads all input into first column for some rowsread_csv 将所有输入读入某些行的第一列
【发布时间】:2019-11-19 15:54:13
【问题描述】:

我正在尝试读取我从City of Chicago 下载的 csv 文件作为 csv 文件到数据帧中。但是,对于许多行,所有数据都被读入第一列,如第 2 行。如果我删除这些行,则只剩下 5% 的数据。有谁知道该怎么做? 此外,当以 txt 格式打开 csv 文件时,未正确读取的行有一个前导“。我不知道这是否会导致问题。

crime_df = pd.read_csv('ChicagoCrime.csv')
crime_df.head(10)

enter image description here

【问题讨论】:

  • 请将您的代码和数据发布为文本,而不是图像。

标签: python pandas csv


【解决方案1】:

编辑:我将文件下载为 Excel 的 CSV 文件,没有遇到任何问题。我会推荐这个,除非你真的不想再次下载它。

我的第一个建议是在 read_csv 函数中指定更多参数来帮助它。您可以尝试指定分隔符、指定要使用的引擎、将 parse_dates 设置为 True 等。请查看 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html 了解所有可用参数。

【讨论】:

  • 我用 csv for excel 文件试过了,但结果是一样的。但是,我之前没有收到此错误消息:DtypeWarning: Columns (1,2,3,4,5,6,7,8,9,14,18) has mixed types。在导入时指定 dtype 选项或设置 low_memory=False。交互性=交互性,编译器=编译器,结果=结果)
  • 您是否尝试过指定数据类型或指定low_memory=True?如果有,结果如何?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-09-04
  • 1970-01-01
  • 1970-01-01
  • 2015-04-04
  • 1970-01-01
  • 2022-11-11
相关资源
最近更新 更多