【问题标题】:pandas how to read this row?熊猫如何阅读这一行?
【发布时间】:2022-08-17 01:30:44
【问题描述】:

数据示例:程序出现第二个数据错误,因为它有 7\",\"而普通数据只有 6 个。

7558,1488,1738539,,,,1
7559,1489,1702292,,\"(segment \\\"Pesnya, ili Kak velikij Luarsab khor organizovyval\\\")\",8,1
7560,1489,2146930,1975,,21,1

它来自 imdb 数据集的 cast_info 表。 ([IMDB][2] 来自名为基数估计的数据库任务。)它的 sep 是 \",\"。但是如果字符串中有一些 sep,熊猫就无法识别它们。 错误日志:

  File \"\\pytorch\\lib\\site-packages\\pandas\\io\\parsers\\readers.py\", line 488, in _read
return parser.read(nrows)
  File \"\\pytorch\\lib\\site-packages\\pandas\\io\\parsers\\readers.py\", line 1047, in read
index, columns, col_dict = self._engine.read(nrows)
  File \"\\pytorch\\lib\\site-packages\\pandas\\io\\parsers\\c_parser_wrapper.py\", line 223, in read
chunks = self._reader.read_low_memory(nrows)
  File \"pandas\\_libs\\parsers.pyx\", line 801, in pandas._libs.parsers.TextReader.read_low_memory
  File \"pandas\\_libs\\parsers.pyx\", line 857, in pandas._libs.parsers.TextReader._read_rows
  File \"pandas\\_libs\\parsers.pyx\", line 843, in pandas._libs.parsers.TextReader._tokenize_rows
  File \"pandas\\_libs\\parsers.pyx\", line 1925, in pandas._libs.parsers.raise_parser_error
  pandas.errors.ParserError: Error tokenizing data. C error: Expected 7 fields in line 7559, saw 8

我该如何解决? [2]:https://www.imdb.com/interfaces/

  • 请以文本而非图像的形式发布错误消息。

标签: python pandas dataset


【解决方案1】:

试试这个我认为这应该工作。

import pandas as pd
pd.read_csv(data_path,sep = ",")

【讨论】:

  • 对不起先生,这是我的问题。我没有正确描述它,我更新了问题。你的方法不能解决问题。但还是谢谢大家。
猜你喜欢
  • 2019-01-23
  • 1970-01-01
  • 2012-05-16
  • 1970-01-01
  • 1970-01-01
  • 2015-05-09
  • 2019-11-05
  • 1970-01-01
  • 2016-09-25
相关资源
最近更新 更多