【发布时间】:2022-08-17 01:30:44
【问题描述】:
数据示例:程序出现第二个数据错误,因为它有 7\",\"而普通数据只有 6 个。
7558,1488,1738539,,,,1
7559,1489,1702292,,\"(segment \\\"Pesnya, ili Kak velikij Luarsab khor organizovyval\\\")\",8,1
7560,1489,2146930,1975,,21,1
它来自 imdb 数据集的 cast_info 表。 ([IMDB][2] 来自名为基数估计的数据库任务。)它的 sep 是 \",\"。但是如果字符串中有一些 sep,熊猫就无法识别它们。 错误日志:
File \"\\pytorch\\lib\\site-packages\\pandas\\io\\parsers\\readers.py\", line 488, in _read
return parser.read(nrows)
File \"\\pytorch\\lib\\site-packages\\pandas\\io\\parsers\\readers.py\", line 1047, in read
index, columns, col_dict = self._engine.read(nrows)
File \"\\pytorch\\lib\\site-packages\\pandas\\io\\parsers\\c_parser_wrapper.py\", line 223, in read
chunks = self._reader.read_low_memory(nrows)
File \"pandas\\_libs\\parsers.pyx\", line 801, in pandas._libs.parsers.TextReader.read_low_memory
File \"pandas\\_libs\\parsers.pyx\", line 857, in pandas._libs.parsers.TextReader._read_rows
File \"pandas\\_libs\\parsers.pyx\", line 843, in pandas._libs.parsers.TextReader._tokenize_rows
File \"pandas\\_libs\\parsers.pyx\", line 1925, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 7 fields in line 7559, saw 8
我该如何解决? [2]:https://www.imdb.com/interfaces/
-
请以文本而非图像的形式发布错误消息。