【发布时间】:2018-05-29 21:26:00
【问题描述】:
我正在阅读大熊猫的大型 csv 文件:
features = pd.read_csv(filename, header=None, names=['Time','Duration','SrcDevice','DstDevice','Protocol','SrcPort','DstPort','SrcPackets','DstPackets','SrcBytes','DstBytes'], usecols=['Duration','SrcDevice', 'DstDevice', 'Protocol', 'DstPort','SrcPackets','DstPackets','SrcBytes','DstBytes'])
我明白了:
sys:1: DtypeWarning: Columns (6) have mixed types. Specify dtype option on import or set low_memory=False.
%!PS-Adobe-3.0
如何在输入中找到导致此警告的第一行?我需要这样做来调试输入文件的问题,它不应该有混合类型。
【问题讨论】:
-
请在此处查看类似问题 - stackoverflow.com/questions/24251219/…
-
@mm441 谢谢,但这似乎没有包含如何找到导致警告的行的答案吗?
-
您的文件有多大?如果足够小,“通过眼睛”可能是最快的方式。
-
@MadPhysicist 大约 400 万行。
-
让实习生去做吧:)