【发布时间】:2017-12-13 14:02:51
【问题描述】:
我使用 pandas python 库创建了一个脚本来合并几个 .csv 文件。所有文件都使用“\n\r”作为记录分隔符。
我遇到了一个文件的问题,在特定字段中,有时会出现“\n”。这导致pandas.read_csv 将其计为新行。
是否有机会(除了字段分隔符)指定记录分隔符?或者有没有更好的解决方案?
谢谢你和最好的问候
【问题讨论】:
标签: python pandas csv delimiter
我使用 pandas python 库创建了一个脚本来合并几个 .csv 文件。所有文件都使用“\n\r”作为记录分隔符。
我遇到了一个文件的问题,在特定字段中,有时会出现“\n”。这导致pandas.read_csv 将其计为新行。
是否有机会(除了字段分隔符)指定记录分隔符?或者有没有更好的解决方案?
谢谢你和最好的问候
【问题讨论】:
标签: python pandas csv delimiter
查看pandas.read_csv中的所有kwargs
还有lineterminatorkwarg:
lineterminator : str (length 1), default None
Character to break file into lines. Only valid with C parser.
请注意,它需要使用 C 解析器(请参阅engine kwarg)
鉴于您的行以\r 结尾,即carriage return character,我建议将其用作lineterminator 并进行后处理以清理\n 留下的内容。
我认为设置lineterminator='\r' 应该可以解决您的问题。
【讨论】: