【发布时间】:2019-02-12 16:02:25
【问题描述】:
我正在从 csv 文件中获取货件数据,出于隐私目的我已经编辑了数据,但需要注意的是,在我的 csv 文件上使用 pandas.read_csv 时,如下所示的原始文件在这个意义上是正常的:邮政编码(01234)以0开头,订单号(22276)为整数。
使用 pandas.read_csv 并打印出我的数据(并在文本编辑器中查看我的数据)后,我看到前导 0 已从邮政编码中取出(现在是 1234),订单号现在是浮点数 (22276.0)
原文:
GROUND,Third PARTY,公司名称,1 路 Ave,Town,State,01234,,22276,22276,22276,,客户名,街道 名称,00000 00th Ave Z.Z.,,镇,州,00001,V476V6,18001112222,,,,包,1
使用 pandas.read_csv 后:
GROUND,Third PARTY,Dreams,100 Higginson Ave,LINCOLN,RI,1234,,22276.0,22276.0,22276.0,,客户名,街道 名称,00000 00th Ave Z.Z.,,镇,州,00001,V476V6,18001112222,,,,包,1
我看到其他人也有这些问题,在这些问题中,您会看到关于如何解决问题的精心编写的答案。我想知道的是为什么问题首先存在。为什么读取函数会将原始数据写回文件?
编辑
这是我目前正在使用的代码,参考是带有订单号的列的名称。
import pandas
grid = pandas.read_csv("thirdparty.csv", dtype={'ZIP': int, 'REFERENCE': int})
with pandas.option_context('display.max_rows', None, 'display.max_columns', None):
print(grid)
【问题讨论】:
-
请分享您用于读取 csv 文件的代码
-
朱利安我更新了我的问题!
-
为确保不会丢失 01234 中的前导 0,您需要将 ZIP 作为字符串读取。
标签: python python-3.x pandas