【发布时间】:2020-08-14 01:57:25
【问题描述】:
我有一个来自一家小型企业的 CSV 文件,该文件代表了他们在大约 30 年内分布的大约 70,000 个订单的记录。我的目标是将此数据存储在模型设置中带有 DecimalField 的 Django 项目中以接收导入。
在尝试将数据存储在 Django 中之前,我首先尝试将这些数据导入 Python。虽然大多数记录导入正常,但在导入期间大约有 1000 条记录抛出
- 我已尝试使用 python csv 库和 pandas 来打开文件。
- 我在文本编辑器 (SublimeText) 中查看了 csv 文件,但未发现数据存储方式有任何异常。
- 我已尝试使用 Microsoft Excel 将数据转换为 UTF-8
- 我尝试将 Excel 中的数据复制到 SublimeText,然后从 SublimeText 复制回 Excel 中的新行(预先没有数据的原始行)。
这些都没有解决问题。
我怎样才能找出这些数据有什么问题并解决这个错误?
【问题讨论】:
-
澄清一下,你能在 Excel 中打开 CSV 文件吗?您是否尝试过使用“chardet”库来确定文件的编码?你能找出导致问题的线路吗?
-
chardet 的结果:{'encoding': 'UTF-8-SIG', 'confidence': 1.0, 'language': ''} 我可以毫无问题地在 excel 中打开文件。我不确定哪些行引发了异常。我会尝试做一些更好的错误处理来查明这一点。