【发布时间】:2022-01-21 13:15:21
【问题描述】:
我有一个这样的 CSV 文件:
Time Latitude Longitude
2021-09-12 23:13 44.63 -63.56
2021-09-14 23:13 43.78 -62
2021-09-16 23:14 44.83 -54.6
2021-09-12 23:13 在Time 列下。
我想用 pandas 打开它。但是第一列有问题。它包含一个空格。如果我使用以下方式打开它:
import pandas as pd
points = pd.read_csv("test.csv", delim_whitespace=True)
我明白了
| Time | Latitude | Longitude | |
|---|---|---|---|
| 2021-09-12 | 23:13 | 44.630 | -63.560 |
| 2021-09-14 | 23:13 | 43.780 | -62.000 |
| 2021-09-16 | 23:14 | 44.830 | -54.600 |
但我想跳过 CSV 中第一列中的空格(2021-09-12 23:13 应该在 Time 列下),例如:
| Time | Latitude | Longitude | |
|---|---|---|---|
| 0 | 2021-09-12 23:13 | 44.630 | -63.560 |
| 1 | 2021-09-14 23:13 | 43.780 | -62.000 |
| 2 | 2021-09-16 23:14 | 44.830 | -54.600 |
使用pd.read_csv时如何忽略第一个空格?
请不要拘泥于这个 csv 文件。这是跳过(不考虑作为分隔符)第一列中的第一个空格的一般问题。因为大家都知道第一个空格是时间值的一部分,不是分隔符。
【问题讨论】:
-
列是用空格还是制表符分隔的?如果分隔符是一个制表符,那么您可以使用
sep=\t而不是delim_whitespace=True。那么列值中的空格就无关紧要了。 -
都是空格。
-
对于此类字符敏感问题,请包含分隔文件的原始文本。 Markdown 表很漂亮,但隐藏了解决此问题的真正相关信息。