【问题标题】:Column to list using delimiter使用分隔符列出的列
【发布时间】:2019-10-09 19:25:39
【问题描述】:

需要将列拆分为多列。使用空格分隔符在 excel 上工作。

            2.11           OBSERVATION DATA    GPS(GPS)            RINEX VERSION / TYPE
0       cnvtToRINEX 2.30.0  convertToRINEX OPR  08-Mar...                              
1       ----------------------------------------------...                              
2       OFFICE                                        ...                              
3                                                     ...                              
4       GNSS Observer       Trimble                   ...                              
5       0220329451          5700                2.26  ...                              
6                           TRM39105.00               ...                              
7         5018389.6272  1676641.6590 -3549783.0761    ...                              
8               0.0000        0.0000        0.0000    ...                              
9            1     1     0                            ...                              
10           4    C1    L1    L2    P2                ...                              
11        1997     7    23     6    28   40.0000000   ...                              
12        1997     7    23     7    45   13.0000000   ...                              
13           0                                        ...                              
14          12                                        ...                              
15          10                                        ...                              
16         G01 45525 45512 45521 45521                ...

【问题讨论】:

  • 它们是由制表符分隔还是只是多个空格?
  • 只是多个空格,谢谢

标签: python pandas list split delimiter


【解决方案1】:

它看起来不像是excel,但你可以通过定义多个空格来尝试使用正则表达式进行拆分:

import re

for x in lines:
    s = re.split(r'\s\s+', x) # split on more than 2 spaces
    # process the line

但是通过观察,您的数据有一些极端情况,并且没有明确的分隔符,所以我不能保证它可以完美运行(而且我认为不可能有任何)。

例如:

1676641.6590 -3549783.0761

好像只隔了一个空格,一个字都看不出来,你不想在下面分开吧?

GNSS 观察者

【讨论】:

  • 嗨,答案是,也可以拆分所有内容,不要介意。最终目标是用正确的日期替换当前日期值。
  • 在上面的例子中你看不到日期,但它是相同的 wacko 列表格式
  • @M.Lord 哪一行是日期?如果它遵循某种模式,那么你可以使用正则表达式找到它。
  • 使用 df.replace 使用 pandas 使其工作 - 数据全部作为一列读取
猜你喜欢
  • 2021-12-27
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-02-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多