【发布时间】:2020-02-12 05:50:27
【问题描述】:
例如,我从 excel 中导入了一个数据集,看起来像这样,只有一列多行,包含重复的信息,如姓名、电话和标题:
表
---------
0 名称1
1 部电话1
2 标题1
3 名称2
4 电话2
5 标题2
6 姓名3
7 电话3
8 标题3
我想以此构建一个包含 3 列名称、电话、标题的表格 并将该信息提取到这个新表中。如:
姓名电话标题
姓名 1 电话 1 标题 1
姓名2 电话2 标题2
等等...我应该如何解决这个问题?我正在将 Python 与 Jupyter Notebook 一起使用。
++ 所以在这里,所有的名字/电话/头衔都是不同的词,例如,名字可以是 Sarah Kim、Andrew m。白色,迈克·耶斯曼。电话可以是 111-222-3333、333-444-5555 等。而且我有超过 500 多行,所以我的第一次尝试是尝试使用 REGEX 来分隔姓名、电话和标题。我正在使用 pandas 数据框,我想学习如何解决这样的问题,而不仅仅是获取代码。
【问题讨论】:
-
根据您自己的研究,到目前为止您有哪些尝试?你的结果是什么?
-
这能回答你的问题吗? Printing Lists as Tabular Data
-
@G.Anderson 对于如何处理这样的问题,我什至没有太多想法。我不是要代码答案,而是要如何思考以及要考虑什么(?)。
-
我认为这太宽泛/模糊了。请参阅:How to Ask、help center。
-
如果你想要对齐的列,那么给定列中的所有值都需要具有相同的宽度。使用 Python 格式使列中的每个值占用相同数量的字符,并在需要的地方用空格填充。