【发布时间】:2023-02-25 21:44:25
【问题描述】:
(完全公开——然而,Python 编程和 Pandas 的相对初学者能够快速上手,并且绝对喜欢玩弄/操纵数据以获得我想要的东西!)
大家好——希望大家一切都好。
就是说,我正在解决一个问题,我有一个示例数据 CSV 文件,我使用 pandas 从 Web 将其导入到我的代码中,它工作得很棒............太棒了!
安装 Pandas 后也在学习的示例代码:
empCSV = pd.read_csv("https://data........")
print (empCSV)
打印时的示例输出:
Work Date Employee hours Overtime Hours
0 02/22/2023 11 19 39 44 65 07 2.0
1 02/20/2023 03 17 26 38 54 15 3.0
2 02/18/2023 08 21 31 32 37 23 4.0
3 02/15/2023 31 32 54 60 63 12 4.0
4 02/13/2023 17 26 37 61 65 02 2.0
etc.....
现在,我想处理的主要数据(给定数量和频率)是员工工时。这些就是问题所在。既然我想玩弄这些数字,我是否应该只按列表过滤它们然后玩弄它们?因此,在阅读多个论坛时,它说我可以只提取这些值,然后将它们全部放入一个列表中……我这样做了……而且行得通。又厉害了!
示例代码
empHours = empCSV['Employee hours'].tolist()
print(empHours)
打印时的示例输出:
[1435 rows x 3 columns]
['11 19 39 44 65 07', '03 17 26 38 54 15', '08 21 31 32 37 23', '31 32 54 60 63 12', '17 26 37 61 65 02', ......
但是现在,我想获得所有第一个数值(即 11,03,08 等),所有第二个数值(即 19,17,21 等...)等等进入单独的字符串,以便我根据需要使用它们。
我应该坚持使用 Pandas 吗?我应该只使用循环列表和操作吗?我偏离轨道了吗?
.....去!
【问题讨论】: