【发布时间】:2016-05-05 08:15:27
【问题描述】:
我是 python 使用的新手。但要通过实践学习在我的数据处理中使用。
我有一个格式如下所示的大数据文件。
行数和列数总是未知。在此示例中,显示了 2 个连续的行。
第 1 列是“时间”,第 n 列是要从标识符中选择的相关数据(第一行中的“abc”)。
................
“2013-01-01 00:00:02” 228 227 15.65 15.84强> 14.85 14.68 14.53 13.75 12.45 12.55
“2013-01-02 00:01:03” 225 227 16.35 15.99 14.85 14.73 14.43 13.8 12.85 13.2
......
期望的输出为
- Column1 = 以时间表示,因此时间差可以是 计算出来的。
- 列 (n) = 要进一步处理的数据,应位于 浮动。
在我过去的试验中,我最终出现在列表中,因此无法转换任一列。
我试图搜索过去的问题和答案。但未能解释所有,因为我是一个初学者。我希望您能快速帮助将数据读入列格式,以便以后处理。我相信,可以进行进一步的处理,因为它是更多的数学运算。
真的很感谢你的帮助。
问候
古里
CORRECTION-1:
我知道 pandas 提供了一个紧凑的版本来提取我之前需要的列。小组建议后学习良好。
代码如下:
import pandas as pd
data = pd.read_csv(fp, sep='\t')
entry=[]
entry = data['u90']
print entry, '\n', entry[5]
out_file = open("out.txt", "w")
entry.to_csv(out_file)
问候
古里
【问题讨论】:
-
这是一个经常被问到的问题,例如使用pandas 来读取您的数据
-
作为 python 编码的新手,pandas 似乎有点难以理解。我会保留这个以供我进一步练习。这也是我任务的一部分。因此,期待通过简单的代码练习更快地解决问题。最重要的是,感谢您的建议。
-
根据 Hugo 的建议,我尝试了 pandas,它非常有效。
标签: python datacolumncollection