【发布时间】:2022-01-03 07:26:58
【问题描述】:
我有这个代码:
import pandas as pd
import os
ext = ('.tsv')
for files in os.listdir(os.getcwd()):
if files.endswith(ext):
x = pd.read_table(files, sep='\t', usecols=['#Chrom','Pos','RawScore','PHRED'])
x.drop_duplicates(subset ="Pos",keep = False, inplace = True)
data_frame=x.head()
print(data_frame)
#Chrom Pos RawScore PHRED
77171 6 167709702 7.852318 39.0
19180 6 31124849 7.623789 38.0
15823 6 29407955 6.982213 37.0
19182 6 31125257 6.817868 36.0
19974 6 31544591 6.201438 35.0
#Chrom Pos RawScore PHRED
52445 9 139634495 6.950686 36.0
46470 9 125391241 5.477094 34.0
49866 9 134385435 4.841222 33.0
48642 9 131475583 4.357986 31.0
40099 9 113233652 4.284035 31.0
#Chrom Pos RawScore PHRED
7050 13 32972626 6.472542 36.0
32416 13 100518634 5.405765 33.0
10834 13 42465713 4.406294 32.0
9963 13 39422624 4.374808 31.0
22993 13 76395620 4.193058 29.4
您可以想象,我得到了多个具有相同列名但来自不同染色体的数据框。 如何在不同的 csv 文件中获取多个数据帧?
【问题讨论】:
-
您希望在 what 文件中包含哪些 数据帧?请在问题中详细说明。
-
最后我想要一个包含 Chrm 9 的所有数据的 csv 文件,然后是另一个包含 Chrm 13 的所有数据的文件......等等。
标签: python pandas dataframe csv