【发布时间】:2020-01-24 07:07:47
【问题描述】:
我有一个包含以下数据的 .dat 文件:
0001100000101010100
110101000001111
101100011001110111
0111111010100
1010111111100011
需要计算每行中0和1的数量
我已经尝试过使用 Pandas。
- 第一步:读取数据文件
- 第 2 步:给定列名
- 步骤 3:尝试将值拆分为多列。但可以 不成功
df1=pd.read_csv('data.dat',header=None) df1.head()
0 1100000101010100
1 110101000001111
2 101100011001110111
3 111111010100
4 1010111111100011
df1.columns=['kirti']
df1.head()
Kirti
_______________________
0 1100000101010100
1 110101000001111
2 101100011001110111
3 111111010100
4 1010111111100011
我需要根据每行中的 0 和 1 将数据框拆分为多列。
最大列数将等于数据框中任何行中的最大零和一。
【问题讨论】:
-
你能提供你期望的输出吗
-
首先,您可能应该将文件作为字符串读取,否则您将在开头丢失“0”。对于字符串,有 count 方法。 mystr.count("0") 将给出 mystr 中“0”的个数。
-
COL1 | COL2 | COL3| .......|COLN ----------------------------------------- ---- ROW0 1 | 1 | 0 | ......| 0 ------------------------------------------------- ------- ROW1 1 | 1 | 0 | ......| 1
标签: pandas dataframe data-analysis data-processing