【发布时间】:2021-08-20 23:12:36
【问题描述】:
我有一个 excel 文件,并从它的列中创建了列表。问题是列的行不相等。因此,我在列表末尾有多个“nan”值。我尝试使用 dropna() 方法删除它们,但仍然存在“nan”值。这是我的代码:
import pandas as pd
excel_name = r'file_name.xlsx'
df = pd.read_excel(excel_name, engine='openpyxl')
df.dropna()
clomun_1 = list(df['clomun1'])
clomun_2 = list(df['clomun2'])
clomun_3 = list(df['clomun3'])
print(clomun_1)
print(clomun_2)
print(clomun_3)
输出:
clomun_1 = ['value1', 'value2', 'value3', 'value4', 'nan', 'nan', 'nan', 'nan']
clomun_2 = ['value1', 'value2', 'value3', 'value4', 'value5', 'value6', 'nan', 'nan']
clomun_3 = ['value1', 'value2', 'nan', 'nan', 'nan', 'nan', 'nan', 'nan']
我只想保留价值观。我必须删除“nan”元素。
【问题讨论】:
-
这里已经回答了这个问题:Remove Nan
-
我认为您正在从电子表格中读取文字“nan”字符串。数字 nan 周围不会有引号。这可能就是 dropna 没有丢弃它们的原因。
-
我想是的。但是,如果 dropna 不工作,那该怎么办?
标签: python pandas list dataframe nan