【发布时间】:2016-05-20 12:57:09
【问题描述】:
我有一个 csv 文件并有 v3 列,但该列有一些“nan”行。 我怎么能除了行。
dataset = pd.read_csv('mypath')
enc = LabelEncoder()
enc.fit(dataset['v3'])
print('fitting')
dataset['v3'] = enc.transform(dataset['v3'])
print('transforming')
print(dataset['v3'])
print('end')
编辑:V3 列有 A、C、B、A、C、D、、、A、S,就像那样,我想将其转换为 (1,2,3,1,2,4,, ,1,7)
【问题讨论】:
-
你能显示你的 csv 文件内容吗?
-
你想对这些行做什么?放下它们? (
dropna) 填写 NaN 值? (fillna) -
不,我想将此行归类为数字。该行有字符。
-
您可以添加数据样本吗?也许 5-6 行和所需的输出。或者更好Minimal, Complete, and Verifiable example.
-
你的意思是
pandas.factorize?
标签: python python-3.x pandas machine-learning scikit-learn