【发布时间】:2020-01-11 06:42:17
【问题描述】:
我正在为回归准备数据,但我做不到。我必须将 2 行喜欢和流行度转换为整数。我该怎么做。
Unique_ID int64
Genre int64
Views int64
Comments int64
Likes object
Popularity object
Followers int64
dtype: object
1.我这样做了:
df['Popularity']=df.Popularity.str.replace(',','').astype(int)
错误来了
以 10 为基数的 int() 的无效文字:'13.1K'
- 然后我尝试了这个:
pd.to_numeric(df['Likes'], downcast='integer')
错误又来了
无法解析位置 3 处的字符串“2,400”
- 还有这个
df = df.astype(int)
以 10 为底的 int() 的无效文字:'2,400'
我可以做些什么来对我的数据进行回归
【问题讨论】:
-
df[column] = df[column].astype(int) -
欢迎来到 StackOverflow。请花时间阅读how to provide a great pandas example 上的这篇文章以及如何提供minimal, complete, and verifiable example 并相应地修改您的问题。 how to ask a good question 上的这些提示也可能有用。
-
您能否发布一个您尝试转换的数据列示例?
-
你可以在这里查看数据machinehack.com/course/…我正在处理训练集。
-
@subhashi - 我想在我的数据中保留 K 和 M 的信息,我不想删除它们。我想制作一个函数,它会自动将 K 和 M 分别转换为 1000 和 1000000 的位置。