【发布时间】:2021-01-06 16:29:29
【问题描述】:
我正在尝试在 retweeting_id 列上合并下面的这 2 个数据框
retweeting_id retweeting_username retweeting_followers_count
207857 822215673812119553 WhiteHouse 26139914
id user_id retweet_count tweet prediction retweeting_id username
4682 1341442941642928129 64932923 191 RT @WhiteHouse: Over 80% of Americans say they... 2 8.222157e+17 Erika
4683 1341443049067479041 64932923 332 Hope—and help—are on the way!\n\n"The first sh... 2 8.222157e+17 Erika
5764 1339008184997064705 232598875 694 "Yesterday, the United States witnessed a medi... 1 8.222157e+17 Wm R Collie IV MD
10065 1338931792800325634 1105109168 297 "Yesterday, the United States witnessed a medi... 1 8.222157e+17 President-elect ???????????????????????????????????? ????????????????
但是当我使用时
df1 = pd.merge(test2, test1, on= 'retweeting_id')
我得到一个空的数据框。我认为第二个数据框中的科学记数法搞砸了,但我知道数字是一样的,因为我正在使用
test2 = df_merge2[(df_merge2['retweeting_id'] == 822215673812119553 )]
获取第二个数据帧。任何关于如何让这两者合并的想法,任何帮助将不胜感激。谢谢
【问题讨论】:
-
换句话说,你的问题主要是关于科学记数法以及如何转换它们
-
是的,但是当我将 retweeting_id 列转换为 int 时,由于某种原因它变为 -2147483648
标签: python pandas dataframe merge