【发布时间】:2021-10-13 22:00:13
【问题描述】:
这里是表格的链接。
编写 Python 代码,从网站上抓取第一个表,将其转换为 pandas 数据框。作为第 1 部分的输出,创建一个名为 dams 的子集,其中包含根据水力发电能力排名前 3 位的大坝的所有数据。
这是我的代码。
import pandas as pd
url = "dams.html"
table = pd.read_html (url,header=0)[0]
table
dams = table.groupby('Name').sum()
dams = dams.sort_values('Installed capacity [MW]',ascending = False)[:3]
dams
#我要显示原始表格的所有列。
这是我的问题: DataFrame 形状不匹配 [左]: (3, 4) [右]: (3, 9)
感谢您的帮助
【问题讨论】:
-
** 这是你的意思吗?** dams = table.groupby('Name').sum() dams = dams.sort_values('装机容量[MW]',ascending = False)[ :3] pd.options.display.max_columns = 无 pd.options.display.max_rows = 无 dams.head()
-
是的。它不起作用?
-
对不起,我是新手,看不懂。你能详细解释一下吗?
-
不工作。还显示“形状不匹配”。
标签: python pandas dataframe sorting pandas-groupby