【发布时间】:2020-11-16 01:20:52
【问题描述】:
我需要编写一个函数来计算每天发布的推文数量。
功能规格:
- 它应该采用 pandas 数据框作为输入。 它应该返回一个按天分组的新数据框,其中包含当天的推文数量。
- 新数据框的索引应命名为日期,新数据框的列应为“推文”,分别对应推文的日期和数量。
- 日期的格式应为 yyyy-mm-dd,并且应为日期时间对象。
我的代码是:
def number_of_tweets_per_day(df):
df = pd.DataFrame(twitter_df['Date','Tweets'], columns =['Date', 'Tweets'])
df['Date'] = pd.to_datetime(df['Date'], format = '%Y%m%d')
df['Tweets'] = df['Tweets'].astype(str)
grouped = pd.df.groupby(['Date'],['Tweets'])
final = pd.df.count()
return final
但是,当我尝试运行命令“number_of_tweets_per_day(twitter_df.copy())”时,我收到一条错误消息,提示未定义 twitter_df。
DF:
预期输出:
附加到输入数据帧图像和预期输出图像的链接。
我做错了什么?
【问题讨论】:
-
应该
twitter_df是def中的参数吗?
标签: python pandas dataframe pandas-groupby data-science