【发布时间】:2021-11-15 15:14:52
【问题描述】:
我试图从Pycharm 和Jupyter Notebook 运行以下代码。在 Jupyter 中,Pycharm 没有发生错误。有人可以帮忙解决这个问题吗?
下面是 news_collection.csv 的数据集可视化
created_at,文本
2021 年 5 月 13 日下午 3:27:55,“斯里兰卡队已为 2021 年世界杯做好充分准备”
2021 年 5 月 13 日下午 3:27:55,“他们肯定会想念 Lasith Malinga”
下面是给出上述错误的代码
import pandas as pd
def aggregated():
tweets = pd.read_csv(r'news_collection.csv')
df = pd.DataFrame(tweets, columns=['created_at', 'text'])
df['created_at'] = pd.to_datetime(df['created_at'])
df['text'] = df['text'].apply(lambda x: str(x))
pd.set_option('display.max_colwidth', 0)
df = df.groupby(pd.Grouper(key='created_at', freq='1D')).agg(lambda x: '
'.join(set(x)))
return df
if __name__ == '__main__':
print(aggregated())
aggregated().to_csv(r'preprocessed_tweets_aggregated.csv',index = True,
header=True)
【问题讨论】:
-
两者都有相同的
pd.__version__? -
@LemonPy 是的,版本是一样的。是什么让它抛出这个特定的错误?
-
可能是您没有在同一个
news_collection.csv文件上运行? -
不,是同一个文件
-
你在哪一行得到错误?
标签: python pandas dataframe jupyter-notebook pycharm