【发布时间】:2018-02-02 20:15:30
【问题描述】:
我正在尝试从http://grouplens.org/datasets/movielens/20m/ 读取名为 rating.csv 的 .csv 文件,该文件在我的计算机中为 533.4MB。
这就是我在 jupyter notebook 上写的内容
import pandas as pd
ratings = pd.read_cv('./movielens/ratings.csv', sep=',')
这里的问题是内核会中断或死亡并要求我重新启动并且它不断重复相同。没有任何错误。请您提出解决此问题的任何替代方法,就好像我的计算机无法运行它一样。
这可行,但它会不断重写
chunksize = 20000
for ratings in pd.read_csv('./movielens/ratings.csv', chunksize=chunksize):
ratings.append(ratings)
ratings.head()
只写入最后一个块,其他块被注销
【问题讨论】:
标签: python pandas csv dataframe jupyter-notebook