【发布时间】:2017-10-26 15:38:32
【问题描述】:
我正在使用 jupyter 笔记本。我有大量数据,我必须首先加载然后使用。我不想每次关闭并启动笔记本电脑或笔记本电脑时都必须重新加载它。我想知道当我每次保存并检查笔记本时,它会保存已加载的数据和我所做的所有工作吗?因此,如果我关闭笔记本并稍后重新打开它,我可以从我离开的地方开始工作吗?还是我需要用泡菜之类的东西?如果可以,请提供一个示例,说明我如何使用 pickle 或类似的东西来保存我的数据并工作并重新加载它?
在 r 中,我将只保存一个 rdata 文件并稍后加载该文件。我对python有点陌生。
更新:
code:
print(df_business[1:3])
Sample Data:
address attributes \
1 2824 Milton Rd {u'GoodForMeal': {u'dessert': False, u'latenig...
2 337 Danforth Avenue {u'BusinessParking': {u'garage': False, u'stre...
business_id categories \
1 mLwM-h2YhXl2NCgdS84_Bw [Food, Soul Food, Convenience Stores, Restaura...
2 v2WhjAB3PIBA8J8VxG3wEg [Food, Coffee & Tea]
city hours is_open \
1 Charlotte {u'Monday': u'10:00-22:00', u'Tuesday': u'10:0... 0
2 Toronto {u'Monday': u'10:00-19:00', u'Tuesday': u'10:0... 0
latitude longitude name neighborhood \
1 35.236870 -80.741976 South Florida Style Chicken & Ribs Eastland
2 43.677126 -79.353285 The Tea Emporium Riverdale
postal_code review_count stars state
1 28215 4 4.5 NC
2 M4K 1N7 7 4.5 ON
更新2:
代码:
import pickle
your_data = df_business
# Store data (serialize)
with open('filename.pickle', 'wb') as handle:
pickle.dump(your_data, handle, protocol=pickle.HIGHEST_PROTOCOL)
# Load data (deserialize)
with open('filename.pickle', 'rb') as handle:
unserialized_data = pickle.load(handle)
【问题讨论】:
标签: python jupyter-notebook pickle