【发布时间】:2016-04-11 22:50:06
【问题描述】:
pyLDAvis 库 prepare 方法在内部使用 pandas 库时崩溃。
代码如下:
def load_R_model(filename):
with open(filename, 'r') as j:
data_input = json.load(j)
data = {'topic_term_dists': data_input['phi'],
'doc_topic_dists': data_input['theta'],
'doc_lengths': data_input['doc.length'],
'vocab': data_input['vocab'],
'term_frequency': data_input['term.frequency']}
return data
movies_model_data = load_R_model('movie_reviews_input.json')
print('Topic-Term shape:%s' %str(np.array(movies_model_data['topic_term_dists']).shape))
print('Doc-Topic shape: %s' %str(np.array(movies_model_data['doc_topic_dists']).shape))
movies_vis_data = pyLDAvis.prepare(np.array(movies_model_data['topic_term_dists']),
np.array(movies_model_data['doc_topic_dists']),
np.array(movies_model_data['doc_lengths']),
np.array(movies_model_data['vocab']),
np.array(movies_model_data['term_frequency']))
错误:
... 第 283 行,准备中 topic_proportion=>(topic_freq/topic_freq.sum()).sort_values(ascending=False) ...
AttributeError: 'Series' 对象没有属性 'sort_values'
虽然我更新了最新版本,为什么 pandas 没有 sort_values 属性?
【问题讨论】:
-
你确定版本已经更新了吗?
pd.__version__显示什么? -
好点。我刚刚检查过它说 0.13.1。但是我做了
sudo pip install -U pandas -
你需要先解决这个问题,如果你有旧版本,你可以使用
.sort -
我应该使用 0.17.1 才能使用
prepare方法。但是我不能升级它,说包pandas成功升级,而版本仍然是0.13.1
标签: python visualization lda