【问题标题】:How to plot a histogram of a pandas series of lists如何绘制熊猫系列列表的直方图
【发布时间】:2020-03-02 08:54:03
【问题描述】:

我正在尝试绘制一个直方图,显示电影数据中genre_ids 的频率。数据当前存储为 pandas 数据框列中的 id 列表,因为有些电影有多种类型,看起来像这样:

genre_ids
[35]                         
[18]                          
[35, 10749]                   
[18, 10749]                   
[35, 18, 10749] 

如何绘制直方图,使轴上的值只是单独的流派 id 而不是列表本身?我到处搜索这个问题,但无法弄清楚。到目前为止,我只是在使用:

movie_data['genre_ids'].hist()

movie_data 是数据帧。我希望直方图看起来像:

x
x   x  
x   x  x
35 18 10749 

代替:

x
x              x
x      x       x      x
[35] [18,35] [18] [18,10749]  

例如

【问题讨论】:

  • 我猜流派 ID 是字符串?
  • 我们需要更多关于如何区分流派 ID 和电影 ID 的信息。

标签: python pandas histogram


【解决方案1】:

在做直方图之前,你需要从列表中取出元素。

这应该可以完成工作:

form Pandas import Series
movie_data['genre_ids'].apply(Series).stack().hist()

【讨论】:

    猜你喜欢
    • 2020-10-10
    • 2019-04-02
    • 2018-07-05
    • 1970-01-01
    • 2016-09-27
    • 2017-09-24
    • 2013-11-25
    • 1970-01-01
    • 2016-12-08
    相关资源
    最近更新 更多