【问题标题】:How to plot frequency distribution using seaborn in python/pandas for a bipartite text based graph data如何在 python/pandas 中使用 seaborn 绘制基于二分文本的图形数据的频率分布
【发布时间】:2020-06-20 12:01:52
【问题描述】:

我有一个包含 70k 行的数据框,它看起来像这样:

mirna   gene_id
osa-miR2873a    Os01g0100100
osa-miR169d Os01g0100100
osa-miR169a Os01g0100100
osa-miR396a-3p  Os01g0100200
osa-miR396b-3p  Os01g0100200
...             ...

我正在使用 matplotlib 和 seaborn 来绘制数据。 & 我已经设法使用value_counts() pandas 函数计算频率。

我需要绘制一个图表来显示特定范围的“mirna”出现频率在数据集中出现了多少次。例如有多少 'mirna' 有 1-5 对 mirna-gene_id 对,或 5-15 对,或 15-30 对等等...

所以基本上该图应该显示 (1-5) 对出现 x 次,(5-15) 对出现 y 次等。如果我可以按排序顺序绘制值,那就更好了。我试过 sns.distplot() 但它不适合我。

有什么线索吗?谢谢。

【问题讨论】:

    标签: python python-3.x pandas matplotlib seaborn


    【解决方案1】:

    您可以按 mirna 分组并按gene_id 计数进行汇总。然后你可以做一个直方图。

    【讨论】:

      猜你喜欢
      • 2016-06-06
      • 2015-10-13
      • 2011-08-20
      • 1970-01-01
      • 2017-12-23
      • 1970-01-01
      • 2014-07-08
      • 2016-06-12
      • 2019-12-22
      相关资源
      最近更新 更多