【发布时间】:2021-03-30 01:12:34
【问题描述】:
虚拟df:
columns = ['number_of_words', 'occurrences']
data = [[1, 2312252],
[2,1000000],
[3,800000],
[4, 400000],
[5, 100000],
[6, 70000],
[7, 40000],
[8, 10000],
[9, 4000],
[10, 50]]
dummy_df = pd.DataFrame(columns=columns, data=data)
y 轴表示出现次数,x 轴表示来自 dummy_df 的单词列数。
x 轴应该是累积的,以便将值堆叠在一起。
示例:number_of_words = 1 我们有大约 230 万次出现。 number_of_words = 2 我们有大约 1m occurrences,因此它应该在 occurrences = 2 处绘制 2.3m + 1m。
在number_of_words 的最终条目处,直方图应达到总和(出现次数)。
我确实不想要规范化它。
【问题讨论】:
-
您想要 1 个小节,还是应该拆分以显示哪些部分对 cumsum 有贡献,就像您的插图中一样?
-
分成几部分
标签: pandas dataframe matplotlib