【发布时间】:2021-07-10 03:42:09
【问题描述】:
我正在做一些休闲数据分析,在花了一天时间学习如何使用 VLOOKUP() 之后,我遇到了困难,我认为我无法通过谷歌搜索来弄清楚。我有一个包含一堆想法的数据集,与我想与之合作的人、与他们相关的一堆名字以及这些想法的主题相关联。我一直在做一些有趣的事情,比如每个主题有多少想法,一个人的想法有多少是关于给定主题的,以及一个主题的想法有多少来自给定的人。我还一直在计算整张表格的一些统计数据:总想法、每个人的平均想法、每个主题的平均想法、谁拥有最大的“学科垄断”,任何看起来有趣的东西。
我想知道谁拥有最多样化的主题,我想通过检查谁的“主题焦点”最低(一个人的想法中有多少是给定主题)来表明这一点。我知道如何使用 javascript 或 python 做到这一点:我想遍历所有“主题焦点”值,将它们按人划分,并丢弃除每人最高的值之外的所有值。然后我比较这些“最大主题焦点”中的每一个,并挑选出最低的,并显示相关的名称。
尽管在我的脑海中很清楚,但我不知道如何在 Google 表格中真正开始这样做。有什么建议吗?有没有人做过类似的操作?
编辑:所以我得到的最接近的方法是用公式=if(MAX(FILTER(G:G, A:A=A3)) = 0, "", MAX(FILTER(G:G, A:A=A3))) 填充一个新列,其中 G:G 是给定人的“主题焦点”,而 A:A 是人名(它从 A3 开始,因为第 1 行和第 2 行是标题)。然后,为了显示统计数据,我只有=CONCATENATE("Most diverse idea list: ", VLOOKUP(MIN(J3:J), {J3:J,A3:A}, 2, FALSE), " (", TEXT(ROUND(MIN(J3:J) * 100, 2), "#.00"), "% max focus)"),其中 J:J 是我添加的新列。它可以工作,但显然这非常混乱,如果有一种方法可以做到这一点,而无需为数据存储创建一个全新的列,那将是非常受欢迎的。
编辑 2:Here's 我正在使用的工作表的一般模型,因为我不想直接分享它。
【问题讨论】:
-
您好,请分享您的数据样本和所需结果。我通常明白这个想法,但我不确定一些细节
-
抱歉回复晚了!由于各种原因,我不想分享工作表本身,但我整理了这份副本docs.google.com/spreadsheets/d/…。实际的数据集稍微复杂一些,但不会以任何方式影响这个特定问题。
-
G 列公式:
=if(E19 = "","", E19/(COUNTIFS(A:A, A19) - COUNTIFS(A:A, A19, C:C, "")))为什么它的分母是-COUNTIFS(A:A, A19, C:C, "")?在这种情况下,E 不总是 0 吗?确实在 E 列中:=if(iserror(FIND(",", C19)), if(C19 = "","", COUNTIFS(C:C, C19, A:A, A19)), "")。如果是这样,则可以简化 G 列中的公式。 -
在原始表格中,有些想法与主题无关,因为 C 列也使用从一堆潜在主题中提取的公式自动填充。如果没有匹配项,该公式只会显示“”。
标签: google-sheets google-sheets-formula vlookup spreadsheet data-analysis